Accueil > Cours en ligne développement informatique > Récupérer les résultats et positions de la SERP avec Python (scraping)

Récupérer les résultats et positions de la SERP avec Python (scraping)

Publié le 29/12/2022
Modifié le : 15/04/2024
Aucun commentaire
Python, seo
Cours en ligne développement informatique
Alban

Temps de lecture : 2 minutes

Voici un texte d’introduction qui présente le code Python que j’ai fourni pour extraire les éléments de la SERP (résultats de recherche, titres, liens, descriptions et positions) d’un moteur de recherche comme Google :

Selenium et Beautiful Soup sont deux bibliothèques Python populaires qui permettent de naviguer et d’analyser le code HTML d’un site web. Dans cet article, nous allons voir comment utiliser ces bibliothèques pour extraire les éléments de la SERP (Search Engine Results Page) d’un moteur de recherche comme Google.

La SERP est la page de résultats de recherche qui s’affiche lorsque vous effectuez une recherche sur un moteur de recherche. Elle contient une liste de résultats de recherche, chacun comprenant un titre, un lien vers la page web, une description et une position dans la liste des résultats.

En utilisant Selenium et Beautiful Soup, nous pouvons naviguer vers la page de résultats de recherche de Google, analyser le code HTML de la page et extraire ces éléments pour chaque résultat de la SERP. Nous verrons comment faire cela en détail dans la suite de cet article en examinant le code Python que j’ai fourni.

Exemple de code Python

Voici un exemple de code Python qui utilise Selenium et la bibliothèque Beautiful Soup pour extraire les éléments de la SERP (résultats de recherche, titres, liens, descriptions et positions) d’un moteur de recherche comme Google :

from selenium import webdriver
from bs4 import BeautifulSoup

# Créer un nouvel objet de navigateur
driver = webdriver.Firefox()

# Naviguer vers la page de résultats de recherche de Google
requete_google = "chaussure randonnée"
driver.get(f"http://www.google.com/search?q={requete_google}")

# Analyser le code HTML de la page avec Beautiful Soup
soup = BeautifulSoup(driver.page_source, "html.parser")

# Extraire les éléments de la SERP
results = soup.find_all("div", class_="g")
for result in results:
    # Extraire le titre
    title = result.find("h3").text
    # Extraire le lien
    link = result.find("a")["href"]
    # Extraire la description
    description = result.find("span", class_="st").text
    # Extraire la position (numéro du résultat)
    position = results.index(result) + 1

    print(f"Position: {position}")
    print(f"Title: {title}")
    print(f"Link: {link}")
    print(f"Description: {description}")

# Fermer le navigateur
driver.quit()

Ce code ouvre un navigateur Firefox, navigue vers la page de résultats de recherche de Google pour la requête « your search query », analyse le code HTML de la page avec Beautiful Soup et extrait les éléments de la SERP. Chaque résultat est imprimé avec sa position, son titre, son lien et sa description. Ensuite, le navigateur est fermé.

Il est important de noter que vous devrez remplacer « your search query » par votre propre requête de recherche. Vous pouvez également utiliser un autre navigateur que Firefox en utilisant une autre classe de webdriver, comme Chrome ou Safari.

Tu veux en savoir plus sur "Google, Firefox, SERP" ? 😎

Comment installer Python sur Windows ?

La première étape de l'apprentissage d'un langage de programmation n'est pas toujours de faire son Hello World souvent il est nécessaire de passer par la…

Alban

Webmarketing et Développement vont pour moi de paire. J'ai eu la chance de pouvoir pratiquer les deux en entreprise depuis presque 15 ans, en agence d'abord ensuite chez l'annonceur. Je suis passionné par le NLP, j'ai développé de nombreux outils que je mets aujourd'hui à disposition sur Refbax. J'imagine aussi Refbax comme un lieu de partage de connaissance (Python, PHP, Webmarketing), de veille, mais aussi des outils mis à la disposition des SEO et des rédacteurs. J'espère que vous trouverez un peu de cela en parcourant le site. Retrouvez mes publications sur medium.com

Récupérer les résultats et positions de la SERP avec Python (scraping)

Exemple de code Python

Alban

Laisser un commentaire Annuler la réponse

Sur le même thème 🤩

Serpstat : Le test du logiciel SEO, Growth Hacking, Webmarketing

SERP

Google : Travaille à l’améliorations de la qualité de la SERP

Google a enfin résolu le problème des noms de sites dans les SERPs après 5 mois

Analyse de la SERP

SEO : Les 3 Facteurs Clés pour Dominer les SERPs en 2024 face aux Spams

Cocon sémantique

12 règles SEO à respecter pour écrire un article optimisé

Notre Guide SEO pour débutant en 2024

Enfilez-votre cape

Apprenez le webmarketing et le code grâce à nos différentes ressources et améliorez la visibilité de votre site internet, grâce à nos outils SEO.