• Email : contact@refbax.com

Récupérer les résultats et positions de la SERP avec Python

📢 Image qui illustre un article sur le : code, page, recherche, vers page, page résultats, driver.get(f"http://www.google.com/search?q={requete_google}"), BeautifulSoup(driver.page_source,, "html.parser"), soup.find_all("div",, result.find("h3").text, result.find("a")["href"], result.find("span",, results.index(result), driver.quit()
Facebook
Twitter
LinkedIn
Temps de lecture : 2 minutes

Voici un texte d’introduction qui présente le code Python que j’ai fourni pour extraire les éléments de la SERP (résultats de recherche, titres, liens, descriptions et positions) d’un moteur de recherche comme Google :

Selenium et Beautiful Soup sont deux bibliothèques Python populaires qui permettent de naviguer et d’analyser le code HTML d’un site web. Dans cet article, nous allons voir comment utiliser ces bibliothèques pour extraire les éléments de la SERP (Search Engine Results Page) d’un moteur de recherche comme Google.

La SERP est la page de résultats de recherche qui s’affiche lorsque vous effectuez une recherche sur un moteur de recherche. Elle contient une liste de résultats de recherche, chacun comprenant un titre, un lien vers la page web, une description et une position dans la liste des résultats.

En utilisant Selenium et Beautiful Soup, nous pouvons naviguer vers la page de résultats de recherche de Google, analyser le code HTML de la page et extraire ces éléments pour chaque résultat de la SERP. Nous verrons comment faire cela en détail dans la suite de cet article en examinant le code Python que j’ai fourni.

Exemple de code Python

Voici un exemple de code Python qui utilise Selenium et la bibliothèque Beautiful Soup pour extraire les éléments de la SERP (résultats de recherche, titres, liens, descriptions et positions) d’un moteur de recherche comme Google :

from selenium import webdriver
from bs4 import BeautifulSoup

# Créer un nouvel objet de navigateur
driver = webdriver.Firefox()

# Naviguer vers la page de résultats de recherche de Google
requete_google = "chaussure randonnée"
driver.get(f"http://www.google.com/search?q={requete_google}")

# Analyser le code HTML de la page avec Beautiful Soup
soup = BeautifulSoup(driver.page_source, "html.parser")

# Extraire les éléments de la SERP
results = soup.find_all("div", class_="g")
for result in results:
    # Extraire le titre
    title = result.find("h3").text
    # Extraire le lien
    link = result.find("a")["href"]
    # Extraire la description
    description = result.find("span", class_="st").text
    # Extraire la position (numéro du résultat)
    position = results.index(result) + 1

    print(f"Position: {position}")
    print(f"Title: {title}")
    print(f"Link: {link}")
    print(f"Description: {description}")

# Fermer le navigateur
driver.quit()

Ce code ouvre un navigateur Firefox, navigue vers la page de résultats de recherche de Google pour la requête "your search query", analyse le code HTML de la page avec Beautiful Soup et extrait les éléments de la SERP. Chaque résultat est imprimé avec sa position, son titre, son lien et sa description. Ensuite, le navigateur est fermé.

Il est important de noter que vous devrez remplacer "your search query" par votre propre requête de recherche. Vous pouvez également utiliser un autre navigateur que Firefox en utilisant une autre classe de webdriver, comme Chrome ou Safari.

Laisser un commentaire

Sur le même thème 🤩

Comment utiliser Mistral 7B avec python ?

Comment utiliser Mistral 7B avec python ?

Publié le 18 janvier 2024

Le monde du développement web et du SEO a récemment été marqué par une avancée majeure : l’arrivée de Mistral...

Lire la suite
Reverse domain IP checker avec Python

Reverse domain IP checker avec Python

Publié le 29 décembre 2022

Temps de lecture : < 1 minute Le « reverse IP checker » est un outil qui permet de trouver les domaines associés à...

Lire la suite
Comment générer un QR Code avec Python ?

Comment générer un QR Code avec Python ?

Publié le 29 décembre 2022

Temps de lecture : < 1 minute Pour générer un QR Code (Quick Response Code) avec Python pour une URL, vous pouvez...

Lire la suite
Comment lire un QR Code avec Python ?

Comment lire un QR Code avec Python ?

Publié le 29 décembre 2022

Temps de lecture : < 1 minute Pour lire un QR Code avec Python et rediriger vers l’URL qu’il contient, vous pouvez...

Lire la suite
Envoyer un mail « Mailchimp » avec python

Envoyer un mail « Mailchimp » avec python

Publié le 29 décembre 2022

Il existe plusieurs façons d’envoyer un email avec Python, en utilisant différentes bibliothèques ou API. Pour envoyer un email via...

Lire la suite
Comment determiner la Classe d’une IP avec Python ?

Comment determiner la Classe d’une IP avec Python ?

Publié le 29 décembre 2022

Il existe plusieurs manières de déterminer la classe d’une adresse IP en Python. Voici deux options possibles : Utiliser une...

Lire la suite
Calculer TF-IDF avec Python

Calculer TF-IDF avec Python

Publié le 29 décembre 2022

Le TF-IDF (Term Frequency – Inverse Document Frequency) est un score de fréquence de terme utilisé pour évaluer l’importance d’un...

Lire la suite
Crawler avec Python comme ScreamingFrog

Crawler avec Python comme ScreamingFrog

Publié le 29 décembre 2022

Screaming Frog est un outil de crawl de site web qui permet de collecter des données sur les pages d’un...

Lire la suite
Calculer le ROI avec python

Calculer le ROI avec python

Publié le 29 décembre 2022

Temps de lecture : < 1 minute Le ROI (Return On Investment, ou retour sur investissement) est un indicateur de performance crucial...

Lire la suite
Qui suis-je ! 👨‍💻
Parfois on cherche par catégorie 📌

Enfilez-votre cape

Apprenez le webmarketing et le code grâce à nos différentes ressources et améliorez la visibilité de votre site internet, grâce à nos outils SEO.

refbax superhero bas