logo
languageFRdown
menu

WooCommerce Scraper : Récupérer les données produits d’un site WooCommerce/WordPress

5 minutes de lecture

Vous l’avez remarqué que les commerçants tendent à commencer à créer leurs propres sites et à y vendre leurs produits, en plus des plateformes publiques populaires en ligne telles qu’Amazon et Shopee ? Certaines de ces sites ont des expériences d’achat étonnantes et de beaux designs. L’un des outils fréquemment utilisés à les construire est WooCommerce.

Si vous n’avez jamais entendu parler de WooCommerce, cet article vous donnera un aperçu rapide de ce logiciel. Ensuite, nous vous présenterons le processus d’extraction de données produits à partir des sites construits avec WooCommerce.

Qu’est-ce que WooCommerce ?

WooCommerce est une solution de commerce open-source construite sur WordPress qui est une des plateformes de contenu les plus avancées pour le référencement. WooCommerce a commencé avec un nom initial comme WooThemes en 2008 et a décidé de se concentrer exclusivement sur le commerce électronique en 2017. Jusque aujourd’hui, WooCommerce a aidé 3,4 millions de petites et moyennes entreprises à construire les boutiques en ligne qu’elles souhaitent.

Qu’est-ce qu’un WooCommerce Scraper ?

En bref, un WooCommerce Scraper désigne à un certain outil qui permet de récupérer des données sur des sites web qui sont construits sur WooCommerce. De la même manière que les scrapers pour d’autres plateformes d’achat en ligne, vous pouvez utiliser un WooCommerce Scraper pour récupérer presque toutes les données, y compris le nom du produit, l’URL du produit, la description, le prix, le stock, les détails, etc, à partir de magasins en ligne.

Cependant, il existe toujours quelques différences entre les plateformes d’e-commerce populaires et les sites WooCommerce. Par exemple, les plateformes comme Amazon ont plus d’avis et de commentaires de clients que les boutiques WooCommerce puisque le premier ciblent un audience plus grand et étendu. Mais les informations affichées sur les sites WooCommerce sont beaucoup plus structurées, ce qui vous permet d’obtenir des données plus précises sur les produits et de gagner du temps sur le nettoyage des données récupérées.

Est-il légal d’extraire des sites basés sur WooCommerce ?

Le web scraping n’est interdit par aucune loi ou règle. Il est légal d’extraire des données accessibles au public en vertu de la doctrine de l’utilisation équitable. Cependant, certaines plateformes peuvent avoir des règles plus strictes en la matière. Avant de commencer à extraire des données, il est nécessaire de vérifier les conditions d’utilisation des sites web sur lesquels vous avez l’intention de collecter des données afin d’éviter des désagréments inattendus.

Comment récupérer les données d’un site WooCommerce ?

Aujourd’hui, le web scraping n’est plus réservé aux experts en codage. Grâce aux outils de web scraping nocode, tout le monde peut extraire des données de pages Web.

Octoparse, ayant comme objectif de rendre le web scraping accessible à tous, est depuis toujours renommé d’être facile à utiliser mais également, puissant dans l’extraction de données.

Suivez les étapes ci-dessous, vous pouvez également construire un scraper WooCommerce vous-même en seulement quatre étapes avec Octoparse.

Octoparse est un outil de scraping web facile à utiliser pour tout le monde, quelles que soient les compétences en codage. Si vous ne l’avez jamais utilisé, veuillez le télécharger et l’installer sur votre appareil. La version gratuite est accessible à tous et permet déjà à accéder aux puissantes fonctionnalités d’Octoparse.

Dans notre cas, nous allons prendre l’exemple d’une boutique en ligne pour montrer comment récupérer les données de ce site basé sur WooCommerce. Voici l’URL cible.

URL cible : https://porterandyork.com/product-category/buy-beef-online/

Étape 1 : Créer une nouvelle tâche avec l’URL

Copiez l’URL cible ci-dessus, puis collez-la dans la barre de recherche d’Octopaese. Cliquez sur Démarrer pour créer une nouvelle tâche. Le navigateur intégré d’Octoparse va charger la page cible. Veuillez attendre que la page finisse de se charger sur ce navigateur avant de continuer.

Etape 2 : Lancer l’auto-détection de pages Web

Une fois que la page a fini de se charger, cliquez sur “Autodétecttion des données de la page web” dans le panneau Astuces. Octoparse analysera alors la page entière et fournira quelques champs de données extractibles qu’il ” devine ” que vous recherchez. Octoparse met en évidence tous ces champs sur la page, ce qui vous permet de vérifier facilement s’il a fait une supposition correcte. Entre-temps, vous pouvez prévisualiser ces champs de données détectés dans le panneau de prévisualisation des données en bas de la page. Dans ce panneau, vous pouvez également renommer les champs ou supprimer les champs indésirables.

Étape 3 : Créer et modifier le flux de travail

Après avoir vérifié tous les détails, cliquez sur “Créer un flux de travail”. Un flux de travail s’affiche alors sur le côté droit. Il s’agit d’un diagramme qui présente le fonctionnement de ce scraper. Vous pouvez lire le flux de travail de haut en bas, de l’intérieur vers l’extérieur s’il y a des actions imbriquées. Pour vérifier si le scraper fonctionne comme prévu, cliquez sur chaque étape du diagramme, et vous pourrez alors avoir un aperçu de son fonctionnement.

Étape 4 : Lancer le scraper et exporter les données scrappées

Lancez le scraper en cliquant sur “Exécuter” après avoir vérifié l’ensemble du flux de travail. Vous pouvez ensuite exécuter la tâche sur votre appareil local ou sur les serveurs cloud d’Octoparse. Ces deux choix ont des applications différentes. Le mode local est plus adapté pour les petits projets, tandis que les serveurs cloud sont plus efficaces pour traiter les grandes tâches. Choisissez celui que vous préférez, Octoparse s’occupera du reste.

Lorsque le processus de scraping est terminé, vous pouvez exporter les données dans un fichier Excel, CSV ou JSON, ou dans une base de données comme Google Sheets pour une utilisation ultérieure.

3 plugins de scraper WooCommerce recommandés

Voici trois plugins de scraper que vous pouvez appliquer pour extraire des boutiques en ligne basées sur WooCommerce.

Web Scraper

Web Scraper est une extension de navigateur Chrome qui permet aux utilisateurs d’extraire des données de sites Web, y compris des sites de commerce électronique basés sur WooCommerce. Son interface conviviale facilite la sélection et l’extraction des données dont vous avez besoin. Par rapport au téléchargement et à l’installation d’un logiciel sur votre appareil, une extension de navigateur est plus légère et plus pratique, mais elle peut avoir des fonctionnalités moins avancées. Cette extension est disponible en version gratuite et payante.

Data Miner

Data Miner est également une extension de navigateur. Les utilisateurs peuvent facilement sélectionner divers champs de données sur les sites basés sur WooCommerce, y compris les titres de produits, les descriptions, les prix et les images. Comme pour Web Scraper, il existe une version gratuite et une version payante. La version gratuite permet aux utilisateurs d’extraire jusqu’à 5 000 lignes de données par mois, tandis que la version payante n’a pas de limites et inclut l’accès à l’équipe d’assistance.

WP Scraper

Comme mentionné précédemment, WooCommerce est construit sur WordPress. WP Scraper, en tant que plugin WordPress, est conçu pour extraire des données des articles et des pages WordPress. C’est un excellent choix pour scraper les sites basés sur WooCommerce également. Cet outil possède une interface de type pointer-cliquer qui permet aux utilisateurs de sélectionner et d’extraire les données souhaitées en quelques clics. WP Scraper est un outil payant, cependant, et son coût est déterminé par le nombre de sites web que vous souhaitez scraper.

En conclusion

Il y a de plus en plus de boutiques en ligne basées sur WooCommerce sur le marché. Ce sont des sources précieuses pour observer le marché et surveiller les concurrents. Outre les sites basés sur WooCommerce, vous pouvez également suivre les étapes de cet article pour extraire des données d’autres sites Web similaires afin de développer une vision globale du marché qui contribuera à votre activité.

Obtenir les données en quelques clics
Extraire facilement les données depuis tous les sites sans coder
Télécharger

Articles populaires

Explorer les sujets

Commencer votre découverte de Octoparse dès maintenant

Télécharger

Lecture conseillée