Pout télécharger les images, il y a sur le marché pas mal d’outils accessibles comme Tab Save, Bulk Download Images (ZIG), Image Downloader, Fatkun Batch Download Image, ImageAssistant Batch Image Downloader. Les utilisaturs peuvent entrer une liste d’URLs pour télécharger les images. Donc, ce qui reste à faire est d’obtenir les urls des images.
Mais comment avoir l’URL des images ? Quand il est assez facile d’obtenir URL d’une image ou de plusieurs images à travers copier-coller, que faire si vous devez rassembler les URLs des centaines et des milliers d’image sur un site Web ? Je ne crois pas qu’on veut encore faire le copier-coller. Dans ce cas-là, un scraper d’URL est nécessaire. Cet article cherche à vous montrer comment créer un scraper d’URL en quelques minutes sans coder.
Web scraping pour trouver et extraire les URLs des images
Le web scraping est surtout adapté pour extraire des données à grande échelle. Pour faciliter le web scraping et le rendre accessible à tous, on se dépêche de développer des outils de web scraping non-codage, dont les plus populaires sont Octoparse, Webscraper, Parsehub, Apify, etc. Ces outils simulent les gestes humaines de parcourir les pages Web et donc peuvent faire le copier-coller et extraire les urls ou d’autres éléments automatiquement.
A part les URLs d’images, le web scraping est largement utilisé dans l’extraction d’autres éléments affichés sur la page web ou dans le HTML.
Extraire les URLs des images avec Octoparse
Octoparse est un outil de non-codage accessible à tous, y compris ceux qui ne savent grand chose en matière du scraping. Bien que simple et facile, Octoparse est également très puissant, parfait pour les entreprises de toutes tailles et les particuliers de tous horizons. Tout le monde peut l’utiliser pour créer un scraper en quelques minutes.
Des préparations
Télécharger et installer Octoparse sur votre ordinateur. Il est préférable que vous lisiez des tutoriels et l’introduction de l’outil avant de commencer à utiliser un nouveau outil.
Cliquer sur l’image pour extraire directement l’URL (tutoriel détaillé)
Ici, voyons comment récupérer les URLs des images d’ordinateurs portables sur cdiscount.
1) Lancer la recherche de “ordinateur portable” dans cdiscount.com et vous obtiendrez l’url
https://www.cdiscount.com/search/10/ordinateur+portable.html#_his_
2) copier l’url et le coller dans la barre de recherche sous le mode avancé d’Octoparse avant de cliquer sur “Save”. Après ces étapes, Octoparse ouvre cette page Web dans son navigateur intégré.
3) de façon générale, on a l’intention de scraper les urls des images sur plusieurs pages. Est-il difficile d’extraire les urls sur autant de pages possibles ? Pas du tout, c’est assez simple avec Octoparse. Il suffit de cliquer sur “Page suivante” et de sélectionner “Loop click single URL” dans le panneau de Tips pour que Octoparse parcourt les pages une après l’autre.
4) cliquer deux images sur la page Web pour que Octoparse puisse reconnaître le champ d’IMG. Ensuite, il suffit de suivre les conseils pour cliquer sur “Extract URLs of the selected images”
5) après les quatres étapes, nous avons réussi à créer un scraper d’URL des images dans Octoparse. Ce qui reste à faire est d’extraire les URLs. Cliquer sur “Run” – “Local extraction” et Octopare va récupérer les urls des images pour vous.
Le GIF suivant couvre toutes les étapes mentionnées pour récupérer les URLs des images.
Cette méthode de créer un scraper d’URLs d’images vous semble-t-elle facile ? Allez télécharger Octoparse et suivre nos étapes pour scraper les urls des images vous-mêmes. Si vous rencontrez des problèmes, n’hésitez pas à contacter le support.
Après avoir obtenu une liste longue d’URLs, vous pouvez les mettre dans un téléchargeur d’images pour les télécharger.
Un Surpris
Octoparse 8.5.4, nouvellement lancé, est capable de télécharger les fichers lors de l’extraction de données, et donc, les images y sont incluses. Il faut cliquer sur “Extract image URLs and download linked files” sur le panneau Tips pour que Octoparse télécharge les images dans votre ordinateur local. C’est totalement gratuit et très facile à utiliser et cet outil libère les gens de faire des copier-coller répétitfs et ennuyants.