Comment l'utiliser
- Étape 1 : Cliquer sur Essayez-le !
- Étape 2 : Saisir les URL de départ - la liste des URL des pages Web avec lequelles le scraper va commencer.
- Étape 3 : Définir la profondeur maximale de lien - la profondeur à laquelle ce scraper descendra à partir des pages web spécifiées dans les URL de départ. Si elle est égale à zéro, le scraper explorera exclusivement les URL de départ sans aller aux sous-pages.
- Étape 4 : Définir le nombre maximal de pages - une limite au nombre total de pages web à explorer.
- Étape 5 : Définir s'il faut ou non rester dans le domaine - si c'est le cas, le scraper ne suivra que les liens situés dans le même domaine que la page de référence. Par exemple, lorsque le scraper trouve https://www.domain-b.com/some-page sur https://domain-a.com/some-page, il n'explorera pas la page parce qu'elle se trouve sur un domaine différent.
- Étape 6 : Cliquer sur Exécuter et puis sélectionner le mode d'exécution préféré
Aperçu de données
Start_URL | Domain | Depth | Referrer_URL | Current_URL | Emails | Phones | Uncertain_Phones | Twitter | YouTube | Facebook | LinkedIn | Instagram | Tiktok |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
http://www.islashop.com/ | www.islashop.com | 0 | http://www.islashop.com/ | http://www.islashop.com/ | license@prestashop.com;tech@202-ecommerce.com;librairie.tabari@yahoo.fr | https://twitter.com/islamshop;http://www.twitter.com/prestashop | https://www.youtube.com/channel/UCtXzLS5tBcIRK8M0mDyCkQQ | https://www.facebook.com/Islam-Shop-Librairie-Tabari-906740209374285/;http://www.facebook.com/prestashop | https://www.instagram.com/islashop92/;https://www.instagram.com/prestashop | https://www.tiktok.com/tag/islashop | |||
https://www.nabilshop.fr/ | www.nabilshop.fr | 1 | https://www.nabilshop.fr/ | https://www.nabilshop.fr/categorie-produit/coran/ | postmaster@nabil-shop.fr | https://www.facebook.com/nabilshop75 | https://www.instagram.com/nabilshop75/?hl=fr | ||||||
http://alkutub.fr/ | alkutub.fr | 0 | http://alkutub.fr/ | http://alkutub.fr/ | image_f0abc4e3-6e35-4c4f-9912-7e5e260d572a_1024x1024@2x.heic;image_78abedff-a424-4d46-83c5-bd9874300b7c_1024x1024@2x.heic;alkutub.pro@gmail.com;votre-e-mail@exemple.com | https://alkutub.fr//twitter.com/share?text=&url=;https://alkutub.fr//twitter.com/share?text=&url=;https://alkutub.fr//twitter.com/share?text=&url= | https://alkutub.fr//www.facebook.com/sharer.php?u= | ||||||
http://www.islashop.com/ | www.islashop.com | 1 | http://www.islashop.com/ | https://www.islashop.com/index.php?id_category=79&controller=category | license@prestashop.com;tech@202-ecommerce.com;librairie.tabari@yahoo.fr | https://twitter.com/islamshop;http://www.twitter.com/prestashop | https://www.youtube.com/channel/UCtXzLS5tBcIRK8M0mDyCkQQ | https://www.facebook.com/Islam-Shop-Librairie-Tabari-906740209374285/;http://www.facebook.com/prestashop | https://www.instagram.com/islashop92/;https://www.instagram.com/prestashop | https://www.tiktok.com/tag/islashop | |||
https://al-azhar.fr/ | al-azhar.fr | 1 | https://al-azhar.fr/ | https://al-azhar.fr/accueil/3735-le-guide-du-mariage-heureux.html | example@domain.com;chama.alazhar@gmail.com | https://twitter.com/intent/tweet?text=Le+Guide+du+Mariage+Heureux%20https%3A%2F%2Fal-azhar.fr%2Faccueil%2F3735-le-guide-du-mariage-heureux.html;https://twitter.com/intent/tweet?text=Le+Guide+du+Mariage+Heureux%20https%3A%2F%2Fal-azhar.fr%2Faccueil%2F3735-le-guide-du-mariage-heureux.html | https://www.facebook.com/sharer.php?u=https%3A%2F%2Fal-azhar.fr%2Faccueil%2F3735-le-guide-du-mariage-heureux.html | ||||||
http://www.maisondennour.com/ | www.maisondennour.com | 1 | http://www.maisondennour.com/ | https://www.maisondennour.com/categorie/boutique/coran/coran-en-arabe/lecture-hafs | contact@maisondennour.com | ||||||||
https://www.nabilshop.fr/ | www.nabilshop.fr | 1 | https://www.nabilshop.fr/ | https://www.nabilshop.fr/categorie-produit/petits-livrets/ | postmaster@nabil-shop.fr | 215-4417-9314 | https://www.facebook.com/nabilshop75 | https://www.instagram.com/nabilshop75/?hl=fr |
Remarques
- Pour obtenir des leads à partir d'un site web spécifique, envisagez d'abord d'utiliser un modèle spécifique au site web.
- Ce scraper est une version améliorée de Email & Social Media Scraper qui se concentre sur les liens d'email et de médias sociaux, mais il peut maintenant creuser plus profondément dans les sous-pages.
- Les informations de contact à extraire sont comme suivant : emails, numéros de téléphone, numéros de téléphone incertains, YouTube, Tiktok, LinkedIn, Twitter, Facebook et profils Instagram.
- Les profils de médias sociaux sont extraits des liens figurant dans le code HTML.
- En raison des restrictions imposées par le site web, les URL de départ ne doivent pas contenir de liens vers Facebook ou Instagram.
- ce modèle NE PEUT PAS extraire les coordonnées qui ne figurent pas dans le code HTML source. Pour les profils de médias sociaux, il ne détecte que les liens cliquables.
Le scraping est-il légal ?
Vous devez savoir que vos résultats peuvent contenir des données personnelles. Les données personnelles sont protégées par le GDPR dans l'Union européenne et par d'autres réglementations dans le monde. Vous ne devez pas extraire des données personnelles à moins d'avoir une raison légitime de le faire. Si vous n'êtes pas sûr de la légitimité de votre raison, veuillez consulter vos avocats. Vous pouvez également lire notre article sur le centre d'aide pour plus de détails.