Cliquer sur les éléments

Ce tutoriel va vous introduire comment configuer "cliquer sur les éléments" pendant le scraping.

Mis à jour il y a plus d’une semaine

"Cliquer sur les éléments" est une action assez fréquemment utilisée dans le flux de travail au cours de votre configuration d'une tâche de grattage. Octoparse peut exécuter automatiquement une action de clic chaque fois que vous cliquez sur un élément de page Web dans son navigateur intégré.

Elle a d'autres noms dans le flux de travail outre le nom "Cliquer sur les éléments".

  • "Cliquer sur les URL dans la liste": il apparaît lorsque la page Web contient des éléments liés à d'autres URL.

  • "Cliquer pour paginer": il est généré automatiquement lorsque vous configurez les étapes de pagination.

Comment ajouter une action "Cliquer sur les éléments" dans le workflow ?

1. Cliquer sur le(les) élément(s) de page Web pour générer une étape dans le flux de travail

Cette méthode est couramment utilisée dans les cas suivants:

  • Les données doivent être cliquées avant de s'afficher

  • Les sites Web nécessitent une connexion pour accéder

  • Bouton de recherche

  • Pagination

  • ......

Il vous suffit de cliquer directement sur un élément de page, puis choisir l'option liée au "Clic" dans le panneau Tips. Voici quelques exemples de captures d'écran.

2. Ajouter à partir du workflow

Parfois, vous devrez ajouter les actions de clic à partir du flux de travail. Déplacez simplement votre souris dans le flux de travail, puis cliquez sur l'icône pour ouvrir le menu déroulant.

Ensuite, vous pouvez choisir "Cliquer" pour ajouter une action de clic à un endroit que vous souhaitez.

3. Auto-detecter

Lorsque vous utilisez la fonctionnalité auto-détecter pour générer le flux de travail, Octoparse extraira d'abord les données de liste. Comment faire si vous devez cliquer sur les éléments de liste pour ouvrir respectivement leur page de détails ? Consultez ce tutoriel pour obtenir plus de détails : Cliquer sur chaque lien dans une liste pour récupérer les données des nouvelles pages

Paramètres d'action pour "Cliquer sur les éléments"

Parfois, vous devriez ajuster les paramètres de l'action "Cliquer sur l'élément". Vous pouvez double-cliquer sur l'étape pour ouvrir la page des paramètres. L'image ci-dessous montre des détails sur les paramètres de clic.

1. Modification de XPath

C'est ici que vous pouvez modifier le XPath de l'élément à cliquer. La balise et le Texte sur la même ligne indiquent aussi l'élément actuel à cliquer.

Parfois, l'action "cliquer sur les éléments" ne fonctionne pas bien pour exécuter des actions de clic. C'est probablement parce que le XPath prédéfini n'est plus valide à cause du changement de la mise en page de site Web. Dans ce cas-là, vous devrez réécrire/mettre à jour le XPath.

2. Options de clic

Normalement, "Ouvrir dans un nouvel onglet" ne peut pas être choisi avec "Charger avec AJAX". Pour savoir plus sur les fonctionnalités,

4. Après le chargement de page

L'option la plus fréquemment utilisée est "Défiler la page vers le bas". Si vous devez ajouter un défilement de page après l'action de clic, vous pouvez cocher cette option.

5. Reessayer

Vous pouvez faire Octoparse recharger la page Web dans certaines conditions.

En outre, vous avez peut-être déjà remarqué qu'il existe une option appelée "Cliquer sur les éléments de boucle". Lorsque vous devez cliquer continuellement sur chaque élément de boucle, n'oubliez pas de cocher cette option.

Avez-vous trouvé la réponse à votre question ?