Manipulation d'AJAX

Ce tutoriel va vous expliquer comment configurer AJAX.

Mis à jour il y a plus d’une semaine

De nombreux sites Web appliquent la technique AJAX pour créer des pages Web plus rapides et plus interactives. Octoparse peut vous aider à traiter ce genre de pages Web. Dans cet article, nous allons vous montrer comment gérer AJAX dans Octoparse.

1. Qu'est-ce qu'AJAX ?

AJAX signifie "Asynchronous JavaScript et XML", qui permet aux pages Web de mettre à jour les informations sans recharger la page entièrement et de demander/recevoir des données après le chargement de la page. Avec la technique AJAX, lorsque vous cliquez sur le bouton "Suivant" ou "Afficher plus" sur une page Web, seule une partie de la page sera mise à jour.

2. Comment savoir si une page Web charge du contenu avec AJAX ?

Il est facile de savoir si AJAX est utilisé sur une page Web avec un seul clic. Si une page Web utilise AJAX, elle peut charger ses nouveaux contenus sans recharger la page. Par conséquent, l'icône de rechargement peut être un bon indicateur de l'utilisation d'AJAX.

  • Si AJAX est appliqué, la page ne sera pas rechargée lors du chargement de contenu supplémentaire. Il ne devrait donc pas afficher un indicateur de réinstallation dans ce cas-là.

  • Si aucun AJAX n'est impliqué sur la page, lorsque vous cliquez pour charger plus d'informations sur la page, la page se rechargera avec un icône de rechargement en cours d'exécution .

3. Comment gérer AJAX dans Octoparse ?

Octoparse prend le rechargement comme un signal lors de l'exécution de l'action "cliquer sur l'élément". Si la page se recharge après avoir cliqué sur un élément, il effectuera l'opération suivante une fois le rechargement terminé. Mais comme les pages avec AJAX ne se rechargeront pas, Octoparse ne recevra pas de signal d'agir et se bloquera. Nous devons donc définir le délai d'attente AJAX pour l'action "Cliquer sur l'élément" ou l'action "Cliquer pour paginer" pour "dire" à Octoparse d'exécuter la prochaine action après le délai d'attente. Il y a deux façons pour gérer AJAX dans Octoparse.

  • Auto-détection d'AJAX

Octoparse configurerait automatiquement un délai d'attente AJAX lorsqu'AJAX est détecté sur la page.

Par exemple, le site Web de Walmart utilise AJAX pour charger la page suivante. Ainsi, lorsque nous choisissons de cliquer sur le bouton de la page suivante sur les sites Walmart, Octoparse configure automatiquement un délai d'attente AJAX pour cette action.

Si vous avez besoin d'un délai d'attente plus long ou plus court, cliquez simplement sur le menu déroulant et choisissez celui que vous souhaitez.

  • Configurer AJAX manuellement

Lorsqu'une tâche est construite manuellement ou si Octoparse ne parvient pas à détecter AJAX, vous pouvez la configurer manuellement en cliquant sur le bouton de paramétrage de l'action "Cliquer sur l'élément" ou "Cliquer pour paginer".

Tips!

Le délai d'attente AJAX doit être suffisamment long pour que la page puisse charger les informations dont vous avez besoin.


4. Envisagez d'utiliser le délai d'attente AJAX pour les pages Web sans AJAX

Même pour les pages qui n'utilisent pas AJAX, vous pouvez aussi utiliser des délais d'attente AJAX pour améliorer le long temps d'attente de certaines pages. Par exemple, si vous avez une page qui est toujours dans le cours de chargement, vous pouvez utiliser un délai d'attente AJAX pour "forcer" Octoparse à passer à l'étape suivante, au lieu de laisser Octoparse attendre jusqu'à ce que la page est chargée.

Avez-vous trouvé la réponse à votre question ?