La cyber-monnaie est une monnaie numérique ou virtuelle sécurisée par cryptographie, Il est donc presque impossible de simuler ou de réutiliser la consommation. De nombreuses crypto-monnaies sont des réseaux décentralisés basés sur la technologie blockchain - un registre distribué mis en œuvre par un réseau disparate d'ordinateurs.
Les joueurs de cyber-monnaie ont besoin de surveiller la fluctuation des prix sur les devises à mesure que le prix change en quelques secondes. Octoparse peut programmer le scraping pour qu'il s'exécute instantanément pour aider à mettre à jour les informations à temps.
Dans ce tutoriel, nous vous montrerons comment scraper les informations sur les cyber-monnaies sur Yahoo Finance
Pour Yahoo Finance, vous pouvez visiter le "Modèle de Tâche" facile à utiliser sur l'écran principal de l'outil de scraping Octoparse. Tout ce dont vous avez besoin est de saisir plusieurs paramètres et la tâche est prête. Pour plus de détails,veuillez consulter ici: Modèle de Tâche
Pour continuer, vous auriez besoin d'utiliser URL dans ce tutoriel:
Nous extrairons des données telles que le symbole et le nom du graphique de crypto-monnaie avec Octoparse.
Voici les principales étapes de ce tutoriel:
1. "Aller à la page Web" - ouvrir la page Web cible
Entrez l'URL de la page sur l'écran d'accueil et cliquez sur "Démarrer" pour créer une nouvelle tâche
2. Auto-détecter la page Web - créer un flux de travail
Choisissez à nouveau "Détecter automatiquement les données de la page Web" et attendez que la détection soit terminée
Cliquez sur "Changer les résultats de la détection automatique" dans le panneau Tips pour localiser le graphique.
Décochez "Ajouter un défilement de page"
Cliquez sur "Créer un workflow"
Cliquez pour ouvrir les paramètres de l'action "Cliquer pour paginer"
Prolonger le délai d'attente AJAX entre 7-10 s
3. Extraire les données - pour modifier les champs de données
Cliquez pour ouvrir les paramètres de l'action "Extraire les données"
Supprimez les champs indésirables en cliquant sur l'icône
Renommez les champs en cliquant sur le nom du champ
Tips!
|
4. Modifier XPath de Pagination - pour corriger le scraping sans cesse
Le XPath de pagination généré automatiquement doit être modifié; sinon, le scraping ne peut pas être arrêté. Octoparse continuera à scraper la dernière page.
Cliquez les paramètres de pagination pour ouvrir
Entrez le nouveau XPath //button[not(@disabled)]//span[text()="Next"]
Cliquez sur "OK" pour confirmer
5. Démarrer l'extraction - exécuter la tâche et obtenir des données
Cliquez sur "Enregistrer"
Cliquez sur "Démarrer" dans le côté supérieur gauche
Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud (uniquement pour les utilisateurs premium)
Vous pouvez exporter les données de résultat sous les formats tels que EXCEL, CVS, JSON ou dans votre base de données.
Voici l'exemple de production.