Aujourd’hui, la science des données n’est plus le mot à la mode mais l’essor du marché axé sur les données. Un rapport d’IBM estime que les offres d’emploi liées aux données atteindront 2,7 millions d’ici 2020. Cela dit, la demande de compétences professionnelles liées aux données, comme l’apprentissage automatique et l’IA, est un must-have pour les talents analytiques.
Cet article recommande 10 meilleurs cours en ligne d’analyse de big data pour les débutants, en particulier ceux qui envisagent de faire la transition vers des emplois d’analyse de données.
Coursera
1. Spécialisation Data Analysis and Presentation Skills: the PwC Approach
Lien : https://www.coursera.org/specializations/pwc-analytics
Prestataire : Price Waterhouse Coopers LLP
Engagement : 2 mois, à 10 heures par semaine
Cette spécialisation comprend 5 cours, de la prise de décision basée sur les données, la résolution de problèmes avec les fonctions de base d’Excel, la visualisation de données avec Excel avancé, à la présentation commerciale avec PowerPoint, et un projet final.
- Cours 1 : Prise de décision basée sur les données
- Cours 2 : Résolution de problèmes avec Excel
- Cours 3 : Visualisation de données avec Excel avancé
- Cours 4 : Présentations commerciales efficaces avec PowerPoint
- Cours 5 : Analyse des données et techniques de présentation : l’approche PwC Projet final
Note moyenne : 4,6
La spécialisation en analyse de données est conçue pour les employés de PWC, qui se concentre sans doute davantage sur l’application commerciale que sur la théorie. Elle convient aux personnes qui n’ont pas de connaissances en programmation.
2. Data Science Specialization
Lien : https://www.coursera.org/specializations/jhu-data-science/
Prestataire : Université John Hopkins
Engagement : 7 mois à 10 heures par semaine
Composée de 10 cours, cette spécialisation couvre les concepts et les outils dont vous aurez besoin tout au long du pipeline de la science des données, de la pose des bons types de questions à la réalisation d’inférences et à la publication des résultats.
Note moyenne : 4,6
Il s’agit de l’une des spécialisations en science des données les plus longues sur Coursera. Contrairement à celle de PWC, elle se concentre davantage sur les théories liées aux statistiques, à l’algorithme et à l’analyse des données. En outre, ces cours sont basés sur le langage de programmation R. Par conséquent, il est recommandé d’avoir des connaissances de base en programmation avant de suivre ces cours.
3. Big Data Specialization
Lien : https://www.coursera.org/specializations/big-data/
Prestataire : Université de Californie, San Diego
Engagement : 3 mois à 10 heures par semaine
Avec un total de 6 cours, il couvre les principaux aspects du big data, depuis l’introduction de base, la modélisation, les systèmes de gestion, l’intégration et le traitement, jusqu’à l’apprentissage automatique et l’analyse des graphes.
- Cours 1 : Introduction au Big Data
- Cours 2 : Modélisation et systèmes de gestion du Big Data
- Cours 3 : Intégration et traitement du Big Data
- Cours 4 : Aperçu de l’apprentissage automatique
- Cours 5 : Graph Analytics for Big Data
- Cours 6 : Big Data – Projet final
Note moyenne : 4,3
Il s’agit d’une excellente introduction au big data pour les débutants qui ne se plonge pas trop dans la programmation. Aucune expérience préalable en programmation n’est nécessaire. Il fait appel à plusieurs outils logiciels libres, dont Apache Hadoop.
4. Statistics with R
Lien : https://www.coursera.org/specializations/statistics
Prestataire : Université de Duke
Engagement : 4 mois à 10 heures par semaine
Avec les 5 cours de cette spécialisation, vous apprendrez à analyser et à visualiser des données en R. Vous serez en mesure de créer des rapports d’analyse de données reproductibles, de démontrer une compréhension conceptuelle de la nature unifiée de l’inférence statistique, d’effectuer des inférences statistiques fréquentistes et bayésiennes, et de modéliser.
- Cours 1 : Introduction aux probabilités et aux données
- Cours 2 : Données numériques et catégorielles
- Cours 3 : Régression linéaire et modélisation
- Cours 4 : Statistiques bayésiennes
- Cours 5 : Statistiques avec R Capstone
Note moyenne: 4,5
Ce cours porte sur la programmation R. Veuillez vous assurer que vous êtes pleinement préparé avec des compétences en programmation.
EDX
5. Microsoft Professional Program in Data Science
Lien : https://www.edx.org/microsoft-professional-program-data-science/
Fournisseur : Microsoft
Engagement : 56-58 semaines, 2-4 heures/semaine
Composé de 4 unités (10 cours au total) et d’un projet final. Cette spécialisation couvre l’introduction de base de la science des données, les langages de programmation essentiels et les langages de programmation avancés en science des données appliquée.
- Unité 1 – Fondamentaux
- Unité 2 – Science des données de base
- Unité 3 – Science des données appliquée
- Unité 4 – Projet de synthèse
Note moyenne N/A
Sans surprise, il est fortement lié aux logiciels Microsoft, notamment Excel, Power BI, Azure et R server. Ces cours impliquent également R et Python.
6. Marketing Analytics
Lien : https://www.edx.org/micromasters/berkeleyx-marketing-analytics
Prestataire : Université de Californie, Berkeley
Engagement : 16 semaines, 5-7 heures par semaine.
Avec les 5 cours de cette spécialisation, vous êtes en mesure d’obtenir un certificat et des crédits Pathways à la fin de vos études. Le programme est conçu et enseigné par un expert du secteur, Stephan Sorger, qui a occupé un rôle de premier plan dans le marketing et le développement de produits dans des organisations telles que Oracle, 3Com et la NASA.
- Cours 1 : Programme MicroMasters® d’analyse marketing de BerkeleyX
- Cours 2 : Marketing Analytics : Stratégie de mesure du marketing
- Cours 3 : Marketing Analytics : Analyse des prix et des promotions
- Cours 4 : Analytique marketing : Analyse concurrentielle et segmentation du marché
- Cours 5 : Analytique marketing : Produits, distribution et ventes
Note moyenne N/A
Ce programme se concentre davantage sur l’utilisation des données dans la planification et la décision marketing, notamment la stratégie de mesure du marketing, l’analyse des prix et des promotions, l’analyse concurrentielle et la segmentation du marché, la distribution des produits et les ventes. Personnellement, c’est un bon cours pour un spécialiste du marketing numérique qui veut améliorer ses capacités numériques.
Classe cognitive
7. Big Data Fundamentals
Lien : https://cognitiveclass.ai/learn/big-data/
Fournisseur : IBM
Engagement : 13 heures
Il ne comprend que 3 cours. Ces cours donnent une brève introduction au Big Data, Hadoop et Spark. La classe cognitive est connue sous le nom de Big Data University auparavant. Maintenant, elle est devenue un fournisseur de MOOC soutenu par IBM.
- Cours 1 : Big Data 101
- Cours 2 : Hadoop 101
- Cours 3 : Spark Fundamentals 1
Note moyenne N/A
En tant que programme Big Data 101, les cours présentent principalement les concepts fondamentaux du big data et la façon dont il s’immisce dans notre vie quotidienne et notre travail. Parallèlement, de nombreux outils de big data sont présentés pour montrer comment les données sont capturées, traitées et visualisées.
Cours alternatif : Master of Science in Data Science
Créateur : Maryville University
Ce programme est un programme de science des données 100% en ligne, 36 crédits, conçu pour vous permettre de développer les compétences, les connaissances et l’expérience nécessaires pour réussir dans le domaine de la science des données. Les cours approfondissent l’apprentissage automatique, l’exploration de données, le big data et l’apprentissage profond, ainsi que les compétences de codage en Python, SQL, R et SAS.
Cours ouverts du MIT
8. Advanced-Data Structures
Lien : https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-851-advanced-data-structures-spring-2012/
Instructeur : Prof. Erik Demaine+
Engagement : 22 sessions, 90 minutes/session
Ce cours offre une vue d’ensemble des différents types de structures de données, y compris les structures de données géométriques, comme une carte, et les structures de données temporelles, comme dans le stockage qui se produit sur une série chronologique. Il couvre les principales directions de recherche pour une grande variété de ces structures de données.
- Session 1 : Structures de données persistantes
- Session 2 : Structures de données rétroactives
- Session 3~4 : Structures géométriques I ~ II
- Session 5~6 : Optimalité dynamique I ~ II
- Session 7 : Modèles de hiérarchie de mémoire
- Sessions 8~9 : Structures tolérantes aux caches I ~ II
- Session 10 : Dictionnaires
- Session 11 : Modèles de nombres entiers
- Session 12 : Arbres de fusion
- Session 13 : Bornes inférieures des nombres entiers
- Session 14 : Triage en temps linéaire
- Session 15 : Arbres statiques
- Session 16 : Chaînes de caractères
- Session 17~18 : Structures succinctes I ~ II
- Session 19~20 : Graphes dynamiques I ~ II
- Session 21 : Limite inférieure de la connectivité dynamique
- Session 22 : Histoire des modèles de mémoire
Note moyenne N/A
Il s’agit d’un cours avancé sur l’explication des différentes structures de données. Pour aider chaque apprenant à maîtriser la leçon plus facilement, un devoir d’une page est fourni chaque semaine pour aider à éliminer les difficultés pendant tout le processus d’apprentissage.
9. Python
Lien : https://www.pluralsight.com/paths/python
Instructeurs : Austin Bingham, Robert Smallshire, Terry Toy, Bo Milanovich, Emily Bache, Reindert-Jan Ekker
Engagement : 3 sessions, 28 heures au total
Ce parcours vous mènera des bases du langage Python jusqu’à l’utilisation de frameworks et de la programmation web.
Python est un langage de programmation interprété et orienté objet. Il est open-source, c’est-à-dire que l’interpréteur et les sources sont librement disponibles et distribuables sous forme binaire. Cela contribue à faire de Python un langage de programmation populaire dans l’analyse des données.
Note moyenne N/A
Il y a 3 sessions pour le débutant, l’intermédiaire et l’avancé séparément. Vous pouvez soit choisir l’un des cours appropriés, soit passer de zéro à un héros après avoir suivi tous les cours.
Udemy
10. Java Tutorial for Complete Beginners
Lien : https://www.udemy.com/
Instructeur : John Purcell
Engagement : 75 conférences, 16 heures au total
Un cours pour débutants pour apprendre le langage de programmation Java. Aucune connaissance préalable en programmation n’est requise. La principale raison de recommander ce cours : Hadoop est basé sur Java, qui est l’un des utilitaires logiciels libres les plus en vogue, qui ouvre la voie à l’analyse des données volumineuses.
Bonus
Solution idéale pour obtenir autant de données possibles – Octoparse
Pour obtenir les données publiques en ligne, vous avez des outils de web scraping efficaces.
Octoparse est un outil de scraping web automatique recommandé par de nombreux experts en données. Il est facile à utiliser, rapide à apprendre et ne nécessite aucune connaissance préalable en programmation. Des millions de données en ligne se transformeront en feuilles de données structurées (Excel, CSV, SQL, API) au bout de vos doigts en quelques secondes. C’est un logiciel réputé d’être nocode qui rend le web scraping accessible à tous. De riches tutoriels en texte ou en vidéo sont disponibles.
Bon apprentissage !