Vous êtes intéressé·e par la data science et vous cherchez justement une porte d’entrée vers ce domaine en plein essor ? Ce cours d’initiation au machine learning est fait pour vous ! Le machine learning (aussi appelé apprentissage automatique en français) est un outil essentiel du data scientist, qui a grandement fait parler de lui ces dernières années de part les applications exceptionnelles qu’il a permises…
Une fois que le data scientist a effectué son travail de collecte, de nettoyage et d’exploration des données, il peut passer à la partie de modélisation statistique. C’est ce processus que nous allons explorer ensemble dans ce premier cours consacré au machine learning, un ensemble de techniques puissantes permettant de créer des modèles prédictifs à partir de données, sans avoir été explicitement programmées.
Les compétences d’un data scientist résident non seulement dans sa capacité à traduire les challenges de l’entreprise en problèmes de machine learning, mais aussi dans son agilité à proposer des solutions qui peuvent aider à résoudre ces problèmes de manière performante.
Je vous propose d’aborder cela avec moi, étape par étape, en restant concret et au plus proche des problématiques actuelles que permet de résoudre la data sience. C’est parti ?Ce cours a été crée en partenariat avec l’École CentraleSupélecCe cours a été créé en partenariat avec l’École CentraleSupélecObjectifs pédagogiques :À la fin de ce cours, vous saurez…
Décrire le cycle de développement général du travail d’un data scientistDéfinir le machine learning (apprentissage automatique en français), son champ d’application et ses limitesIdentifier les différents types de modélisation statistique (classification, régression, apprentissage supervisé, apprentissage non-supervisé)
Associer ces types de modélisation statistique à des problématiques business concrètes
Développer une intuition sur le fonctionnement de l’apprentissage automatique à partir de données
Entraîner un premier modèle simple de machine learning
Déterminer les difficultés principales auxquelles sont confrontés les data scientists au quotidien
Intervenants
Yannis Chaouche
Data scientist & professeur chez OpenClassrooms
Durée
3 semaines
Vous pouvez vous inscrire à ce cours à n’importe quel moment de l’année… Le cours est disponible directement sur la plateforme OpenClassrooms 365 jours par an, 24/7, sur tous supports (PC, MAC, tablette, mobile).
Vous pouvez également choisir de suivre les cours selon un rythme prédéfini par la plateforme (1 semaine par partie) ou bien sans rythme, sans contrainte de temps et organiser vous-même une progression régulière..
Le rythme d’une semaine par partie permet un avancement régulier en fixant des dates limites sur le rendu des devoirs. L’avancement du cours sans rythme vous permet quant à lui une grande flexibilité, car vous pouvez réaliser vos exercices à tout moment.
Cette formation est ouverte toute l’année.
Durée
Vous pouvez vous inscrire à ce cours à n’importe quel moment de l’année… Le cours est disponible directement sur la plateforme OpenClassrooms 365 jours par an, 24/7, sur tous supports (PC, MAC, tablette, mobile).
Vous pouvez également choisir de suivre les cours selon un rythme prédéfini par la plateforme (1 semaine par partie) ou bien sans rythme, sans contrainte de temps et organiser vous-même une progression régulière..
Le rythme d’une semaine par partie permet un avancement régulier en fixant des dates limites sur le rendu des devoirs. L’avancement du cours sans rythme vous permet quant à lui une grande flexibilité, car vous pouvez réaliser vos exercices à tout moment.
Cette formation est ouverte toute l’année.
Prérequis
Pré-requis : Des connaissances sur le langage C# ainsi que XAML sont recommandées pour bien appréhender ce cours. Toutefois, la compréhension de la majorité des chapitres ne nécessite pas de connaissance préalable. À la fin de ce cours, vous serez en mesure de comprendre tous les éléments clés de la plateforme pour développer votre application Windows 10 !
Charge de travail
8 heures au total
Coût
Gratuit
Certification
Vous devez compléter tous les exercices du cours et obtenir une note finale d’au moins 70% pour obtenir votre certification !
Un compte OpenClassrooms Premium Solo (20€ / mois) est nécessaire pour valider votre certification.
Déroulement
Chaque cours est composé d’une ou plusieurs parties et peut comporter du texte, des images (schéma, illustration) et des vidéos. Les vidéos des cours durent 10 minutes maximum, avec une moyenne de 3-4 minutes. Elles sont visualisables à tout moment sur OpenClassrooms et téléchargeables en haute définition.
Chaque partie d’un cours certifiant est ponctuée d’exercices de 2 types :
– des quiz corrigés automatiquement
– des devoirs libres (exemple : créer un site web avec des consignes précises).Ces devoirs sont évalués par les pairs. Chaque devoir est corrigé 3 fois par 3 autres élèves, dans un processus en double aveugle, selon un barème fixé par le professeur. La note finale est la moyenne des 3 notes reçues sur le devoir.
Si vous rencontrez des difficultés, pas de panique ! Vous pouvez à tout moment obtenir de l’aide sur les forums.
Programme
Partie 1 – Découvrez les possibilités du machine learning
1. Comment résoudre un problème de data science ?
2. Qu’est-ce que le machine learning ?
3. Identifiez les différents types de problèmes de machine learning
4. Formulez des problématiques business en problèmes de machine learning
Quiz : Quiz 1
Partie 2 – Entraînez votre premier algorithme de machine learning
1. Comment se passe l’apprentissage d’un modèle ?
2. TP : Décomposez l’apprentissage d’une régression linéaire
3. Exploitez au mieux votre jeu de données
4. TP : Entraînez le modèle des k plus proches voisins (k-NN)
Quiz : Quiz 2 Activité : Allez plus loin dans la prédiction de loyer
Partie 3 – Affrontez les difficultés classiques du machine learning
1. Les limites du machine learning : No free lunch et intractability
2. Trouvez le bon compromis entre biais et variance
3. La généralisation du modèle
4. Gérez le fléau de la dimension
Quiz : Quiz 3Certificat de réussite (voir un exemple)
Plateforme
OpenClassrooms
Une technologie issue du projet Open Source CLAIRE (Community Learning through Adaptive and Interactive multichannel Resources for Education) développé conjointement par OpenClassrooms (ex : Simple IT / Site du zéro), le laboratoire LIRIS (équipe Silex), et INRIA Grenoble (équipe WAM)