Vous avez découvert le concept d’apprentissage supervisé dans le cours Initiez-vous au machine learning. Dans ce cours, vous avez appris à évaluer un modèle de classification ou de régression…
Il est maintenant temps de découvrir les algorithmes classiques du machine learning supervisé. Dans ce cours, vous apprendrez à maîtriser les algorithmes dont la fonction de décision est une combinaison linéaire des variables.
Vous découvrirez en particulier la régression linéaire et la régression logistique. Vous apprendrez à contrôler les poids affectés à chacune des variables pour éviter le sur-apprentissage ou construire des modèles parcimonieux. Vous comprendrez le fonctionnement des machines à vecteurs de support (SVM). Enfin, vous saurez résoudre des problèmes de classification à plus de deux classes.
Suivez ce cours pour développer des modèles linéaires prédictifs sur vos données !
Intervenants
Yannis Chaouche
Ingénieur Machine Learning – Professeur @ OpenClassroomsChloé-Agathe Azencott
Chargée de recherche au CBIO de MINES ParisTech & Institut Curie. Enseignante à CentraleSupélec. Machine learning & bioinformatique.Durée
Début le 07 Septembre 2017
Prérequis
Ce cours de Data Science se situe au croisement des mathématiques et de l’informatique. Pour en profiter pleinement, n’hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :
- Python pour le calcul numérique que nous utiliserons dans la partie TP du cours (librairie numpy et création de graphes avec pyplot),
- Quelques notions d’algèbre linéaire, telles que manipulation de vecteurs, multiplications de matrices, normes,
- Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance.
Charge de travail
10 heures au total
Coût
Gratuit
Certification
Vous devez compléter tous les exercices du cours et obtenir une note finale d’au moins 70% pour obtenir votre certification !
Un compte OpenClassrooms Premium Solo (20€ / mois) est nécessaire pour valider votre certification.
Déroulement
Chaque cours est composé d’une ou plusieurs parties et peut comporter du texte, des images (schéma, illustration) et des vidéos. Les vidéos des cours durent 10 minutes maximum, avec une moyenne de 3-4 minutes. Elles sont visualisables à tout moment sur OpenClassrooms et téléchargeables en haute définition.
Chaque partie d’un cours certifiant est ponctuée d’exercices de 2 types :
– des quiz corrigés automatiquement
– des devoirs libres (exemple : créer un site web avec des consignes précises).Ces devoirs sont évalués par les pairs. Chaque devoir est corrigé 3 fois par 3 autres élèves, dans un processus en double aveugle, selon un barème fixé par le professeur. La note finale est la moyenne des 3 notes reçues sur le devoir.
Si vous rencontrez des difficultés, pas de panique ! Vous pouvez à tout moment obtenir de l’aide sur les forums.
Programme
Partie 1 – Prédisez des étiquettes quantitatives à l’aide d’une combinaison linéaire des variables
1. Trouvez une combinaison linéaire de variables qui approxime leurs étiquettes
2. Contrôlez la complexité de votre modèle
3. Réduisez l’amplitude des poids affectés à vos variables
4. Réduisez le nombre de variables utilisées par votre modèle
5. TP – Comparez le comportement du lasso et de la régression ridge
Quiz : Partie 1Partie 2 – Séparez linéairement vos observations
1. Prédisez linéairement la probabilité de l’appartenance d’un point à une classe
2. Maximisez la marge de séparation entre vos classes
3. Classifiez vos données en plus de deux classes
4. TP – Entraînez une régression logistique et une SVM linéaire
Activité : Classez automatiquement des feuilles d’arbresPlateforme
OpenClassrooms
Une technologie issue du projet Open Source CLAIRE (Community Learning through Adaptive and Interactive multichannel Resources for Education) développé conjointement par OpenClassrooms (ex : Simple IT / Site du zéro), le laboratoire LIRIS (équipe Silex), et INRIA Grenoble (équipe WAM)