Découvrez les librairies Python pour la Data Science

Découvrez les bonnes pratiques et les connaissances fondamentales qui vous aideront à effectuer vos analyses de données sereinement à l’aide de Python.

Vous verrez comment utiliser les notebooks Jupyter et des librairies Python comme PandasMatplotlib ou encore Numpy pour tester, explorer vos données et les analyser.

Python possède de nombreuses librairies, utilisées dans tous les domaines. Mais pour pouvoir traiter une grande quantité de données, il est essentiel d’observer quelques règles de base, que nous allons aborder dans ce cours.

Organisateur :

OpenClassrooms

* MOOC Francophone est un service de mise en relation sans inscription et sans intermédiaire. Nous n’organisons aucun cours, le lien « Suivre le cours » vous redirige vers la page web des organisateurs.
  • icon

    Intervenants

    Ali Neishabouri

    Freelance Data Scientist, and teacher at OpenClassrooms

  • icon

    Durée

    6 séquences

  • icon

    Prérequis

    Pour suivre ce cours, vous devez déjà être familier avec la programmation Python. Nous allons aussi invoquer des notions basiques de probabilités et de statistiques, ainsi que de l’algèbre relationnelle. Pour en profiter pleinement, n’hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

    • La ligne de commande en Linux, notamment comment créer une instance AWS et s’y connecter en SSH
    • La programmation en Python
    • L’algèbre relationnelle
  • icon

    Charge de travail

    10 heures au total

  • icon

    Coût

    Gratuit

  • icon

    Certification

    Vous devez compléter tous les exercices du cours et obtenir une note finale d’au moins 70% pour obtenir votre certification !

    Un compte OpenClassrooms Premium Solo (20€ / mois) est nécessaire pour valider votre certification.

  • icon

    Déroulement

    Chaque cours est composé d’une ou plusieurs parties et peut comporter du texte, des images (schéma, illustration) et des vidéos. Les vidéos des cours durent 10 minutes maximum, avec une moyenne de 3-4 minutes. Elles sont visualisables à tout moment sur OpenClassrooms et téléchargeables en haute définition.

    Chaque partie d’un cours certifiant est ponctuée d’exercices de 2 types :
    – des quiz corrigés automatiquement
    – des devoirs libres (exemple : créer un site web avec des consignes précises).

    Ces devoirs sont évalués par les pairs. Chaque devoir est corrigé 3 fois par 3 autres élèves, dans un processus en double aveugle, selon un barème fixé par le professeur. La note finale est la moyenne des 3 notes reçues sur le devoir.

    Si vous rencontrez des difficultés, pas de panique ! Vous pouvez à tout moment obtenir de l’aide sur les forums.

  • icon

    Programme

    Partie 1 – Prenez en main le notebook Jupyter pour Python

    1. Lancez une session de notebook Jupyter sur AWS

    2. Découvrez le problème de Monty Hall3. Utilisez Numpy pour illustrer le théorème central limite

    Activité : Simulez le problème de Monty Hall avec Numpy

     

    Partie 2 – Manipulez des données avec Numpy, Matplotlib et Pandas

    1. Plongez dans la librairie Numpy2. Maîtrisez les possibilités offertes par Matplotlib

    3. Découvrez les DataFrames et la librairie Pandas

    Activité : Effectuez une régression linéaire avec Scikit-learn

     

    Certificat de réussite.

  • icon

    Plateforme

    OpenClassrooms
    Une technologie issue du projet Open Source CLAIRE (Community Learning through Adaptive and Interactive multichannel Resources for Education) développé conjointement par OpenClassrooms (ex : Simple IT / Site du zéro), le laboratoire LIRIS (équipe Silex), et INRIA Grenoble (équipe WAM)

Pin It on Pinterest

Share This