Le MOOC Analyse des données multidimensionnelles a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l’analyse statistique de données. Tous les domaines où l’on recueille des données sont concernés : enquêtes d’opinion, marketing, biologie, écologie, géographie, etc. Ce cours vise à comprendre et appliquer les méthodes fondamentales de l’analyse des données. L’objectif est de rendre les participants autonomes dans la mise en œuvre et l’interprétation d’analyses exploratoires multidimensionnelles.
Intervenant
François Husson
Professeur de statistiqueJérôme Pagès
Professeur de statistiqueMagalie Houée-Bigot
Ingénieur d’étude statistiqueDurée
5 semaines
Du 5 mars au 24 avril 2018Prérequis
Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.
Charge de travail
5 heures / semaine
Coût
Gratuit
Certification
Attestation de suivi avec succès.
Déroulement
Vidéos / Forum / Etude de cas / Quiz / Exercices / Evaluation finale
L’évaluation de vos connaissances se fera en continu, sur la base de quiz autocorrectifs qui vous seront proposés à l’issue de chaque vidéo. Par ailleurs, des exercices sur table et des mini-projets vous donneront l’occasion de mettre en œuvre les méthodes sur logiciel et d’échanger sur les forums. Les réponses aux quiz et exercices ainsi qu’un exercice d’évaluation finale vous permettront d’obtenir une attestation de suivi avec succès.
Programme
Semaine 1 : Analyse en composantes principales
Données, problématique et exemples
Recherche d’une représentation des individus
Interprétation de la représentation des individus grâce aux variables
Représentation des variables
Aides à l’interprétation
Mise en œuvre sous FactoMineRSemaine 2 : Analyse factorielle des correspondances
Données, notations, questions
Liaison et indépendance entre deux variables qualitatives
Comment l’AFC appréhende-t-elle l’écart à l’indépendance ?
Nuages des lignes et des colonnes et leur représentation
Pourcentages d’inertie et inerties en AFC
Représentation simultanée des lignes et des colonnes
Aides à l’interprétation
Mise en œuvre sous FactoMineRSemaine 3 : Analyse des correspondances multiples
Données, objectifs et problématique
Transformation du tableau des données
Représentation des individus
Représentation des modalités comme aide à l’interprétation de la représentation des individus
Nuage des modalités et sa représentation optimale
Représentation simultanée des deux nuages
Interprétation des valeurs propres
Représentation des variables
Aides à l’interprétation
Tableau de Burt
Mise en œuvre sous FactoMineRSemaine 4 : Classification
Données, définitions
Principe de construction d’un arbre hiérarchique
Algorithme de partitionnement : les K-means
Consolidation des classes
Classification sur données de grande dimension
Analyse factorielle et classification
Caractérisation des classes d’individus
Mise en œuvre sous FactoMineR
Semaine 5 : Analyse Factorielle MultipleDonnées, problématique
Equilibre des groupes et choix d’une pondération des variables
Etude et représentation des groupes de variables
Représentation des points partiels
Représentation des analyses séparées
Prise en compte de groupes de variables qualitatives
Prise en compte de tableaux de contingence
Aide à l’interprétation
Mise en œuvre sous FactoMineRPlateforme
France Université Numérique (FUN)
Plate-forme nationale française et propriété du Ministère de l’Enseignement Supérieur et de la Recherche. Elle est basée sur la technologie Open edX du MIT et de Harvard.