Café Scientifique Underground n°33

Au menu, des ostréiculteurs et de l’analyse de données !
By Julien Timor et Hervé Guyon

L’objectif de cette séance sera d’illustrer de façon visuelle la gestion de données ordinales en analyse des données sur les données issues du travail de thèse de Julien sur les ostréiculteurs.
Les données originales sont les réponses de 27 ostréiculteurs à 26 items dichotomiques (« oui » vs « non »). Des regroupements d’items peuvent s’envisager pour générer des « scores » par groupes d’items thématiques. Nous créons ainsi des données ordinales à analyser. L’objectif pouvant être de regrouper les individus (classification).

Les travaux sur des données ordinales sont toujours problématiques car ce ne sont ni des données simplement qualitatives (il y a un « ordre ») ni des données simplement quantitatives (le score a une échelle arbitraire). En analyse des données il est conseillé d’utiliser l’Analyse des Correspondances Multiple. Mais cette dernière n’est pas sans biais possibles (notamment si l’échantillon est petit) et est-elle réellement plus performante qu’une Analyse en Composante Principale ?

Nous proposons donc d’illustrer très simplement ce problème en montrant 6 analyses différentes effectuées via Factoshiny (donc très visuelles) : ACM sur les données dichotomiques, ACP sur les données dichotomiques, ACM sur les scores, ACP sur les scores bruts, ACP sur les rangs, ACP sur les corrélations polychoriques.

En analyse de données, fais ce qu’il te plaît!

Rendez-vous

Jeudi 8 février 2018

D134 / IUEM