RCP216 : Travaux pratiques – Détection et correction des disparités

Une nouvelle séance de travaux pratiques est disponible, pour le nouveau chapitre sur l’équité dans la fouille de données. Cette séance de TP

  • montre comment détecter la présence de disparités (critère demographic parity, critère equalized odds) dans les prédictions d’un modèle obtenu à partir de données,
  • met en œuvre une technique de réduction des disparités (critère equalized odds) a posteriori, basée sur la randomisation et facilement applicable à tout modèle dont les prédictions sont binaires

RCP216 : travaux pratiques à distance via Zeppelin

Pour faciliter l’enseignement à distance durant les périodes de confinement ou de couvre-feu, nous avons mis en place un accès à distance à un cluster Spark et tous les TP de fouille de données sont maintenant accessibles à travers un notebook Zeppelin, voir par ex. ce TP (lien vers le cahier Zeppelin sous le titre du TP).
Cette solution peut également être utilisée pour les projets de l’UE RCP216.

Réunion virtuelle d’information le 24/01 à 18h

Pour expliquer le fonctionnement du certificat et répondre à toutes vos questions, nous vous proposons une réunion virtuelle d’information le 24 janvier 2019, à partir de 18h.

Pour assister à la réunion vous devez vous connecter à
http://cnamparis.adobeconnect.com/donneesmassives2019/
(le 24 janvier 2019 à partir de 18h)

Il est vivement conseillé d’utiliser des oreillettes pour pouvoir poser des questions oralement en évitant l’écho. Sinon, il est toujours possible de poser des questions par écrit.

Témoignage : Aurélie LE CAIN

Aurélie LE CAIN, R&D Program Manager chez Essilor, témoignage de juin 2016 dans cette présentation :

« Après une thèse en mathématiques appliquées spécialité statistique, j’ai intégré en 2012 un pôle de mathématiciens en R&D chez Essilor, pour développer des algorithmes et maintenir des applications de calcul. Je travaillais essentiellement avec mes collègues mathématiciens.

En 2015, j’ai suivi à titre individuel la formation Analyste de données massives du CNAM dans le but d’accompagner Essilor dans l’essor du numérique. Cette formation, bien qu’intense à raisons de trois soirs par semaine, a été très stimulante dans mon métier.

L’ouverture que m’a apportée cette formation, notamment la découverte de nouveaux concepts, m’a permis de proposer de nouvelles idées. En particulier, l’une d’elles s’est concrétisée par l’ouverture d’un projet que je gère, impliquant cinq personnes de métiers différents. En 2017, cette équipe est devenue le smart glasses departement et je suis en charge de la partie data science sur ce projet big data de lunettes connectées.

Cette formation pointue et complète m’a ainsi permis de concilier mon intérêt pour les sujets transverses, pour le travail en équipe et ma curiosité. »

(fin 2018, Aurélie Le Cain est responsable Data Science chez Essilor)

Témoignage : Nathalie RAMOS

Nathalie RAMOS, actuaire, 25 ans d’expérience dans le monde des assurances, témoignage de juin 2016 dans cette présentation :

« J’ai suivi la première année (2014-2015) de formation au Certificat d’analyste en données massives du CNAM. Cette formation m’a aidée à préparer mon certificat de Data Science pour l’Actuariat (2015-2016 première année également), et de progresser, très rapidement, vers un poste de responsable Data Science dans un cabinet d’actuaires.

Mon objectif est de faire évoluer mon métier d’actuaire vers de nouveaux postes et de nouveaux métiers que vont engendrer les techniques offertes par l’innovation, le digital et les traitements des données de masse. Le certificat du CNAM a pu m’ouvrir les portes à ces perspectives.

Cette formation en somme, m’a permis de rediriger sa ma carrière vers de nouvelles aventures professionnelles dans les domaines qui me passionnent : l’informatique, la statistique et l’actuariat. »

(fin 2018, Nathalie Ramos est Responsable de la cellule transformation digitale chez Galea & Associés)