Meet Yoann, Head of AI Data Science

  • l’année dernière
Transcript
00:00 Bonjour, je m'appelle Johan, je suis chez Canna+ depuis 2018
00:03 et je suis responsable de l'équipe Data Science / Intelligence Artificielle
00:06 depuis maintenant deux ans au sein de la direction Data.
00:09 Le métier Data Scientist, très concrètement, très simplement,
00:12 ça consiste à développer des modèles, développer des solutions basées
00:15 sur l'intelligence artificielle pour répondre aux besoins du métier du groupe.
00:19 Plus concrètement, pour vous donner quelques exemples,
00:21 on va avoir des exemples de développement de moteurs de recommandation
00:25 pour personnaliser l'expérience de MyCanal.
00:27 On va avoir de l'extraction de données à partir d'intelligence artificielle,
00:31 d'analyse d'images ou encore d'analyse de textes.
00:33 Et enfin, des solutions, par exemple, de série temporelle
00:35 qui nous permettent de faire de la prédiction des audiences sur nos plateformes.
00:39 Mon équipe, c'est quatre Data Scientist aujourd'hui
00:41 avec des profils très différents mais très complémentaires,
00:43 des profils ML Engineer, des profils Data Scientist un peu plus traditionnels.
00:48 Pour autant, ce qu'on va rechercher, c'est une triple compétence
00:52 avec un bagage technique sur les aspects mathématiques et statistiques,
00:56 un bon niveau en programmation Python
00:59 et également une bonne connaissance et compréhension des enjeux business du groupe.
01:02 Le premier challenge pour notre équipe, c'est vraiment de développer un savoir-faire,
01:06 un centre de compétence dans le domaine de l'intelligence artificielle
01:09 en essayant de rester au maximum à la pointe de la technologie
01:12 dans un domaine qui évolue régulièrement.
01:15 Ensuite, on va avoir un challenge autour de l'IA éthique,
01:20 donc la capacité à faire de l'IA responsable
01:23 et donc d'être capable d'expliquer aujourd'hui ce qui va ressortir d'un modèle de Machine Learning.
01:28 Et enfin, le troisième challenge, c'est notre capacité à maintenir les solutions
01:33 en conditions opérationnelles une fois qu'on a industrialisé un modèle,
01:36 comment on s'assure qu'il n'y a pas de dérive,
01:37 comment on s'assure que le modèle reste performant au fil de l'eau.
01:41 Pour moi, Canaplus est un terrain de jeu incroyable,
01:44 un terrain de jeu fantastique pour un Data Scientist
01:46 de par la variété et le volume de données qu'on est capable de collecter,
01:50 que ce soit sur nos abonnés ou sur nos contenus.
01:53 Juste deux chiffres pour mettre ça en perspective.
01:55 Le premier, plus d'un milliard d'interactions qui sont collectées chaque jour sur nos abonnés
01:59 en termes de navigation et d'usage vidéo.
02:02 Et enfin, 100 000 contenus qui sont disponibles sur nos plateformes tous les jours.