Mardi 1 octobre 2024, SMART TECH reçoit David Lacombled (Président, La villa Numeris)
Category
🗞
NewsTranscription
00:00Je vous propose un nouveau rendez-vous avec David Lacombele, le président de la villa numéris. Bonjour David.
00:11Bonjour Delphine.
00:12Un nouveau rendez-vous qui sera régulier autour des questions, des sujets d'économie numérique.
00:17Alors aujourd'hui on va s'intéresser parmi tous ces défis d'économie numérique à, je dirais pas le plus simple,
00:23mais en tout cas qui est vraiment sur le devant de la scène en ce moment,
00:26c'est la rémunération des contenus qui servent à entraîner les intelligences artificielles.
00:30Je dis complexe mais on va pas dire insoluble quand même.
00:33Non, les journalistes pour la plupart ont fait voeu de pauvreté.
00:37C'est vrai.
00:38C'est pas une raison pour autant pour ne pas les payer.
00:41Alors la rémunération des artistes, des journalistes, des chanteurs et donc de ce qu'ils produisent,
00:48des contenus est aussi ancienne que le web et internet et donc le numérique.
00:54Souvenez-vous, il y a 25 ans il y avait plusieurs moteurs de recherche.
00:57Alors les plus jeunes ne s'en souviendront peut-être pas.
01:00Alta Vista, voilà, Yahoo qui a périclité depuis.
01:05Aujourd'hui il reste Bing et surtout Google vers lesquels d'ailleurs la plupart des producteurs de contenus se tournent
01:14parce qu'on ne prête qu'aux riches et on leur demande aussi beaucoup.
01:18Alors c'est vrai qu'historiquement ce moteur de recherche référençait des contenus pour envoyer de l'audience vers des sites web
01:26qui tentaient soit de vendre leurs contenus dans une économie qui est quasiment gratuite en tout cas pour les utilisateurs
01:35ou soit qu'il est financé par la publicité.
01:39Alors il s'avère que Google est une régie publicitaire et une grosse régie publicitaire.
01:43Deux tiers du marché publicitaire est fait par les grandes plateformes
01:48et donc effectivement les médias traditionnels, historiques, ont le sentiment d'avoir une perte de valeur
01:54et c'est pour ça qu'ils se retournent vers les plateformes pour tenter d'aller négocier quelques subsides
01:59parce qu'ils considèrent que leur contenu c'est le sel, c'est le moteur, le combustible de ces moteurs de recherche
02:06et rien de mieux que des journalistes ou des auteurs pour les écrire.
02:10Bon, ils sont quand même rémunérés ?
02:12Alors ils sont rémunérés par des éditeurs qui aujourd'hui effectivement les financent soit par la publicité,
02:18soit par les abonnements, soit par des contrats qu'ils négocient de gré à gré avec des diffuseurs.
02:25Il y a aussi un système en Europe depuis 2019 de droits voisins, c'est ainsi qu'on les appelle,
02:34où les plateformes en ligne redistribuent par des organismes de gestion collective
02:40un certain nombre de financements auprès des médias.
02:44Et donc ce dispositif de droits voisins peut s'étendre au contenu qui sert à entraîner
02:50les solutions d'intelligence artificielle générative comme ChatGPT, Jimini, Lama, Demeta par exemple ?
02:56Alors ces solutions d'intelligence artificielle générative ne valent que si elles sont très performantes
03:02et pour l'être il faut s'entraîner, c'est un peu comme Léon Marchand, une course assez courte tous les 4 ans
03:08et le reste du temps au bassin pour s'entraîner, c'est le même cas pour les intelligences artificielles génératives
03:15et pour cela il faut des données, beaucoup de données.
03:19Alors ça tombe bien, il y a des réservoirs à donner, je vous enverrai vers Common Crawl
03:23qui est une fondation américaine, les contenus y sont gratuits et Common Crawl ratisse,
03:28écume l'ensemble du web très régulièrement et vous pouvez d'ailleurs y aller,
03:33vous serez surprise de ce que vous y trouverez.
03:35Equipez-vous d'un ordinateur avec quelques teras de mémoire pour pouvoir aspirer ce que vous souhaitez
03:41et c'est là que se servent les solutions d'intelligence artificielle.
03:45C'est la mémoire du web qui est une représentation assez significative de l'humanité
03:51pour ne pas dire très représentative.
03:54On a fait une étude avec AD qui montre que les contenus en langue française c'est 5% de cette masse-là
04:01et les contenus qu'on peut estimer de qualité produits par des journalistes c'est 3%, 3% des 5%.
04:07Je vous laisse faire le calcul Delphine.
04:09Et donc les médias c'est une infime partie mais qui vaut de l'or.
04:14Mais donc ça devrait être simple finalement d'en tirer un revenu.
04:18Alors c'est simple si vous savez authentifier et tracer vos contenus
04:24pour en réclamer la paternité et in fine la rémunération.
04:29C'est un peu comme un robot ménager cette affaire.
04:32Vous mettez des ingrédients, vous les mêlez, vous les mixez, vous les malaxez
04:36et au final quand vous servez le plat préparé, compliqué de dire d'où vient la farine, le sucre et qui l'a fabriqué.
04:42Et donc la seule solution qui est technologique pour valoriser ces contenus
04:46c'est de créer des registres, de les marquer pour les authentifier, les tracer
04:50et demain vous donner tous les moyens d'y mettre des droits et donc une valeur et de la négocier.
04:57Merci beaucoup David Lacombe pour vos éclairages sur ce sujet.
05:00Je rappelle que vous êtes le président de la Villa Numeris.
05:03Et merci à vous de nous suivre sur la chaîne Bismarck for Change à la télé
05:06mais aussi en podcast on est disponible, vous cherchez Smartech.
05:10Et je vous dis à très bientôt pour de nouvelles discussions sur la tech.