Chat GPT Vision, IL PEUT TOUT FAIRE

  • l’année dernière
Dans cette vidéo, on découvre Chat GPT Vision. Et il peut tout faire.
Transcript
00:00 Ça y est, GPT Vision est disponible en France pour les abonnés TchatGPT+.
00:04 Cette fonctionnalité permet de soumettre une photo, un schéma ou encore un graphique
00:09 à TchatGPT pour que celui-ci l'analyse.
00:12 Les usages sont nombreux et depuis son déploiement, on trouve énormément d'exemples de cas d'application.
00:18 Dans cette vidéo, j'ai donc sélectionné les usages qui m'ont le plus impressionné
00:23 et je les ai adaptés pour réaliser mes propres tests.
00:26 Il y aura 6 tests en tout et tu vas voir, il y a de quoi être bluffé.
00:30 On est donc sur TchatGPT et on voit sur la barre de tchat l'option "Attach image".
00:38 Petit rappel, cette option n'est pour l'instant disponible que pour les abonnés TchatGPT+.
00:43 Pour ce premier test, on va soumettre une page d'exercice à TchatGPT et on va lui demander
00:48 "peux-tu me résoudre ces exercices de grammaire".
00:51 J'ai pris pour exemple des exercices de grammaire sur les accords.
00:55 Et super, il a répondu juste à toutes les questions.
00:58 On notera que ce test était plutôt simple et il faut rappeler que malgré ses performances,
01:04 TchatGPT n'est pas à l'abri de faire des erreurs sur des tests plus compliqués.
01:07 Pour ce deuxième test, on va lui demander de reconnaître des personnages.
01:14 On va commencer par une image de Gérard Depardieu dans le film Tais-toi.
01:18 TchatGPT nous recale gentiment.
01:20 En fait, il n'est pas autorisé à analyser une personne humaine, que ce soit un personnage
01:25 de fiction ou non, et ce dans le cadre de la protection des données et de la vie privée.
01:30 On va donc essayer avec un personnage fictif et une image d'Omer Simpson.
01:34 Pas de problème, il l'a reconnu.
01:36 On va tenter d'aller plus loin et on va lui demander de quel épisode il s'agit.
01:41 Et là, par contre, il s'est trompé.
01:43 Il nous cite A Star Is Burns de la saison 6.
01:47 Burns fait son cinéma en français.
01:49 Alors que l'image vient de See Omer Run de la saison 17.
01:53 Omer le maire en français.
01:54 Pour ce test, on est passé sur téléphone et l'application TchatGPT.
02:00 Pour le test 3, on va demander à TchatGPT de nous extraire le texte d'une photo.
02:05 Et on a pris une photo de la lettre que YouTube nous avait envoyée pour les 100 000 abonnés
02:10 sur le Labo des réseaux.
02:11 On va donc demander à TchatGPT de nous la retranscrire.
02:14 Super, un sans faute.
02:16 Et on peut même maintenant lui demander de nous la traduire.
02:19 A noter, d'après ce que j'ai vu chez d'autres créateurs, ça marche aussi avec les notices
02:23 d'emballage et les lettres manuscrites, très compliquées à déchiffrer.
02:27 Pour ce 4ème test, on va demander à TchatGPT de nous proposer du code à partir d'une
02:35 image.
02:36 Du coup, j'ai fait une capture d'écran de notre page pour s'abonner à notre newsletter.
02:39 Et je lui ai demandé de reproduire une version en HTML.
02:43 Et on va tester ce code dans un simulateur HTML rendu plutôt sympa.
02:49 Bon, bien sûr, c'est une maquette.
02:51 D'ailleurs, il me précise bien d'ajouter dans mon code le chemin d'accès vers l'image
02:56 de fusée que je n'ai pas mis dans mon code HTML.
02:58 Et pareil, si je veux que la page soit fonctionnelle, il faudra que j'y apporte des modifications.
03:03 Mais c'est un bon début.
03:04 Et je pourrais même continuer le travail sur le projet en échangeant avec TchatGPT.
03:09 Toujours dans le même esprit, cette fois-ci, je lui propose un schéma que j'ai dessiné
03:13 très vite à la main.
03:14 On va voir s'il arrive à me coder quelque chose avec ça.
03:17 J'ai testé le code, cette fois-ci dans un simulateur HTML en ligne, ça ne marchait
03:26 pas.
03:27 Mais en créant un fichier HTML sur mon Mac avec ce code, j'obtiens le résultat espéré.
03:32 Et c'est juste dingue qu'à partir d'un schéma, il a compris ce que je voulais faire
03:36 et il l'a exécuté.
03:37 Sur ce nouveau test, on va demander à TchatGPT d'analyser des données.
03:44 On commence par un graphique venant de nos analytics YouTube et on va lui demander simplement
03:48 "que peux-tu me dire de ce graphique".
03:50 TchatGPT comprend parfaitement le graphique et de quoi il s'agit et il va parfaitement
03:55 l'analyser.
03:56 Je lui demande ensuite s'il peut me donner l'heure idéale pour que je publie une vidéo,
04:01 sachant que je souhaite publier seulement une vidéo par semaine.
04:04 Et sa réponse est très pertinente.
04:06 Il identifie bien que la tranche de publication idéale se situe entre 18 et 20h.
04:11 Et au vu de la ressemblance de densité sur les différents jours sur cette même tranche
04:15 horaire, il me conseille de publier quand je suis le plus disponible pour répondre
04:19 aux premières réactions et commentaires.
04:21 On continue sur l'analyse de données, cette fois-ci je lui demande d'analyser en même
04:24 temps deux graphiques.
04:25 Le premier représente le nombre de mariages et de divorces en France et le deuxième le
04:30 taux de divorce selon la durée du mariage.
04:32 Et je vais lui demander s'il trouve d'éventuels points de corrélation entre ces deux graphiques.
04:37 Il me sort une analyse très complète des deux graphiques et il a même fait le lien
04:41 entre les deux, par exemple avec ce point d'analyse qui est très impressionnant.
04:45 Il est intéressant de noter que même si le nombre absolu de mariages diminue, le taux
04:50 de divorce pendant les premières années augmente.
04:52 Cela suggère que les couples qui se marient plus récemment sont plus susceptibles de divorcer
04:57 tôt dans leur relation.
04:59 Si tu as de ton côté des datas à confronter tout en gardant un esprit critique, ça peut
05:04 ouvrir à des perspectives très intéressantes.
05:07 Pour ce dernier test, on va faire quelque chose qui avait déjà été mis en avant
05:14 par OpenAI lorsqu'ils avaient annoncé l'arrivée du multimodal sur ChatGPT4.
05:18 On va demander à ChatGPT de réagir à une photo.
05:22 Donc j'ai pris une photo de quelques aliments que j'avais dans mon frigo et je vais lui
05:25 demander une recette de cuisine.
05:26 Sans surprise, il nous propose une recette d'omelette aux champignons.
05:30 Le truc cool, c'est qu'il va nous détailler la liste des ingrédients, le grammage et nous
05:34 donner les étapes de préparation.
05:36 Ce qui est intéressant, c'est qu'on peut faire du reverse engineering et lui demander
05:40 dans l'autre sens « voilà une photo d'un aliment, peux-tu me proposer une recette pour
05:45 reproduire cet aliment ? » Il a bien identifié le gâteau ainsi que les détails avec la
05:49 crème fouettée et le café.
05:51 C'est pareil, il va nous donner la liste détaillée des ingrédients et la recette
05:56 avec les étapes à suivre.
05:57 Là aussi, ce sont des exemples simples mais les applications peuvent être énormes.
06:02 Encore une fois, l'ensemble de mes tests ne couvrent pas l'ensemble des possibilités
06:09 qu'offre GPT Vision.
06:10 Et tous les jours sur les réseaux sociaux, de nouvelles expérimentations et applications
06:14 émergent.
06:15 En tant que créateur, c'est à toi de réfléchir sur ce que GPT Vision peut t'offrir et donc
06:20 mener tes propres tests.
06:21 Et s'il y a t'intéresse, je ne peux que te recommander de t'inscrire à notre newsletter.
06:26 Tu recevras chaque semaine un mail autour de l'actualité de l'intelligence artificielle
06:31 et des réseaux sociaux.
06:32 Il y a également quelques astuces pour les créateurs de contenus.
06:35 Tu trouveras un lien pour t'inscrire en description et en commentaire épinglé.
06:39 Merci et à bientôt sur le Labo des réseaux.
06:42 [Musique]

Recommandée