Google Gemini 2.0 Flash, une IA qui fait TOUT
Catégorie
🤖
TechnologieTranscription
00:00Est-ce que Google Gmini est devenue la meilleure IA ?
00:03La question se pose quand on voit ce que le dernier modèle Google Gmini 2.0 Flash est capable de faire.
00:09Avec cette dernière version, Google a réussi à créer un modèle capable de tout faire au niveau de l'édition de design.
00:15Concrètement, tu vas pouvoir créer des personnages récurrents,
00:17avec la possibilité de faire des changements d'angle ou des changements de posture,
00:20ou même des changements d'expression en gardant un maximum de cohérence.
00:24Ce modèle est capable de réaliser différentes tâches d'édition
00:28qui demanderait normalement l'utilisation d'un logiciel spécialisé et les compétences qui y vont avec.
00:33Et là, simplement à l'aide d'un prompt, tu vas pouvoir effacer des éléments de ton design,
00:37en ajouter ou combiner plusieurs éléments différents au sein du même design.
00:41Il va être possible aussi de faire de la création de mock-up, de l'expansion d'images,
00:45ou encore ajouter ou modifier des textes existants.
00:48J'ai essayé de regrouper dans cette vidéo tous les cas d'usage avec mes propres exemples,
00:52et je te présente ça tout de suite.
00:54Pour commencer, je me rends sur le Google AI Studio.
00:57Ici, je vais avoir accès à droite au modèle Gemini 2.0 Flash Image Generational Experimental.
01:04C'est ce modèle qu'on va utiliser donc pour générer nos différents designs.
01:07On va commencer par créer un personnage et voir si on peut le mettre en scène de façon différente,
01:12en gardant de la cohérence entre les différents designs.
01:15Et pour commencer, je vais m'aider de Gemini pour élaborer mon prompt.
01:19Du coup, je repasse sur le modèle Gemini 2.0 Flash, et donc je vais lui demander
01:24« Peux-tu m'aider à élaborer un prompt pour un design représentant un personnage de Star Wars,
01:28un Jedi, mis en scène de façon cinématographique à travers plusieurs décors et plusieurs scènes ? »
01:33Et je voudrais 8 scènes différentes.
01:34On va voir ce qu'il nous propose.
01:36Donc, intéressant, il m'a donné un mode d'emploi pour mon prompt et pour l'adapter,
01:40et il m'a donné des exemples, et du coup, c'est ce qu'on va utiliser.
01:42On va utiliser un de ces exemples.
01:44On va voir tout de suite ce que ça donne, donc je retourne sur Create Prompt.
01:48Je sélectionne le modèle Flash Image Generation, et c'est parti.
01:53Donc, on a notre premier rendu.
01:55Et ce qu'on va faire, c'est qu'on va retourner sur notre conversation à gauche.
01:59On va sélectionner l'ensemble des prompts, et on va lui demander de créer tous les designs.
02:05Plutôt sympa, on a une série de scènes de l'univers de Star Wars,
02:08et du coup, on va travailler à partir d'un de ces designs pour justement montrer
02:12ce qu'on est capable de faire avec ce modèle, notamment dans l'édition de design existant.
02:17On notera quand j'ai demandé des prompts à Gemini, il me les a proposés en anglais,
02:20et pendant tout le tuto, je pense que je vais travailler à partir de l'anglais
02:23parce que j'aurai sûrement de meilleurs résultats.
02:25Donc, à toi de voir, moi je vais préférer travailler avec l'anglais,
02:28je pense que j'aurai plus de précision.
02:30Pour travailler à partir d'un design, je me rends à droite sur More Options,
02:34et là, je vais avoir Branch From Here.
02:36Du coup, je vais pouvoir éditer ce design en conservant la cohérence de celui-ci.
02:41Par exemple, là, je vais lui demander de passer la couleur du sabre laser en bleu,
02:44on va voir ce que ça peut donner.
02:46Et donc, parfait, il a vraiment réussi à changer la couleur du sabre laser
02:51sans trop toucher aux autres détails du design.
02:54Je vais continuer, cette fois-ci, on va lui demander par exemple de changer de posture.
02:57Donc toujours, je pars sur Branch From Here, et je vais lui demander
03:01« Make him stand in front of the statue, we are now seeing him from behind, he's back. »
03:07Donc, on va essayer de le tourner, et donc normalement, on devrait voir son dos.
03:12Bon alors, ça manque un peu de précision, donc quand il est proche comme ça,
03:15il ne faut pas hésiter de lui demander de recommencer.
03:18« Try again. »
03:21Ah voilà, déjà là, c'est plus cohérent, c'est un peu plus sympa.
03:24On va lui en demander une nouvelle fois.
03:28Il ne semble pas aller plus loin, et ce qu'on va faire, c'est qu'on va partir de Branch From Here,
03:31qu'on ne voit bien plus que son dos à l'écran, et qu'on ne voit plus du tout sa tête.
03:35Voilà, là, on arrive à quelque chose de pas trop mal.
03:38Donc voilà, on a créé ces trois designs différents,
03:40avec plutôt de la cohérence sur les designs,
03:43et donc le mouvement de nos personnages en gardant à peu près la stabilité du design en général.
03:48Et cette cohérence entre les designs, elle peut être très utile,
03:51notamment si tu fais de la création vidéo IA.
03:54Par exemple, c'est parfait pour combiner avec une des fonctionnalités de Pika.art,
03:58l'option PikaFrame, qu'on avait présentée il n'y a pas longtemps d'ailleurs sur la chaîne.
04:02Et la combinaison de ces deux outils IA permet vraiment une précision et un contrôle dans la création vidéo.
04:09On repousse encore un peu plus les limites.
04:11Bon, après, au niveau de la qualité des designs qu'on peut avoir,
04:13je trouve quand même qu'on est en dessous d'un autre générateur d'IA comme Midjourner.
04:17Donc si on a vu qu'on pouvait changer les positions des personnages ou les éléments d'une photo,
04:22on peut aussi changer leur expression.
04:24Là, on va choisir un autre sujet pour faire ce test,
04:27avec par exemple cette femme, et on va essayer de ne pas la faire sourire.
04:31Donc le premier résultat est plutôt subtil, mais on voit qu'on a fait disparaître le sourire.
04:36On va lui demander de réessayer, et je vais ajouter de la précision dans mon prompt.
04:40Bon, ce n'est pas toujours un succès, c'est dommage.
04:42La bouche était bien faite, mais là, les yeux, ça a été un peu n'importe quoi.
04:45On va essayer de modifier un petit peu le prompt.
04:51Ah voilà, avec un prompt un peu plus simple, là, on a vraiment réussi à faire quelque chose.
04:55Donc oui, pas hésité à reformuler, à réessayer avec cet IA,
04:59mais avec un peu de persévérance, on arrive vraiment à obtenir des résultats précis et cohérents.
05:04On va continuer avec nos tests d'édition sur des photos existantes.
05:08Donc là, par exemple, avec ce mug posé sur une table, et on va essayer d'effacer cette tasse.
05:14Là, pour le coup, résultat parfait.
05:16On va continuer, mais cette fois-ci, on va essayer d'ajouter un design,
05:19et justement de remplacer cette tasse par autre chose.
05:21Du coup, je sélectionne plus, je vais ajouter un design ici, un vase.
05:27Et je vais lui demander, est-ce qu'il peut mettre ce vase à la place de la tasse ?
05:32Résultat pas trop mal, même si on s'approche dans les détails, ça fait un petit peu montage photo.
05:36En tout cas, il a bien compris le prompt.
05:38Et si on peut ajouter des éléments à un design,
05:41on va pouvoir également combiner plusieurs éléments au sein d'un même design.
05:45Nouvel exemple, ici, on va ajouter plusieurs personnages,
05:48avec par exemple ces deux hommes.
05:50Et je vais demander à l'IA,
05:51est-ce que tu peux créer une photo de ces deux hommes travaillant ensemble au sein du même bureau,
05:56et qu'ils sont tous les deux debout devant le même ordinateur ?
05:58On va voir ce que ça donne.
05:59Et c'est parfait, je suis même étonné que Gemini a aussi bien compris le prompt.
06:04Et on va continuer dans cette idée d'assemblage.
06:06Et cette fois-ci, on va prendre une femme et un accessoire,
06:09et on va essayer de lier les deux.
06:12Voyons si ça marche.
06:14Ok, pas trop mal comme résultat.
06:16Et ça a plutôt bien marché.
06:17Et on pourrait continuer comme ça, à ajouter des éléments.
06:23Par exemple là, je vais lui demander,
06:25habille-la avec ce sweatshirt.
06:29Bon, avec le pull à motif, il a quand même eu un petit peu plus de mal.
06:33Si on réessaye en partant de zéro, voyons ce que ça donne.
06:37Et là, en partant de zéro, on a quand même deux meilleurs résultats.
06:39Et du coup, je me demande si on essaye de combiner tout à la fois.
06:44Ah, là on a un résultat pas trop mal.
06:45Peut-être que c'est la bonne façon de faire,
06:47quand on veut ajouter plusieurs éléments,
06:49de les combiner tous à la fois dans le même prompt.
06:52On continue nos tests.
06:53Cette fois-ci, on va lui demander de partir d'une photo pour créer un nouveau design.
06:56Et on va lui demander de faire de moi un astronaute.
07:00Avec un résultat plutôt convaincant.
07:02Quelques options d'édition supplémentaires qu'il est possible de réaliser.
07:06On va par exemple essayer de créer un mock-up avec ce t-shirt et le logo du Labo des réseaux.
07:11Bon, le résultat est pas trop mal.
07:12Bon, après, ça vaut pas la création de mock-up sur un outil comme Canva.
07:16Et d'ailleurs, on avait fait un tuto spécifique sur ce sujet.
07:19Si ça t'intéresse, n'hésite pas à aller le consulter.
07:22On va essayer l'édition de texte.
07:24Du coup, on va lui demander s'il peut changer le panneau et mettre Paris à la place de Rome.
07:29On a un bon résultat.
07:30Alors après, attention, il n'y avait pas beaucoup de lettres et l'indication était claire.
07:34Plus on va compliquer la demande, plus le résultat sera incertain.
07:37Par exemple là.
07:38Est-ce que tu peux écrire cinéma en haut du panneau ?
07:43Bon, là encore une fois, il s'en sort pas trop mal même si les résultats sont moins bons qu'avec l'exemple précédent.
07:48Enfin, dernier test, on va essayer l'expansion d'image.
07:52Et je vais lui demander peut-tu étendre cette image ?
07:55Fais-la deux fois plus grande.
07:57Et il a réussi sans trop de soucis.
07:59Dans cette vidéo, j'ai essayé de présenter un maximum d'exemples.
08:02Mais n'hésite pas à faire tes tests avec tes propres requêtes adaptées à tes besoins spécifiques.
08:06Car Gemini est parfaitement capable de comprendre ce que tu lui demandes de faire.
08:10Et c'est d'ailleurs un peu à quoi on doit s'attendre dans les prochains mois et les prochaines années avec toutes les IA.
08:15On va avoir des modèles plus intuitifs avec une utilisation simplifiée.
08:19Où le dialogue suffira simplement pour créer sans avoir besoin de passer par des fonctionnalités ou des manipulations spécifiques.
08:25Google l'a parfaitement compris avec ce modèle simple à utiliser mais qui permet de faire plein de choses.
08:30Si tu es intéressé par l'IA, je t'encourage à t'abonner à notre newsletter, le lien est en description et en commentaire épinglé.
08:35C'était Boris, merci et à bientôt sur le Labo des réseaux.