La boite à IA par Labo Des Réseaux - Dailymotion

Labo Des Réseaux

Toutes les nouveautés, tutos et astuces autour de l'intelligence Artificielle.

Transcript

00:00Est-ce que Google Gmini est devenue la meilleure IA ?

00:03La question se pose quand on voit ce que le dernier modèle Google Gmini 2.0 Flash est capable de faire.

00:09Avec cette dernière version, Google a réussi à créer un modèle capable de tout faire au niveau de l'édition de design.

00:15Concrètement, tu vas pouvoir créer des personnages récurrents,

00:17avec la possibilité de faire des changements d'angle ou des changements de posture,

00:20ou même des changements d'expression en gardant un maximum de cohérence.

00:24Ce modèle est capable de réaliser différentes tâches d'édition

00:28qui demanderait normalement l'utilisation d'un logiciel spécialisé et les compétences qui y vont avec.

00:33Et là, simplement à l'aide d'un prompt, tu vas pouvoir effacer des éléments de ton design,

00:37en ajouter ou combiner plusieurs éléments différents au sein du même design.

00:41Il va être possible aussi de faire de la création de mock-up, de l'expansion d'images,

00:45ou encore ajouter ou modifier des textes existants.

00:48J'ai essayé de regrouper dans cette vidéo tous les cas d'usage avec mes propres exemples,

00:52et je te présente ça tout de suite.

00:54Pour commencer, je me rends sur le Google AI Studio.

00:57Ici, je vais avoir accès à droite au modèle Gemini 2.0 Flash Image Generational Experimental.

01:04C'est ce modèle qu'on va utiliser donc pour générer nos différents designs.

01:07On va commencer par créer un personnage et voir si on peut le mettre en scène de façon différente,

01:12en gardant de la cohérence entre les différents designs.

01:15Et pour commencer, je vais m'aider de Gemini pour élaborer mon prompt.

01:19Du coup, je repasse sur le modèle Gemini 2.0 Flash, et donc je vais lui demander

01:24« Peux-tu m'aider à élaborer un prompt pour un design représentant un personnage de Star Wars,

01:28un Jedi, mis en scène de façon cinématographique à travers plusieurs décors et plusieurs scènes ? »

01:33Et je voudrais 8 scènes différentes.

01:34On va voir ce qu'il nous propose.

01:36Donc, intéressant, il m'a donné un mode d'emploi pour mon prompt et pour l'adapter,

01:40et il m'a donné des exemples, et du coup, c'est ce qu'on va utiliser.

01:42On va utiliser un de ces exemples.

01:44On va voir tout de suite ce que ça donne, donc je retourne sur Create Prompt.

01:48Je sélectionne le modèle Flash Image Generation, et c'est parti.

01:53Donc, on a notre premier rendu.

01:55Et ce qu'on va faire, c'est qu'on va retourner sur notre conversation à gauche.

01:59On va sélectionner l'ensemble des prompts, et on va lui demander de créer tous les designs.

02:05Plutôt sympa, on a une série de scènes de l'univers de Star Wars,

02:08et du coup, on va travailler à partir d'un de ces designs pour justement montrer

02:12ce qu'on est capable de faire avec ce modèle, notamment dans l'édition de design existant.

02:17On notera quand j'ai demandé des prompts à Gemini, il me les a proposés en anglais,

02:20et pendant tout le tuto, je pense que je vais travailler à partir de l'anglais

02:23parce que j'aurai sûrement de meilleurs résultats.

02:25Donc, à toi de voir, moi je vais préférer travailler avec l'anglais,

02:28je pense que j'aurai plus de précision.

02:30Pour travailler à partir d'un design, je me rends à droite sur More Options,

02:34et là, je vais avoir Branch From Here.

02:36Du coup, je vais pouvoir éditer ce design en conservant la cohérence de celui-ci.

02:41Par exemple, là, je vais lui demander de passer la couleur du sabre laser en bleu,

02:44on va voir ce que ça peut donner.

02:46Et donc, parfait, il a vraiment réussi à changer la couleur du sabre laser

02:51sans trop toucher aux autres détails du design.

02:54Je vais continuer, cette fois-ci, on va lui demander par exemple de changer de posture.

02:57Donc toujours, je pars sur Branch From Here, et je vais lui demander

03:01« Make him stand in front of the statue, we are now seeing him from behind, he's back. »

03:07Donc, on va essayer de le tourner, et donc normalement, on devrait voir son dos.

03:12Bon alors, ça manque un peu de précision, donc quand il est proche comme ça,

03:15il ne faut pas hésiter de lui demander de recommencer.

03:18« Try again. »

03:21Ah voilà, déjà là, c'est plus cohérent, c'est un peu plus sympa.

03:24On va lui en demander une nouvelle fois.

03:28Il ne semble pas aller plus loin, et ce qu'on va faire, c'est qu'on va partir de Branch From Here,

03:31qu'on ne voit bien plus que son dos à l'écran, et qu'on ne voit plus du tout sa tête.

03:35Voilà, là, on arrive à quelque chose de pas trop mal.

03:38Donc voilà, on a créé ces trois designs différents,

03:40avec plutôt de la cohérence sur les designs,

03:43et donc le mouvement de nos personnages en gardant à peu près la stabilité du design en général.

03:48Et cette cohérence entre les designs, elle peut être très utile,

03:51notamment si tu fais de la création vidéo IA.

03:54Par exemple, c'est parfait pour combiner avec une des fonctionnalités de Pika.art,

03:58l'option PikaFrame, qu'on avait présentée il n'y a pas longtemps d'ailleurs sur la chaîne.

04:02Et la combinaison de ces deux outils IA permet vraiment une précision et un contrôle dans la création vidéo.

04:09On repousse encore un peu plus les limites.

04:11Bon, après, au niveau de la qualité des designs qu'on peut avoir,

04:13je trouve quand même qu'on est en dessous d'un autre générateur d'IA comme Midjourner.

04:17Donc si on a vu qu'on pouvait changer les positions des personnages ou les éléments d'une photo,

04:22on peut aussi changer leur expression.

04:24Là, on va choisir un autre sujet pour faire ce test,

04:27avec par exemple cette femme, et on va essayer de ne pas la faire sourire.

04:31Donc le premier résultat est plutôt subtil, mais on voit qu'on a fait disparaître le sourire.

04:36On va lui demander de réessayer, et je vais ajouter de la précision dans mon prompt.

04:40Bon, ce n'est pas toujours un succès, c'est dommage.

04:42La bouche était bien faite, mais là, les yeux, ça a été un peu n'importe quoi.

04:45On va essayer de modifier un petit peu le prompt.

04:51Ah voilà, avec un prompt un peu plus simple, là, on a vraiment réussi à faire quelque chose.

04:55Donc oui, pas hésité à reformuler, à réessayer avec cet IA,

04:59mais avec un peu de persévérance, on arrive vraiment à obtenir des résultats précis et cohérents.

05:04On va continuer avec nos tests d'édition sur des photos existantes.

05:08Donc là, par exemple, avec ce mug posé sur une table, et on va essayer d'effacer cette tasse.

05:14Là, pour le coup, résultat parfait.

05:16On va continuer, mais cette fois-ci, on va essayer d'ajouter un design,

05:19et justement de remplacer cette tasse par autre chose.

05:21Du coup, je sélectionne plus, je vais ajouter un design ici, un vase.

05:27Et je vais lui demander, est-ce qu'il peut mettre ce vase à la place de la tasse ?

05:32Résultat pas trop mal, même si on s'approche dans les détails, ça fait un petit peu montage photo.

05:36En tout cas, il a bien compris le prompt.

05:38Et si on peut ajouter des éléments à un design,

05:41on va pouvoir également combiner plusieurs éléments au sein d'un même design.

05:45Nouvel exemple, ici, on va ajouter plusieurs personnages,

05:48avec par exemple ces deux hommes.

05:50Et je vais demander à l'IA,

05:51est-ce que tu peux créer une photo de ces deux hommes travaillant ensemble au sein du même bureau,

05:56et qu'ils sont tous les deux debout devant le même ordinateur ?

05:58On va voir ce que ça donne.

05:59Et c'est parfait, je suis même étonné que Gemini a aussi bien compris le prompt.

06:04Et on va continuer dans cette idée d'assemblage.

06:06Et cette fois-ci, on va prendre une femme et un accessoire,

06:09et on va essayer de lier les deux.

06:12Voyons si ça marche.

06:14Ok, pas trop mal comme résultat.

06:16Et ça a plutôt bien marché.

06:17Et on pourrait continuer comme ça, à ajouter des éléments.

06:23Par exemple là, je vais lui demander,

06:25habille-la avec ce sweatshirt.

06:29Bon, avec le pull à motif, il a quand même eu un petit peu plus de mal.

06:33Si on réessaye en partant de zéro, voyons ce que ça donne.

06:37Et là, en partant de zéro, on a quand même deux meilleurs résultats.

06:39Et du coup, je me demande si on essaye de combiner tout à la fois.

06:44Ah, là on a un résultat pas trop mal.

06:45Peut-être que c'est la bonne façon de faire,

06:47quand on veut ajouter plusieurs éléments,

06:49de les combiner tous à la fois dans le même prompt.

06:52On continue nos tests.

06:53Cette fois-ci, on va lui demander de partir d'une photo pour créer un nouveau design.

06:56Et on va lui demander de faire de moi un astronaute.

07:00Avec un résultat plutôt convaincant.

07:02Quelques options d'édition supplémentaires qu'il est possible de réaliser.

07:06On va par exemple essayer de créer un mock-up avec ce t-shirt et le logo du Labo des réseaux.

07:11Bon, le résultat est pas trop mal.

07:12Bon, après, ça vaut pas la création de mock-up sur un outil comme Canva.

07:16Et d'ailleurs, on avait fait un tuto spécifique sur ce sujet.

07:19Si ça t'intéresse, n'hésite pas à aller le consulter.

07:22On va essayer l'édition de texte.

07:24Du coup, on va lui demander s'il peut changer le panneau et mettre Paris à la place de Rome.

07:29On a un bon résultat.

07:30Alors après, attention, il n'y avait pas beaucoup de lettres et l'indication était claire.

07:34Plus on va compliquer la demande, plus le résultat sera incertain.

07:37Par exemple là.

07:38Est-ce que tu peux écrire cinéma en haut du panneau ?

07:43Bon, là encore une fois, il s'en sort pas trop mal même si les résultats sont moins bons qu'avec l'exemple précédent.

07:48Enfin, dernier test, on va essayer l'expansion d'image.

07:52Et je vais lui demander peut-tu étendre cette image ?

07:55Fais-la deux fois plus grande.

07:57Et il a réussi sans trop de soucis.

07:59Dans cette vidéo, j'ai essayé de présenter un maximum d'exemples.

08:02Mais n'hésite pas à faire tes tests avec tes propres requêtes adaptées à tes besoins spécifiques.

08:06Car Gemini est parfaitement capable de comprendre ce que tu lui demandes de faire.

08:10Et c'est d'ailleurs un peu à quoi on doit s'attendre dans les prochains mois et les prochaines années avec toutes les IA.

08:15On va avoir des modèles plus intuitifs avec une utilisation simplifiée.

08:19Où le dialogue suffira simplement pour créer sans avoir besoin de passer par des fonctionnalités ou des manipulations spécifiques.

08:25Google l'a parfaitement compris avec ce modèle simple à utiliser mais qui permet de faire plein de choses.

08:30Si tu es intéressé par l'IA, je t'encourage à t'abonner à notre newsletter, le lien est en description et en commentaire épinglé.

08:35C'était Boris, merci et à bientôt sur le Labo des réseaux.

Google Gemini 2.0 Flash, une IA qui fait TOUT

Catégorie

Transcription

La boite à IA

Recommandations