L'application de Gemini continue de se développer. Il est même maintenant possible d'éditer des images en discutant avec le chatbot.

Le logo de l'application Gemini affiché sur un smartphone © Jackpress / Shutterstock
Le logo de l'application Gemini affiché sur un smartphone © Jackpress / Shutterstock

En un peu plus de deux ans, les chatbots alimenté par l'intelligence artificielle ont fait des avancées spectaculaires. On le voit aujourd'hui avec ChatGPT par exemple, sur lequel il est possible de transformer des images déjà existantes dans un nouveau style, comme on a pu le voir avec la mode Ghibli ou la mode Starter Pack. Gemini n'échappe pas à la règle, puisque l'application va permettre d'éditer les images au sein de l'interface.

Il est possible d'éditer des images avec des prompts

Il y a encore du nouveau du côté de Gemini. Alors que les développeurs pouvaient depuis déjà un certain temps éditer des images, au sein de Google AI Studio, cette fonctionnalité fait dorénavant son apparition dans l'application que vous pouvez télécharger dans le magasin d'applications.

Cela signifie qu'en discutant avec le chatbot, vous allez pouvoir lui indiquer quelles transformations vous souhaiteriez apporter à l'image qui se retrouve dans la discussion. En somme, vous allez pouvoir effectuer des éditions à l'aide de simples prompts !

Toutes les images auront un filigrane invisible

« Cette capacité d'édition intuitive en plusieurs étapes vous permet d'obtenir des réponses plus riches et plus contextuelles à vos messages, en intégrant du texte et des images. Par exemple, vous pouvez demander à Gemini de créer une première version d'une histoire sur les dragons pour l'heure du coucher et de fournir des images pour accompagner l'histoire » détaille de son côté Google.

À noter que Google veut jouer la transparence ici, et va intégrer à l'ensemble des images qui auront été éditées le fameux filigrane (watermark) invisible SynthID. De quoi permettre de garder un œil sur ce qui est généré par l'IA, et donc de faire la différence avec de véritables images. Cette fonction commence à être déployée, et sera disponible dans les prochaines semaines en 45 langues et dans la plupart des pays.

Source : Neowin

Google Gemini (Bard)
  • Un modèle de génération puissant
  • Une base de connaissances actualisée en temps réel
  • Gratuit et intégré à l'écosystème Google
8 / 10