Google déploie une série de mises à jour dans le domaine de l’IA générative, y compris un nouvel outil de génération d’images à partir de texte.
Ce qui distingue ImageFX, c’est son interface qui propose des “puces expressives”. L’objectif est de faciliter les expérimentations rapides avec les différentes dimensions de vos créations et idées.
Introducing #ImageFX ✨ a new image generation tool powered by Imagen 2, Google’s most advanced text-to-image model. We’re excited to add this to our suite of generative AI tools at Labs, and to help bring your most creative ideas to life. Try it out: https://t.co/e07Zz3Pdx4 pic.twitter.com/MVXEEt9c2b
— labs.google (@labsdotgoogle) February 1, 2024
Avec le lancement d’ImageFX, Google annonce également des améliorations pour MusicFX et TextFX. La société affirme avoir optimisé le modèle MusicLM, permettant une génération musicale plus rapide et une qualité audio supérieure, enrichie de nouvelles fonctionnalités. Les morceaux générés peuvent désormais durer jusqu’à 70 secondes. Quant à TextFX, Google a introduit des mises à jour pour améliorer la navigation et l’expérience utilisateur globale.
Les images créées par ImageFX et l’audio produit par MusicFX sont marqués par SynthID, un filigrane numérique qui clarifie leur origine IA, particulièrement lorsqu’ils sont affichés dans la recherche ou Chrome. Les créations ImageFX incluront également des métadonnées IPTC, offrant selon Google, plus d’informations aux utilisateurs lorsqu’ils rencontrent ces images générées par IA.
Seuls les habitants des États-Unis, du Kenya, de la Nouvelle-Zélande et de l’Australie peuvent tester ces outils nouveaux ou améliorés dans l’AI Test Kitchen dès aujourd’hui, disponibles uniquement en anglais pour le moment.
Le modèle Imagen 2 alimente les nouvelles fonctionnalités de génération d’image d’ImageFX. Il est également au cœur des nouvelles options d’IA générative dans Bard, Recherche, Publicités, Duet AI dans Workspace et Vertex AI. Google indique que Imagen 2 permet d’obtenir des images générées par IA de la plus haute qualité à ce jour. Le modèle évite les artefacts et améliore les aspects de la génération d’image qui posaient problème jusqu’à présent.
De plus, Google mentionne avoir réalisé des “investissements significatifs” dans la sécurité des données d’entraînement d’Imagen 2, ajoutant des garde-fous pour “limiter les sorties problématiques telles que le contenu violent, offensant ou sexuellement explicite, tout en appliquant des filtres pour réduire le risque de générer des images de personnes nommément identifiées”. Ceci grâce à la capacité améliorée du modèle à produire des images photoréalistes. La société réalise également un “test adversarial étendu” pour détecter et réprimer le contenu potentiellement problématique et nuisible.
Par ailleurs, Gemini Pro dans Bard est désormais plus largement disponible. Il est accessible dans plus de 40 langues et dans plus de 230 pays et territoires. À partir d’aujourd’hui, Google permet également à la plupart des pays de générer des images dans Bard en anglais gratuitement. Ces images incluront les filigranes SynthID.