OpenAI a franchi une étape majeure dans la création de contenus visuels et animés grâce à l’intelligence artificielle. La génération de médias est désormais quasi instantanée, éliminant pratiquement tout temps d’attente.
Avec un nouveau modèle, l’IA produit des images et vidéos 50 fois plus rapidement, tout en maintenant une qualité optimale. Cette avancée repose sur un procédé en deux étapes.
Une alternative aux modèles de diffusion classiques
Les modèles de diffusion classiques, couramment utilisés pour générer des médias, nécessitent des centaines d’étapes de débruitage progressif. Bien que performants, ils sont gourmands en ressources et en temps de calcul.
Pour pallier ces limites, Cheng Lu et Yang Song d’OpenAI ont mis au point un “modèle de cohérence en temps continu” (sCM). Ce modèle réduit le processus de création à seulement deux étapes, tout en produisant des résultats de qualité supérieure aux méthodes traditionnelles.
Doté de plus de 1,5 milliard de paramètres, le sCM génère une image en seulement 0,11 seconde sur un processeur A100. En comparaison, les modèles précédents nécessitent plusieurs secondes et une puissance de calcul nettement plus élevée.
Cette rapidité ouvre la voie à des applications en temps réel, particulièrement dans les secteurs de l’image, de la vidéo et même de l’audio.
Lors des tests, le sCM a démontré une qualité d’image comparable aux meilleurs modèles de diffusion. Son score FID (Fréchet Inception Distance), qui évalue la qualité des images générées, est inférieur de seulement 10 % à celui des leaders du domaine.
En réduisant considérablement les ressources nécessaires, le sCM représente une alternative plus durable et accessible que les modèles actuels. Cependant, cette démocratisation pourrait entraîner une hausse de la consommation énergétique globale, un défi qu’OpenAI espère surmonter en optimisant davantage le modèle.
Vers une nouvelle ère de l’IA générative
Le sCM pose les bases d’une technologie de génération ultra-rapide, ouvrant la porte à des applications industrielles exigeantes et, à terme, à des contenus produits en temps réel avec une fluidité et une qualité inédites. Cette innovation laisse entrevoir un futur où l’IA révolutionnera encore davantage la création de médias.









