"Créer n'importe quoi à partir de n'importe quoi": Google présente Gemini Omni, une IA capable de générer des vidéos à partir de texte, d’images et de sons 20.05.2026

Lors de sa conférence Google I/O le 19 mai, Google a dévoilé Gemini Omni Flash, un nouveau modèle d'IA révolutionnaire capable de générer et modifier des vidéos à partir de diverses sources telles que du texte, des images, des vidéos ou des sons. Cette technologie, considérée comme une évolution du système Nano Banana de l'année précédente, étend désormais les capacités de création aux formats vidéo, avec l'ambition future d'inclure la génération d'images et d'audio. Gemini Omni permet une grande flexibilité, acceptant des entrées multiples simultanément et offrant la possibilité de modifier des éléments spécifiques d'une scène par commande en langage naturel, tout en assurant une cohérence visuelle grâce à une compréhension approfondie du monde réel. L'outil vise également la création de vidéos explicatives et de contenus générés par des avatars numériques personnalisés. En réponse aux préoccupations croissantes concernant les deepfakes, Google intégrera le système de filigrane invisible SynthID à toutes les vidéos produites par Gemini Omni pour en assurer la traçabilité. Le déploiement de Gemini Omni Flash commence dès aujourd'hui pour les abonnés Google AI Plus, Pro et Ultra, et sera progressivement étendu à Youtube Shorts, Youtube Create, ainsi qu'aux développeurs via une API.














