Google a officiellement annoncé Gemini Omni, une avancée majeure dans son histoire de création d’intelligence artificielle pour combler le fossé entre la création d’images et de concepts complexes. Dévoilée lors de la conférence Google I/O 2026, la nouvelle famille de modèles permet aux utilisateurs de créer et d’éditer des vidéos de haute qualité en utilisant une combinaison transparente de texte, d’images, d’audio et de vidéo.
La première version de la série, Gemini Omni Flash, est désormais disponible dans le monde entier. Cet outil est conçu pour rendre le contenu vidéo accessible en remplaçant les temps de traitement à long terme par le traitement du langage naturel. Les utilisateurs peuvent interagir avec l’IA pour modifier l’apparence, modifier le style visuel ou modifier d’autres éléments de la vidéo, tout en conservant la flexibilité de plusieurs modifications.
Gemini Omni Édition conversationnelle et contrôle créatif
L’une des fonctionnalités les plus populaires de Gemini Omni Flash est la possibilité de traiter des vidéos de manière répétée via des langues naturelles. Chaque instruction donnée par l’utilisateur est basée sur l’expérience précédente, permettant des changements précis de la scène, de l’environnement, de l’éclairage et de l’action sans nécessiter de compétences techniques.
Ce modèle reflète également la compréhension actuelle des sciences de la Terre, notamment la gravité, l’énergie cinétique et la dynamique des fluides. Ces connaissances de base garantissent que les visuels générés non seulement dessinent des images, mais se déplacent également d’une manière qui correspond aux attentes logiques, ce qui aide les utilisateurs à créer des explications ou des séquences complexes à partir de concepts simples de haut niveau.
Gemini Omni Entrée et intégration multimodales flexibles
Gemini Omni Flash est conçu pour accepter n’importe quelle référence, permettant aux utilisateurs de combiner différents types de médias dans un format unique et compatible. Qu’il s’agisse d’une image dessinée à la main, d’un clip vidéo préexistant ou d’une image fixe, l’application combine ces pointeurs pour correspondre à la vision de l’utilisateur. Les futures mises à jour devraient étendre cette capacité pour inclure une variété de formats audio et vidéo.
Pour la personnalisation, Google a introduit une fonctionnalité d’avatar qui permet aux utilisateurs de créer leurs propres versions numériques. Bien que l’outil permette aux utilisateurs de créer des vidéos en fonction de leur voix et de leur apparence, Google a mis en place des règles de sécurité et des procédures de test strictes pour gérer correctement la technologie. Tous les produits fabriqués via Gemini Omni incluent une balise numérique SynthID pour garantir la transparence.
Disponibilité de Gemini Omni Flash dans le monde entier dans l’écosystème Google
Gemini Omni Flash est actuellement disponible pour les abonnés mondiaux des niveaux Google AI Plus, Pro et Ultra via le programme Gemini et Google Flow. De plus, Google étend l’accès en fournissant une technologie sans frais supplémentaires aux créateurs via YouTube Shorts et le programme YouTube Create. Les développeurs et les entreprises clientes peuvent s’attendre à ce que l’accès à l’API soit disponible dans les semaines à venir.
(L’article ci-dessus a été publié pour la première fois sur Latestly le 23 mai 2026 à 22 h 16 IST. Pour plus d’informations sur la politique, le monde, les sports, le divertissement et le style de vie, visitez notre site Web Latestly.com).