Lancement de Google Gemini Omni Flash : le modèle d’IA multimodal met les vidéos interactives à la disposition du grand public

Google a officiellement annoncé Gemini Omni, une avancée majeure dans son histoire de création d’intelligence artificielle pour combler le fossé entre la création d’images et de concepts complexes. Dévoilée lors de la conférence Google I/O 2026, la nouvelle famille de modèles permet aux utilisateurs de créer et d’éditer des vidéos de haute qualité en utilisant une combinaison transparente de texte, d’images, d’audio et de vidéo.

La première version de la série, Gemini Omni Flash, est désormais disponible dans le monde entier. Cet outil est conçu pour rendre le contenu vidéo accessible en remplaçant les temps de traitement à long terme par le traitement du langage naturel. Les utilisateurs peuvent interagir avec l’IA pour modifier l’apparence, modifier le style visuel ou modifier d’autres éléments de la vidéo, tout en conservant la flexibilité de plusieurs modifications.

Gemini Omni Édition conversationnelle et contrôle créatif

L’une des fonctionnalités les plus populaires de Gemini Omni Flash est la possibilité de traiter des vidéos de manière répétée via des langues naturelles. Chaque instruction donnée par l’utilisateur est basée sur l’expérience précédente, permettant des changements précis de la scène, de l’environnement, de l’éclairage et de l’action sans nécessiter de compétences techniques.

Ce modèle reflète également la compréhension actuelle des sciences de la Terre, notamment la gravité, l’énergie cinétique et la dynamique des fluides. Ces connaissances de base garantissent que les visuels générés non seulement dessinent des images, mais se déplacent également d’une manière qui correspond aux attentes logiques, ce qui aide les utilisateurs à créer des explications ou des séquences complexes à partir de concepts simples de haut niveau.

Gemini Omni Entrée et intégration multimodales flexibles

Gemini Omni Flash est conçu pour accepter n’importe quelle référence, permettant aux utilisateurs de combiner différents types de médias dans un format unique et compatible. Qu’il s’agisse d’une image dessinée à la main, d’un clip vidéo préexistant ou d’une image fixe, l’application combine ces pointeurs pour correspondre à la vision de l’utilisateur. Les futures mises à jour devraient étendre cette capacité pour inclure une variété de formats audio et vidéo.

Pour la personnalisation, Google a introduit une fonctionnalité d’avatar qui permet aux utilisateurs de créer leurs propres versions numériques. Bien que l’outil permette aux utilisateurs de créer des vidéos en fonction de leur voix et de leur apparence, Google a mis en place des règles de sécurité et des procédures de test strictes pour gérer correctement la technologie. Tous les produits fabriqués via Gemini Omni incluent une balise numérique SynthID pour garantir la transparence.

Disponibilité de Gemini Omni Flash dans le monde entier dans l’écosystème Google

Gemini Omni Flash est actuellement disponible pour les abonnés mondiaux des niveaux Google AI Plus, Pro et Ultra via le programme Gemini et Google Flow. De plus, Google étend l’accès en fournissant une technologie sans frais supplémentaires aux créateurs via YouTube Shorts et le programme YouTube Create. Les développeurs et les entreprises clientes peuvent s’attendre à ce que l’accès à l’API soit disponible dans les semaines à venir.

Standard:5

TruLY Score 5 – Fiable | Sur une échelle de confiance de 0 à 5, cet article a obtenu une note de 5 sur Récent. Il est vérifié via des sources officielles (Google). Les informations sont minutieusement recherchées et vérifiées. Vous pouvez partager cet article en toute confiance avec vos amis et votre famille, sachant qu’il est fiable et digne de confiance.

(L’article ci-dessus a été publié pour la première fois sur Latestly le 23 mai 2026 à 22 h 16 IST. Pour plus d’informations sur la politique, le monde, les sports, le divertissement et le style de vie, visitez notre site Web Latestly.com).

Enlace de origen

Related Stories

Rusia modifica los aviones Yak-52 y An-2 de la era soviética para convertirlos en drones interceptores FPV lanzados desde el aire

La cita del día del cofundador de Netscape, Marc Andreessen: “El software se está comiendo el mundo”: una evaluación brutal del panorama tecnológico moderno

Oracle obtuvo un contrato con el Pentágono por 10 años y 7 mil millones de dólares para suministrar software y servicios vitales al departamento de guerra

You may have missed

L’entraîneur-chef Andy Reid partage de grandes nouvelles sur la blessure de Patrik Mahomes en pré-saison alors que Travis Kelce et ses collègues commencent le camp d’entraînement

La económica ute eléctrica de Ford utilizará Apple Maps

Las entradas baratas para el Juego de Estrellas de la WNBA cuestan $185

Laura Loomer révèle pourquoi elle est allée en Ukraine pour interroger Volodymyr Zelensky à propos de la cocaïne et donne des conseils à Trump sur la façon de traiter avec Poutine