Google a lancé Gemma 4, sa famille de modèles open source la plus intelligente à ce jour, conçue pour gérer une réflexion avancée et des défis autonomes. Construit en utilisant les mêmes recherches et technologies que les modèles phares Gemini 3, Gemma 4 est conçu pour fournir une « intelligence par paramètre », permettant aux développeurs d’IA de repousser les limites de l’IA sur des ressources locales limitées.
Cette sortie constitue une étape importante dans le « Gemmaverse », qui a été téléchargé plus de 400 millions de fois et généré plus de 100 000 copies depuis son lancement. Pour améliorer la productivité et la gouvernance numérique, Google a publié les fonctionnalités de Gemma 4 sous la licence commerciale Apache 2.0, donnant aux développeurs le pouvoir de gérer les données et l’infrastructure. Gemma 3 : Google lance sa nouvelle version légère d’IA basée sur Gemini 2.0, fournit une référence rapide, disponible en plusieurs tailles ; Voir Détails.
Gemma 4 : Différentes tailles pour différentes armes
Google lance Gemma 4 en quatre tailles différentes, conçues pour différents cas d’utilisation et environnements de bureau. Le modèle 31B Dense est actuellement classé troisième au monde dans le classement Arena AI, tandis que le modèle 26B Mixture of Experts (MoE) occupe la sixième place, soit un leader 20 fois sa taille.
Pour les ordinateurs de bureau et les appareils mobiles, Google a introduit les modèles Effective 2B (E2B) et Effective 4B (E4B). Ceci est mieux optimisé par la famille Google Pixel avec le matériel de Qualcomm et MediaTek. Ces petits modèles privilégient les capacités multimodales et le traitement à faible latence, fonctionnant hors ligne sur des appareils allant des smartphones aux unités Raspberry Pi.
Spécifications et fonctionnalités de Google Gemma 4
La famille Gemma 4 apporte un certain nombre d’avancées techniques conçues pour les utilisateurs professionnels. Les modèles prennent désormais en charge les « workflows d’agence », qui incluent les appels de service, la sortie JSON et les instructions d’action. Cela permet à l’IA de se connecter à des API externes et de créer elle-même des plans à plusieurs niveaux.
En termes de systèmes multimodaux, tous les types peuvent traiter des vidéos et des images, exceller dans des tâches telles que la reconnaissance de caractères (OCR) et comprendre des graphiques. Les modèles E2B et E4B incluent également un système audio standard pour la reconnaissance vocale. De plus, ces modèles prennent en charge plus de 140 langues et disposent de fenêtres supplémentaires, les modèles Edge prenant en charge 128 000 jetons et les grands modèles prenant en charge jusqu’à 256 000 jetons.
Pour garantir la disponibilité, les modèles 26B et 31B sont conçus pour prendre en charge un seul GPU NVIDIA H100 de 80 Go dans leur mode non calculé, tandis que les modèles calculés peuvent fonctionner sur des applications de jeux grand public. Cette première approche sur site permet aux postes de travail d’agir comme des agents d’IA privés sans nécessiter une connectivité cloud constante. Mode Grok Imagine Pro avec génération d’images et de vidéos 1080P lancé fin avril : Elon Musk.
Google garantit une prise en charge le jour même pour les principaux outils et plates-formes d’IA, notamment Hugging Face, NVIDIA NIM, Ollama et Kaggle. Les développeurs peuvent également étendre leurs projets de production à l’aide de Vertex AI ou de GKE de Google Cloud pour les services gérés. Pour promouvoir l’innovation, Google a également lancé le « Gemma 4 Good Challenge » sur Kaggle, invitant la communauté à créer des produits qui apportent un changement positif dans le monde.
(L’article ci-dessus a été publié pour la première fois sur NEWLY le 3 avril 2026 à 16 h 41 IST. Pour plus d’informations et de mises à jour sur la politique, le monde, les sports, le divertissement et le style de vie, visitez notre site Web Latestly.com).