· GO4IT · Actualités · 5 min read
Google Gemini 3.5 Flash et le retard de Gemini 3.5 Pro : la situation en juillet 2026
Google a lancé Gemini 3.5 Flash à Google I/O 2026, mais le déploiement de Gemini 3.5 Pro a glissé de juin à juillet. Entre départs de chercheurs et pression concurrentielle, décryptage de la situation.
Google traverse une période contrastée dans le domaine de l’IA en ce début juillet 2026. D’un côté, le lancement réussi de Gemini 3.5 Flash à Google I/O 2026 confirme les progrès du géant de Mountain View. De l’autre, le retard du très attendu Gemini 3.5 Pro et le départ de deux chercheurs stars vers OpenAI et Anthropic ont secoué l’entreprise.
Gemini 3.5 Flash : le nouveau modèle par défaut
Présenté lors de Google I/O en mai 2026, Gemini 3.5 Flash est devenu le modèle par défaut de l’application Gemini et d’AI Mode dans Google Search. Avec des performances de pointe sur les benchmarks de codage et d’agents (Terminal-Bench 2.1, MCP Atlas), il est environ 4 fois plus rapide que les autres modèles frontières pour un coût 2 à 3 fois inférieur.
Ses caractéristiques techniques incluent :
- Vitesse : ~4× plus rapide que les modèles comparables en tokens/s
- Coût : moitié à tiers du prix des modèles équivalents
- Agentic : support natif du Computer Use (juin 2026), permettant de naviguer dans des navigateurs et d’interagir avec des interfaces utilisateur
- Live Translate : traduction vocale fluide et naturelle
“Gemini 3.5 Flash offre des performances de niveau frontière à un prix qui le rend accessible pour un déploiement à grande échelle”, a déclaré Google lors de l’I/O.
Gemini 3.5 Pro : le retard qui fait jaser
Initialement attendu pour juin 2026, Gemini 3.5 Pro a été repoussé à juillet 2026. Ce retard, annoncé officiellement comme un “ajustement de calendrier technique”, a eu des conséquences financières : la maison-mère Alphabet a perdu environ 225 milliards de dollars de capitalisation boursière en une seule séance de trading.
Le retard serait dû à des difficultés de mise à l’échelle du modèle, qui promet une fenêtre de contexte de 2 millions de tokens et un mode “Deep Think” de raisonnement avancé. Selon les analystes, Google chercherait à atteindre un niveau de performance qui lui permette de rivaliser avec Claude Opus 4.8 et GPT-5.5.
Le départ de deux chercheurs stars
La situation a été aggravée par le départ de deux chercheurs de premier plan de Google DeepMind :
- Noam Shazeer (co-auteur de l’article fondateur “Attention Is All You Need”) a rejoint OpenAI
- John Jumper (prix Nobel pour AlphaFold) a rejoint Anthropic
Ces départs interviennent dans un contexte de concurrence féroce pour les talents en IA, où les salaires annuels des chercheurs de pointe dépassent régulièrement le million de dollars.
Gemini Omni Flash : la nouvelle génération multimodale
Le 30 juin 2026, Google a lancé Gemini Omni Flash en preview publique. Ce modèle multimodal haute performance est conçu pour la génération vidéo rapide (3 à 10 secondes en 720p) et l’édition vidéo conversationnelle. Il utilise l’Interactions API pour permettre des modifications en temps réel par dialogue.
Dans le même temps, Google a sorti Nano Banana 2 Lite, un modèle de génération d’images ultra-léger, et a intégré la génération d’images personnalisées dans l’application Gemini (Personal Intelligence).
L’écosystème Gemini en chiffres
Selon les dernières statistiques publiées par Google :
| Métrique | Valeur |
|---|---|
| Utilisateurs mensuels actifs (app Gemini) | 750 millions |
| Utilisateurs AI Overviews | ~2 milliards |
| Entreprises utilisant Gemini | 120 000+ |
| Tokens traités par minute (API) | 16 milliards |
| Part de marché trafic web IA | ~25 % |
Conclusion
Malgré les turbulences, Google reste un acteur majeur de l’IA avec Gemini 3.5 Flash qui rencontre un succès commercial certain. Le lancement imminent de Gemini 3.5 Pro en juillet 2026 sera un test décisif pour la capacité de Google à rivaliser avec OpenAI et Anthropic sur le segment des modèles frontières. Pour les entreprises B2B, le rapport qualité-prix de Gemini 3.5 Flash en fait une option sérieuse pour les déploiements à grande échelle.
Gemini Omni Flash : la génération vidéo par IA
Le 30 juin 2026, Google a lancé Gemini Omni Flash en preview publique. Ce modèle multimodal haute performance est conçu pour la génération vidéo rapide (3 à 10 secondes en 720p) et l’édition vidéo conversationnelle via l’Interactions API. Les créateurs de contenu et les équipes marketing peuvent désormais générer et modifier des vidéos par simple dialogue avec l’IA, sans compétences techniques.
Nano Banana 2 : la génération d’images personnalisée
Google a également déployé Nano Banana 2 (et sa version Lite), son modèle de génération d’images le plus avancé. Intégré dans l’application Gemini et Google Classroom, il permet aux enseignants de créer des infographies, des bandes dessinées et des supports visuels personnalisés. La fonctionnalité Personal Intelligence, déployée aux États-Unis, crée des images adaptées au contexte et aux préférences de chaque utilisateur.
L’intégration Apple : un tournant majeur
Le partenariat annoncé en janvier 2026 entre Google et Apple est confirmé pour un lancement dans l’année. Les futurs modèles Apple Foundation Models et Siri seront construits sur Gemini, ce qui pourrait exposer l’IA de Google à plus de 2 milliards d’appareils Apple actifs. Ce deal, estimé à environ 1 milliard de dollars par an, est le plus gros contrat d’intégration IA jamais signé.
Impact pour les entreprises B2B
Pour les startups et PME B2B, l’écosystème Gemini offre plusieurs avantages. Le coût de Gemini 3.5 Flash est compétitif, son intégration avec Google Workspace est transparente, et ses capacités agentiques (Computer Use) ouvrent des possibilités d’automatisation intéressantes. Le principal point d’attention reste le retard de Gemini 3.5 Pro, qui pourrait donner un avantage temporaire à Claude Fable 5 et GPT-5.5 sur le segment des modèles premium.