Sommaire
Ah, vous pensiez que Google allait se reposer sur ses lauriers après le lancement de Gemini ? Raté ! La firme de Mountain View ne chôme pas et présente aujourd’hui des améliorations conséquentes pour ses modèles d’IA conversationnels Gemini 1.5 Pro et 1.5 Flash. Cerise sur le gâteau, PaliGemma et Gemma 2 rejoignent la famille Gemma pour encore plus de possibilités. Allez, on déroule tout ça !
Gemini 1.5 Pro et Flash : que réservent les nouveautés ?
Commençons par Gemini 1.5 Pro, la vitrine technologique de Google. Cette nouvelle version promet une nette amélioration de la qualité dans des cas d’utilisation clés comme la traduction, le codage ou encore le raisonnement. Concrètement, le modèle devrait être plus à l’aise pour gérer des tâches complexes et vastes. Indispensable quand on sait à quel point les développeurs sont gourmands en intelligence artificielle de nos jours !
Mais ce n’est pas tout. Google a également dégainé Gemini 1.5 Flash, un modèle plus léger et rapide, optimisé pour les tâches à haute fréquence où la vitesse de réponse est primordiale. Adieu les temps d’attente interminables (ça me rappelle quand j’étais petit et que je devais patienter des heures pour que ma GameBoy se lance). Avec Flash, les conversations en temps réel ne seront plus un frein.
Les versions 1.5 Pro et 1.5 Flash sont toutes deux dotées d’une fenêtre contextuelle d’un million de jetons et vous permettent d’intercaler du texte, des images, de l’audio et de la vidéo en tant qu’entrées.
Multimodal et long contexte
Voilà, on vous l’a dit, les nouveaux Gemini 1.5 sont nativement multimodaux et gèrent un contexte long d’un million de jetons. Pour les moldus, ça signifie qu’ils peuvent ingurgiter du texte, des images, de l’audio et même de la vidéo en entrée. Ça promet des conversations riches et pertinentes, sans avoir à répéter le contexte toutes les 5 minutes (un comble pour des IA censées être intelligentes).
Et pour ceux qui auraient besoin d’encore plus de contexte (les maximalismes du code, quoi), Google propose d’accéder à une version de Gemini 1.5 Pro avec une fenêtre de 2 millions de jetons. Il suffit de s’inscrire sur la liste d’attente dans Google AI Studio ou Vertex AI pour les clients de Google Cloud. Un must pour les développeurs qui bossent sur des projets d’envergure.
Nouvelles fonctionnalités pour les développeurs et options de tarification pour l’API Gemini
Pfiou, on n’a pas fini ! Google a également ajouté deux nouvelles fonctionnalités à l’API Gemini : l’extraction d’images et de vidéos, ainsi que l’appel de fonction parallèle. Cette dernière permet de renvoyer plusieurs appels de fonction en même temps, un vrai gain de temps pour les devs pressés (et ils le sont tous, avouons-le).
En juin, Google ajoutera la mise en cache du contexte à Gemini 1.5 Pro, afin que vous n’ayez à envoyer qu’une seule fois au modèle les parties de votre message, y compris les fichiers volumineux.
Ah, et niveau tarification, Google a revu ses prix à la hausse. Mais avant de crier au loup, sachez que les limites tarifaires prises en charge par le nouveau service de paiement à l’utilisation ont également été augmentées. De quoi profiter de Gemini sans trop se ruiner (sauf si vous lancez des milliers de requêtes par seconde, mais à ce niveau-là, vous avez d’autres soucis à régler).
PaliGemma et Gemma 2 : la famille s’agrandit
Mais ce n’est pas tout ! Google en a également profité pour annoncer l’arrivée de PaliGemma, son tout premier modèle ouvert de langage de vision. Optimisé pour le sous-titrage d’images, les questions-réponses visuelles et d’autres tâches d’étiquetage d’images, PaliGemma rejoint les autres variantes pré-entraînées de Gemma, à savoir CodeGemma et RecurrentGemma.
Et comme si ça ne suffisait pas, Google a dévoilé Gemma 2, la nouvelle génération de sa famille de modèles d’IA. Attendue en juin, cette version promet d’offrir les meilleures performances de l’industrie aux tailles les plus utiles pour les développeurs. Le nouveau modèle Gemma 27B devrait notamment surpasser certains modèles plus de deux fois plus gros, tout en fonctionnant efficacement sur GPU ou un hôte TPU unique dans Vertex AI. De quoi ravir les amateurs de puissance brute !
Un concours pour les développeurs de l’API Gemini
Ah, j’allais oublier ! Google organise également un concours pour les développeurs de l’API Gemini. Jusqu’au 12 août, vous pouvez soumettre vos applications les plus créatives et percutantes construites avec les modèles Gemini. Un grand prix vous attend, alors n’hésitez pas à vous lancer (et à nous partager vos créations, qu’on puisse s’émerveiller).
Voilà, vous savez tout ! Gemini 1.5 Pro et Flash promettent d’être des outils puissants pour les développeurs en quête de performances et de rapidité. Avec l’arrivée de PaliGemma et Gemma 2, Google renforce sa position dans le domaine de l’IA conversationnelle et multimodale. De quoi donner des sueurs froides à la concurrence (et des nuits blanches aux développeurs qui vont devoir s’y mettre).
Résumé / TL;DR
- Google améliore ses modèles Gemini 1.5 Pro et 1.5 Flash pour plus de performances et de rapidité
- Gemini 1.5 Pro apporte des améliorations pour des tâches complexes comme la traduction et le codage
- Gemini 1.5 Flash est optimisé pour les tâches à haute fréquence nécessitant des réponses rapides
- Nouvelles fonctionnalités pour les développeurs et options de tarification pour l’API Gemini
- PaliGemma et Gemma 2 rejoignent la famille Gemma pour encore plus de possibilités
- Un concours pour les développeurs de l’API Gemini est lancé jusqu’au 12 août