Gemini (Google DeepMind)

Famille de LLMs multimodaux de Google DeepMind, intégrée dans Google Cloud et Workspace.

Gemini est la famille de modèles de langage multimodaux développée par Google DeepMind, lancée décembre 2023 (Gemini 1.0). Conçue nativement multimodale (text + image + audio + video) — pas adapt-after du text-only comme la plupart des concurrents. Successeur du PaLM 2.

Versions : Gemini 1.0 (Ultra, Pro, Nano on-device), Gemini 1.5 (Pro, Flash — context jusqu'à 2M tokens), Gemini 2.0 (Flash native multimodal), Gemini 2.5 et au-delà.

Différenciateurs : (1) très long contexte (jusqu'à 2M tokens Gemini 1.5 Pro) ; (2) native multimodal (Audio, Vision, Video) ; (3) integration Google ecosystem (Workspace : Gmail, Docs, Sheets, Slides, Meet AI features powered by Gemini ; Search AI Overviews ; YouTube ; Android via Pixel devices) ; (4) Gemini Nano on-device (small model running locally Pixel/Samsung devices) ; (5) Vertex AI integration (enterprise API, fine-tuning, grounding via Google Search) ; (6) competitive pricing (Gemini Flash très cheap pour high volume).

Distribution : (1) gemini.google.com (consumer) ; (2) Google AI Studio (developer playground free tier) ; (3) Gemini API ; (4) Vertex AI (enterprise) ; (5) intégré dans tous produits Google. Concurrents : OpenAI GPT, Anthropic Claude, Meta Llama. Compétences AI-102, PMLE.

Préparez vos certifications IT gratuitement