Gemini 2.5-familie uitgebreid: Google serveert Pro, Flash en een ultradieetversie

Google breidt zijn Gemini 2.5‑modellen uit met een ultrazuinige variant: Flash‑Lite. Pro en Flash zijn nu productie‑klaar, met bedrijfsklaar AI‑gebruik als doel.

Gemini 2.5-familie uitgebreid: Google serveert Pro, Flash en een ultradieetversie

Google heeft deze week zijn Gemini‑familie flink opgefrist. De modellen Gemini 2.5 Pro en Flash zijn vanaf 17 juni 2025 officieel beschikbaar voor productieomgevingen. Tegelijk lanceert Google een nieuwe, razendsnelle en extreem zuinige variant: Gemini 2.5 Flash‑Lite (pre‑release)  .

Wat zit er in de update?

  • Pro: Google’s topmodel voor veeleisende taken zoals complex redeneren, codegeneratie en multimodaal gebruik. ‘Thinking’ is standaard aan, met een context tot maar liefst 1 miljoen tokens. Ideaal voor wetenschappelijke analyses, legacy-code migraties en geavanceerde AI-toepassingen  .
  • Flash: De iets lichtere tweelingbroer, ook met ‘thinking’, afgestemd op snelheid en efficiëntie. Nieuw is een aangepast prijsmodel: invoer kost $0,15/1M tokens, uitvoer $2,50/1M, tegenover vorige $3,50 .
  • Flash‑Lite (preview): de spartaanse sprinter onder de modellen. ‘Thinking’ staat uit als je puur op snelheid en kosten let, maar via een API kun je alsnog redeneren activeren. Perfect voor vertaling, classificatie en andere latency‑gevoelige micro-taken – met hogere benchmarks dan de oudere 2.0 versie  .

Waarom deze uitbreiding?

Google speelt strak in op de verschillende AI-behoeften:

  • Enterprise-ready: met Pro en Flash is het model klaar voor massale productie-inzet.
  • Kostenbewust: Flash‑Lite is speciaal bedoeld voor wie flitsende prestaties wil zonder bank te breken.
  • Flexibiliteit: ‘Thinking’ is overal instelbaar – wikken en wegen tussen kwaliteit en kosten  .

Breder platform‑support

Alle varianten zijn beschikbaar via AI Studio, Vertex AI, de Gemini‑app en zelfs Google Search. Extra tools zijn nu GA: Supervised Fine‑Tuning voor Flash, plus een preview‑API voor realtime audio-met-​audio-streaming  .

Reacties uit de industrie

Bedrijven als Snap, SmartBear en Connective Health hebben volgens Google al profijt van de nieuwe modellen in productie-omgevingen: sneller, slimmere workflows, en effectievere AI‑assistenten  .


Kort & krachtig

Model

Thinking

Snelheid & efficiëntie

Prijsindicatie

2.5 Pro

Aan

Top-prestatie, hoge kosten

Hoog

2.5 Flash

Aan

Snelle & stabiele productie

Middelmatig ↓

2.5 Flash‑Lite

Uit (default)

Ultra‑snel & goedkoop

Laag (preview)

Door de nieuwe structuur bedient Google zowel high-end enterprise-ontwikkelaars als snelle, lichte workflows.


Waarom dit ertoe doet

Google legt met deze segmentering een slimme strategie: verschillende modellen voor verschillende behoeftes, gecombineerd met beheersbare kosten én platformonafhankelijke beschikbaarheid. De combinatie van ‘thinking’ per use case, 1M‑token context, en tool‑integratie maakt Gemini een serieuze uitdager voor concurrenten zoals OpenAI.