Google introducerar autonom AI agent


  • Google DeepMind lanserar Gemini 2.0, en ny AI-modell som är designad för den agentiska eran.

  • Gemini 2.0 har trippel kapacitet jämfört med tidigare versioner, inklusive stöd för bilder, ljud och verktygsanvändning.

  • Den experimentella modellen Gemini 2.0 Flash är nu tillgänglig för utvecklare och pålitliga testare, med bredare tillgång planerad till tidigt nästa år.

  • Gemini 2.0 möjliggör agentiska upplevelser genom projekt som Astra, Mariner och Jules.

Google har introducerat Gemini 2.0, en ny AI-modell avsedd för den “agentiska eran”, som erbjuder avancerade multimodala funktioner inklusive bild och ljudutgång samt verktygsanvändning.

Den nya modellen är nu tillgänglig för utvecklare och erbjuder förbättrad prestanda och kapabiliteter som gör det möjligt för AI-agenter att utföra komplexa uppgifter under mänsklig övervakning. Google betonar sitt åtagande att bygga AI på ett ansvarsfullt sätt med fokus på säkerhet och integritet.

Förbättrad prestanda och multimodalitet:

Gemini 2.0 utmärker sig genom sin förbättrade prestanda jämfört med tidigare versioner. Detta innebär att modellen är mer effektiv i att hantera komplexa uppgifter, bearbeta information och generera relevanta svar. En central aspekt av Gemini 2.0 är dess utökade multimodalitet.

Multimodalitet refererar till AI-systemets förmåga att förstå och integrera information från olika källor, såsom text, bilder, ljud och video. Denna förmåga gör det möjligt för Gemini 2.0 att hantera mer komplexa scenarier och förstå sammanhang på ett mer nyanserat sätt. Till exempel kan modellen analysera en bild tillsammans med en textbeskrivning för att få en djupare förståelse av innehållet.


https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/