Google Gemini 2.0 vorgestellt: Effizienter, mächtiger und bald allgegenwärtig

Google DeepMind stellte heute die neue Version seiner KI-Plattform Gemini vor. Die Version 2.0 kommt nur zehn Monate nach dem Start von Version 1.5 auf den Markt und markiert einen wichtigen Meilenstein in der Entwicklung künstlicher Intelligenz, wie Google behauptet. Meilenstein – das war ja neulich auch das Wording beim Quantencomputer.

Demis Hassabis, CEO von Google DeepMind, betont in der Vorstellung die Leistungsfähigkeit des neuen Modells. Die erste verfügbare Variante, Gemini 2.0 Flash, erreicht bereits die Leistung des aktuellen Pro-Modells bei gleichbleibender Kosteneffizienz. Zu den Neuerungen gehören die native Generierung von Audio und Bildern sowie erweiterte multimodale Fähigkeiten.

Diese Funktionen bilden das Fundament für die nächste Generation der KI: autonome Agenten. Diese KI-Systeme sollen selbstständig Aufgaben für Nutzer ausführen können. Ein Beispiel dafür ist Project Astra, das Objekte erkennen und bei der Navigation helfen kann.

Google stellt außerdem neue Projekte vor: Die Chrome-Erweiterung Project Mariner kann den Webbrowser automatisiert steuern. Projekt Mariner ist ein früher Forschungsprototyp, das mit Gemini 2.0 entwickelt wurde und die Zukunft der Interaktion zwischen Mensch und Agent erforscht, beginnend mit dem Browser. Als Forschungsprototyp ist es in der Lage, Informationen auf dem Browserbildschirm zu verstehen und zu verarbeiten, einschließlich Pixeln und Webelementen wie Text, Code, Bildern und Formularen, und nutzt diese Informationen über eine experimentelle Chrome-Erweiterung, um Aufgaben für euch zu erledigen. Kann aber erst einmal nur von Googles vertrauten Testern genutzt werden.

Neu ist auch Jules. Der Agent Jules unterstützt Entwickler bei der Fehlersuche im Code. Ein weiterer Agent auf Basis von Gemini 2.0 kann Bildschirminhalte analysieren und Spielern Hilfestellung geben.

Hassabis sieht das Jahr 2025 als Beginn der Ära der KI-Agenten. Google plant, Gemini 2.0 in alle seine Dienste zu integrieren. Die KI wird künftig die AI Overviews in der Google-Suche antreiben, die bereits eine Milliarde Menschen erreichen. Auch Google Workspace und andere Produkte des Unternehmens werden von der neuen Technologie profitieren.

Apple Mac Mini Desktop-Computer mit M4 Chip mit 10 Core CPU und 10 Core GPU: 16 GB gemeinsamer Arbeitsspeicher, 256...
  • GANZ GROSS. IN GANZ KLEIN. – Der viel leistungsstärkere, viel kleinere Mac mini Desktop-Computer: 12,7...
Angebot
Apple 2024 MacBook Pro Laptop mit M4 Pro Chip mit 12-Core CPU und 16-Core GPU: 14,2" Liquid Retina XDR Display, 24...
  • MIT DER POWER DES M4 PRO ODER M4 MAX – Das 14" MacBook Pro mit M4 Pro oder M4 Max Chip bietet...
Apple iMac All-in-One Desktop-Computer mit M4 Chip mit 8 Core CPU und 8 Core GPU: 24" Retina Display, 16 GB...
  • BRILLLLLLANT – Der iMac ist der ultimative All in One Desktop-Computer. Mit der Power des M4 Chip und...

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

2 Kommentare

  1. Gerade hat mir mein Pixel-Handy Gemini Live angeboten und das hat wunderbar funktioniert. Habe meine gewünschte Stimme ausgewählt und mich dann mit ihr unterhalten. Selbst unterbrechen ging wunderbar. Nachdem ich die App beendet habe, kriege ich Gemini Live nicht mehr wieder. Es gibt den „Live-Button“ in Gemini nicht. Seltsam.

  2. Ich überlege gerade wobei mir so ein Agent im Browser genau helfen soll. Mir fällt aber nichts ein. Automatisch Formulare ausfüllen? Wie will er das entscheiden ohne dass ich das trigger und das geht ja jetzt auch schon. Na ich lass mich mal überraschen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.