Google Gemini: Neue Funktion auf Android-Smartphones wird verteilt

von caschy Jan. 28, 2025 | 19 Kommentare

Google erweitert die Funktionen seines KI-Assistenten Gemini auf dem Pixel wie angekündigt um eine weitere Live-Gesprächsfunktion. Diese ermöglicht es Nutzern, direkt mit der künstlichen Intelligenz über Bilder, PDF-Dateien und YouTube-Videos zu sprechen. Die Funktion ist über ein schwebendes Overlay erreichbar und zeigt sich in verschiedenen Kontexten. Bei YouTube erscheint die Option „Über das Video sprechen“, im Dateimanager „Über das PDF sprechen“ und bei Bildern „Über das Bild sprechen“.

Für Bildgespräche müssen Nutzer aktuell den Umweg über das Plus-Menü nehmen. Hier können sie entweder Bilder aus der Galerie auswählen oder neue Aufnahmen erstellen. Die direkte Screenshot-Funktion über „Über den Bildschirm“ funktioniert für die Live-Gespräche derzeit nicht. Nach Auswahl des gewünschten Inhalts öffnet sich die Gemini Live-Oberfläche.

Diese Entwicklung ist ein Vorläufer des Project Astra, das künftig Screen-Sharing und Video-Streaming während der Live-Gespräche mit Gemini ermöglichen soll (wir berichteten). Müsst mal schauen, ob ihr das auch schon habt, bzw. alles. Bei Videos funktionierte alles direkt bei mir, Webseiten waren noch etwas schwierig zu „befragen“. Übrigens: Laut Google wird aktuell auch Deep Research verteilt, allerdings nur für Gemini-Advanced-Abonnenten am Desktop:

Introducing Deep Research, your personal agentic AI research assistant. Rolling out starting today in Gemini Advanced.

With Deep Research, you can create in-depth research reports on complex topics, complete with source links, giving you hours of research at your fingertips in… pic.twitter.com/YMO466Ni6g

— Google Gemini App (@GeminiApp) December 11, 2024

#	Produkt	Preis
1	Ninja Foodi MAX Dual Zone Heißluftfritteuse [AF400EU] ‎2470 W, 9,5 l Fassungsvermögen, 2...	125,00 EUR	Bei Amazon ansehen
2	Russell Hobbs Heißluftfritteuse L 4L Rapid AirFryer [sehr kleines Gehäuse/7 Kochfunktionen/10...	51,99 EUR	Bei Amazon ansehen
3	Juskys Heißluftfritteuse 12L – Schwarz, Airfryer mit LCD-Touch, 10 Programmen, Temperatur...	79,99 EUR	Bei Amazon ansehen

Google Gemini 2.0 vorgestellt: Effizienter, mächtiger und bald allgegenwärtig

Google Gemini: Neues Design des Android-Assistenten wird ausgerollt

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

caschy

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Hans Wurst says:
28. Januar 2025 um 12:29 Uhr

Heute herausgefunden, dass man endlich wieder sein Smart Home steuern kann ohne das Phone entsperren zu müssen. Das ging damals mit Assistant, aber seit Gemini nicht mehr.
chris says:
28. Januar 2025 um 13:22 Uhr

AI oder KIT ist der selbe schwachsinn wie 3D Filme, Apple Vision Pro oder smarte Lautsprecher. Kurzfristiger Hype und dann juckt es keinen mehr weils unnötig ist
- ftf says:
  28. Januar 2025 um 13:52 Uhr
  
  das ist eine interessante These… vielleicht solltest du aber doch noch mal ein bisschen über das Thema nachdenken.
- olus says:
  28. Januar 2025 um 15:56 Uhr
  
  3d filme jucken mich nicht, apple vision pro juckt mich nicht, hab seit jahren die quest geräte, meine 2 google home minis nutze ich täglich. und ki/ai ist gekommen um zu bleiben. du liegst absolut falsch. aber hallo
- Vincent Vegas says:
  28. Januar 2025 um 17:05 Uhr
  
  Das sagte man auch über Computer, Telefone, das WWW …
- ppa says:
  28. Januar 2025 um 20:27 Uhr
  
  Ja, das ist alles Neuland.
- Gerd says:
  28. Januar 2025 um 22:00 Uhr
  
  „Internet ist auch nur ein Hype“ – Bill Gates, 1993
- Peter Esch says:
  29. Januar 2025 um 01:19 Uhr
  
  Da liegst du mit Sicherheit falsch
Marc says:
28. Januar 2025 um 13:33 Uhr

Damals hab ich Gemeni getestet und sofort wieder entsorgt als es raus gekommen ist. Konnte keinen Alarm stelllen, keinen Timer, keine Termine, einfach gar nichts.
Jedesmal wenn ich es testen will will es dann aber wieder Google Assistant ersetzen was ich nicht will.
Funktioniert es denn mittlerweile so „gut“ wie der Assistant oder ist Gemeni immer noch unbrauchbar?
Ich würde mich ja freuen wenn es besser wäre.
Versucht mal einen Alarm zu stellen mit dem Titel „Uhr aufladen“.
Egal ob Siri oder Google, da kommt nichts dabei heraus.
„Hey Google, neuer Alarm um 16 Uhr 25 Uhr aufladen.“
Mit Glück bekommt der Alarm den Namen „aufladen“, aber meistens kommt gar kein Titel.
- Buffed says:
  28. Januar 2025 um 14:09 Uhr
  
  „stelle einen alarm mit dem Titel Uhr aufladen um 16uhr 25“ so funktionierts mit gemini
- Nokiezilla says:
  28. Januar 2025 um 14:12 Uhr
  
  Funktioniert so weit alles bei mir. Stelle mir ständig Erinnerungen/Termine und Time mit Gemini.
- Benjamin says:
  28. Januar 2025 um 14:20 Uhr
  
  Klappt mit „Watch aufladen“ oder „Smartwatch aufladen“ oder „Armbanduhr aufladen“ einwandfrei. Man sollte dem System auch einräumen, dass es die Uhrzeit 16:25 grundsätzlich mit „Uhr“ beendet und entsprechend ein weiteres „Uhr“, so deutlich es auch gesprochen wird, ignoriert.
- Marcus says:
  28. Januar 2025 um 18:03 Uhr
  
  Einträge in den Terminkalender oder ToDos gehen leider nicht. Total nervig
Gerd says:
28. Januar 2025 um 14:26 Uhr

Wem willst du Einfluss auf dein Leben gewähren? G(oogl)emini, Fackbook, deinen Nachbarn , überhaupt jemanden oder einer Maschine?
Vincent Vegas says:
28. Januar 2025 um 17:03 Uhr

Gemini ist erschreckend dumm.

Ich wollte heute eine Erinnerung einrichten. Als sie mich fragte, für wann ich sie einrichten will, sagte ich „morgen“. Daraufhin erzählte sie mir, wie morgen das Wetter in meinem Ort wird. Ich habe es mehrmals erfolglos versucht. Genauso schlimm ist es, wenn ich sage: „Rufe Vorname Nachname an“. Als Antwort kommt: „Diese Person hat keinen Telefoneintrag.“ Ich habe dann mehrmals Vor- und Nachname einzeln versucht. Nach fünf Versuchen meinte sie plötzlich: „Ich rufe Vorname Nachname an“ und tat das dann auch.
Als ich sie fragte, wie morgen das Wetter wird, nannte sie einen falschen Tag. Auf meine Nachfrage hin teilte sie mir mit, dass sie den aktuellen Tag nicht kenne, wenn ich ihn ihr nicht nenne.
Da ist noch viel Luft nach oben.
Thomas says:
28. Januar 2025 um 19:05 Uhr

Falls noch jemand auf dem gleichen Schlauch (wie ich) steht: man muss während der entsprechenden Anzeige auf dem Display den Power-Button gedrückt halten um Gemini aufzurufen, dann erscheint das Overlay. Falls das allen anderen eh klar war, bitte diesen Kommentar überspringen.
port_shepstone says:
28. Januar 2025 um 22:08 Uhr

Nach vielen halbgaren Software- und Hardware-Produkten hat Google hier die Möglichkeit mal wieder ein bahnbrechendes Produkt zu liefern. ein umfangreicher Assistent, mit dem man in natürlicher Sprache jederzeit alles (Mögliche) erledigen kann.

Ich sah heute eine extrem vielversprechende Implementierung in einem prototypen Apple-Vision- Konkurrenten von Samsung (in einem MKBHD Video). Der Assistent hat Einfluss auf den Bildschirminhalt und kann in Apps aktiven ausführen.

Gemini muss auf allen Geräten ansprechbar sein, und weitreichende Funktionen, Eingriffe und auf alles erreichbare ausführen können. Das muss vollumfänglich durchdacht, über weiter gedacht, und für jeden zum gleichen extend nutzbar sein. Sonst wird es nichts.
Thorsten says:
29. Januar 2025 um 04:07 Uhr

Fragt mal Gemini. ChatGTP oder eine KI eurer Wahl wie viele r im Wort Erdbeere vorkommen. Stellt die Frage ruhig in verschiedenen Varianten. Ich bin auf eure Antworten gespannt.
- FriedeFreudeEierkuchen says:
  29. Januar 2025 um 12:11 Uhr
  
  Dass die LLMs bisher nicht zählen können, ist schon oft diskutiert worden. Du kannst z.B. einen Chatbot beauftragen dir eine Headline mit 30 Zeichen zu schreiben. ChatGPT wird dir hinter dem Text brav eine Zahl ausgeben, aber die angegebene Länge stimmt nie.
  Wenn man sich das Prinzip der aktuellen LLMs anschaut, kann so etwas auch ohne weitere hinzugeschraubte Module gar nicht funktionieren. Es müsste einen extra Algorithmus geben, der das Ergebnis prüft und dann wieder an das LLM zurück gibt. Das wäre aufwändig und rechenintensiv. Der grundsätzliche Fehler der aktuellen Modelle: es reicht nicht Millionen Texte zu lesen, man muss den Inhalt auch wirklich verstehen. Das kennt jeder aus der Schule: Es gab einige, die konnten sehr gut auswendig lernen. Das funktioniert bei lieblosen Abfrage-Arbeiten. Sobald aber Wissenstransfer gefragt war, sind sie gescheitert. Und genau dieses Problem haben die LLMs. Daher gehen viele KI-Forscher auch davon aus, dass der derzeitige Ansatz eine Sackgasse ist und neue Methoden gefunden werden müssen.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

Google Gemini: Neue Funktion auf Android-Smartphones wird verteilt

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

19 Kommentare

Umfrage des Monats

Diese Woche beliebt