Auf Google Gemini basierende KI soll euch Aufgaben abnehmen
Laut Berichten des US-Mediums The Information plant Google für Dezember die Vorstellung einen eignen KI-Assistenten. Das unter dem Codenamen »Project Jarvis« entwickelte Tool soll verschiedene Aufgaben für Nutzer ausführen – von Recherchen über Produktkäufe bis hin zu Flugbuchungen. Dies sollen drei direkt am Projekt beteiligte Personen bestätigt haben. »Project Jarvis« baut auf einer kommenden Version von Googles Gemini auf und läuft ausschließlich im Webbrowser.
Der Nutzer soll also seine Aufgaben im Browser automatisieren können, es analysiert laut Bericht auf Wunsch Bildschirmfotos und führt selbstständig Aktionen aus, wie das Klicken von Buttons oder die Texteingabe. Laut The Information benötigt das System in seiner aktuellen Version noch »einige Sekunden« zwischen den einzelnen Aktionen.
Interessant: Die Nachricht von Jarvis kommt kurz nachdem Anthropic eine umfassendere Funktion für seine Claude-KI eingeführt hat, die, wie es heißt, mit Fähigkeiten ausgestattet ist, einen Computer zu bedienen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Klicken die dann auch direkt auf den „Ich bin ein Mensch“ Knopf? Aber vielleicht sollte man sich Gedanken machen, wenn das Internet für Menschen unbedienbar wird und wir „KIs“ dafür brauchen. Nur so als Idee. Ich kann das bei z.B. Flugbuchungen nämlich zu 100% verstehen, dass man da gerne eine Unterstützung hätte…
Bald gibt es dann analog zu SEO eben AIAO (AI Agent Optimization) – und der künstlich intelligente Agent weiss dann ganz genau, dass der Kunde bei Flugbuchung natürlich gerne das Premium-Reiserücktrittspaket gekoppelt mit der Pro-Gepäckversicherung Ultimate und der FastTrack Boarding Experience für nur €99 zusätzlich haben muss.
Schönes Tool für Google umd die Werbung noch besser und personalisierter zu platzieren.
Bin mir nicht sicher ob allen bewusst ist, was mit den Daten aus der KI sich alles anstellen lässt.
Wenn die KI von Google kommt, anscheinend nicht viel.
Seit einer Woche nutze ich Google Android Auto in meinem Auto (!) und Google Maps bittet mich oft in der Zeitachse, ein Transportmittel hinzuzufügen.
Beispiel von heute: Hinweg zur Arbeit – Transportmittel hinzufügen; Rückweg von der Arbeit – Auto.
Intelligente Datennutzung geht anders, oder?
Na ja, die KI muss erst einmal mit genügend Daten gefütter werden, die ausnutzung kommt dann schon noch. Denn auch Google will nur dein bestes $$$$. Warum werden wohl Milliarden in KI System investiert? Meta investiert z.B. 40 Milliarden US Dollar in KI, nur so zum Spaß oder wegen der Steuer mal bestimmt nicht. Meta verschenkt sogar die KI Module obwohl Sie so viel Geld investiert haben. Gemeinsam mit Google beherrscht der Konzern den Online-Werbemarkt und setzte damit allein im ersten Quartal 2024 35,6 Milliarden Dollar um.
Bildschirmfotos analysieren- das liest man in letzter Zeit immer öfter…
Scheint deutlich einfacher zu sein als aus dem Quelltext heraus zu finden, welchen Button der Nutzer meint.
Google Gemini, auch in der Advance Variante, absolut nutzloses LLM. Neulich einen Test zwischen ChatGPT und Google Gemini gemacht, indem ich eine PHP-Seite um eine bestimmte Funktion erweitert haben wollte. Gleicher Prompt, Quellcode der Seite in beide gepastet, ChatGPT liefert den Code, inkl. der Änderung zurück. Google Gemini gibt Änderungen zurück, die zum Teil keinen Sinn ergeben und schreibt zwischendrin „hier den bisherigen Code“. Ich schreibe also, dass ich den gesamten Code inkl. der Änderungen haben möchte, kommt der Code wieder mit „hier den bisherigen Code“, also formuliere ich es verständlicher, dass ich den gesamten, vollständigen Code inkl. der Änderungen als Antwort haben möchte. Generiert er den Code und hört nach ca. 2/3 einfach auf und zeigt mir irgendeinen Link von einem Blog darunter. Ich schreibe also, dass Teile des Codes fehlen, Gemini schreibt wieder von vorne und hört an fast exakter Stelle wieder auf. Ich also nochmal, dass ich den gesamten Code haben möchte, wieder anders formuliert um sicherzugehen, dass es nicht am Prompt liegt, dann kam der Rest des Codes, der noch gefehlt hat. Tja, dummerweise hat die Anpassung dazu geführt, dass der Code Fehler enthalten hat und nichts mehr funktioniert hat. Im Gegensatz zu der Antwort vom ChatGPT, bei der die gewünschte Funktion sauber implementiert wurde. In meinen Augen bleibt Google Gemini einfach nur eine Erweiterung von Google Suche. Mehr ist das nicht.
Für die meisten Leute ist Gemini vermutlich als Erweiterung der Google-Suche relevant. Immerhin phantasieren die Antworten nicht herum, sondern basieren auf Google-Suchen, die man wenn’s wirklich wichtig ist auch leicht per Klick gegenchecken kann. Ne Frage an Garmini zu stellen ist einfacher, als Stichwörter an Google zu senden. Die YouTube-Zusammenfassungen sind praktisch. ChatGPT ist länger auf dem Markt und klar besser.