KI-Revolution im Kleinen: Google präsentiert Gemma 3 für Einzelprozessor-Systeme
Google hat mit Gemma 3 eine neue Version seiner KI-Modellreihe vorgestellt, die besonders durch ihre Effizienz überzeugen soll. Das System wurde für den Einsatz auf einzelnen Grafikprozessoren oder TPUs optimiert und markiert damit einen Schritt in Richtung ressourcenschonender künstlicher Intelligenz. Die Entwicklung baut laut Google auf den Erfahrungen der vor einem Jahr eingeführten ersten Gemma-Modelle auf. Diese wurden als kompakte Varianten der Gemini-KI konzipiert. Gemma 3 beherrscht mehr als 35 Sprachen direkt und wurde für über 140 Sprachen vortrainiert. Die Einsatzmöglichkeiten erstrecken sich von mobilen Geräten bis zu leistungsstarken Arbeitsplatzrechnern.
In Leistungstests auf der LMArena-Plattform übertrifft Gemma 3 vergleichbare Systeme wie Llama-405B, DeepSeek-V3 und o3-mini. Die Optimierung für Nvidia-Grafikprozessoren und spezielle KI-Hardware ermöglicht Forschern und Entwicklern den Zugang zu hoher Rechenleistung ohne übermäßige Infrastrukturkosten.
Eine Neuerung ist das erweiterte Kontextfenster von 128.000 Token, das die Verarbeitung großer Informationsmengen ermöglicht. Der verbesserte Bildverarbeitungsteil unterstützt nun hochauflösende Bilder und verschiedene Bildformate. Google stellt interessierten Nutzern einen technischen Bericht zur Verfügung, der die Fähigkeiten des Systems detailliert beschreibt.
Mit ShieldGemma 2 führt Google parallel einen Bildfilter ein, der problematische, gewalthaltige oder explizite Inhalte erkennt. Diese Ergänzung gewinnt angesichts der zunehmenden Verbreitung KI-generierter Bilder an Bedeutung.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
ShieldGemma 2 ist wohl eher ein Hindernis. Ich benutze Gemini für die Bilderstellung und es wird soviel zensiert, dass es keinen Spaß macht. ChatGPT ist da schon wesentlich besser und Grok legt nochmals eine Schippe drauf. Letztlich wird die Entwicklung Richtung Open Source gehen, da die derzeitigen Einschränkungen einfach noch zu groß sind.
Bei dem Magic Editor auf dem Pixel verhält es sich ähnlich. Sollte sich nur ein menschliches Körperteil in der Nähe der gewollte Veränderung befindet verweigert der Editor seinen Dienst.
Bilderstellung kann man schon ganz gut lokal mit einer modernen GraKa wie 9070 XT machen. Open Source Modelle gibt es viele.
Ich hoffe wir kriegen in Gboard noch ein zuverlässigeres Speech to Text und Google muss dringend an den Google Übersetzer ran, das ist einfach nicht mehr zeitgemäß so viele Fehler zu machen.
Das würde mir Stunden pro Woche an Arbeit sparen. ich zahle gerne API Kosten, wenn man einen Key hinterlegen kann für solche Dienste.
ChatGPT kann doch beides ganz gut.