Neue KI-Modelle für Video und Bild von Google vorgestellt
Google hat seine neuesten Entwicklungen im Bereich der KI-gestützten Video- und Bilderzeugung vorgestellt. Die neuen Modelle, Veo 2 für Videos und Imagen 3 für Bilder, versprechen eine deutliche Verbesserung in Qualität und Realismus. Diese Modelle sind jetzt in den Google Labs-Experimenten VideoFX, ImageFX und dem neuen Tool Whisk verfügbar. Wichtig zu wissen: Whisk startet erst einmal in den USA. Mööp.
Veo 2, die nächste Generation der Videogenerierung, erzeugt Videos in hoher Qualität mit einem breiten Spektrum an Motiven und Stilen. In direkten Vergleichen mit anderen führenden Modellen schnitt Veo 2 hervorragend ab – klar, was soll Google auch anderes sagen?
Das Modell verbessere das Verständnis von physikalischen Gesetzen und der Feinheiten menschlicher Bewegung und Mimik, was zu insgesamt realistischeren Ergebnissen führt. Veo 2 versteht auch die Sprache der Kinematografie. Es kann auf Anfragen nach Genres, Objektiven und filmischen Effekten eingehen und liefert Videos in 4K-Auflösung, die mehrere Minuten lang sein können. So sind Kamerafahrten, Nahaufnahmen mit geringer Tiefenschärfe und Aufnahmen mit spezifischen Objektiven wie einem 18mm-Objektiv (entspricht ca. 0,71 Zoll) problemlos umsetzbar.
Beispiele:
Google betont die Sicherheit und die verantwortungsvolle Entwicklung und hat die Verfügbarkeit von Veo 2 schrittweise erweitert. Die Ausgaben des Modells sind mit einem unsichtbaren SynthID-Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Veo 2 ist aktuell über VideoFX in Google Labs verfügbar. Eine Ausweitung auf YouTube Shorts und andere Produkte ist für das kommende Jahr geplant.
Auch das Bildgenerierungsmodell Imagen 3 hat ein Update erfahren. Es erzeugt nun hellere, besser komponierte Bilder und kann vielfältigere Kunststile darstellen – von Fotorealismus bis Anime. Es folgt den Prompts genauer und erzeugt reichhaltigere Details und Texturen. Auch hier wurden im Vergleich mit anderen führenden Modellen hervorragende Ergebnisse erzielt. Imagen 3 ist ab sofort in mehr als 100 Ländern über ImageFX in Google Labs zugänglich.
Zusätzlich wurde das oben erwähnte Whisk vorgestellt, ein neues Tool in Google Labs, mit dem Nutzer Bilder als Basis für ihre eigenen Kreationen verwenden können. Whisk kombiniert Imagen 3 mit den visuellen Fähigkeiten und Beschreibungsmöglichkeiten von Gemini. Gemini erstellt automatisch Bildunterschriften, die dann von Imagen 3 für die Bildgenerierung genutzt werden. So lassen sich Motive, Szenen und Stile auf neue Art kombinieren.
- GANZ GROSS. IN GANZ KLEIN. – Der viel leistungsstärkere, viel kleinere Mac mini Desktop-Computer: 12,7...
- MIT DER POWER DES M4 PRO ODER M4 MAX – Das 14" MacBook Pro mit M4 Pro oder M4 Max Chip bietet...
- BRILLLLLLANT – Der iMac ist der ultimative All in One Desktop-Computer. Mit der Power des M4 Chip und...
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.
Du willst nichts verpassen?
Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.