Neue KI-Modelle für Video und Bild von Google vorgestellt
Google hat seine neuesten Entwicklungen im Bereich der KI-gestützten Video- und Bilderzeugung vorgestellt. Die neuen Modelle, Veo 2 für Videos und Imagen 3 für Bilder, versprechen eine deutliche Verbesserung in Qualität und Realismus. Diese Modelle sind jetzt in den Google Labs-Experimenten VideoFX, ImageFX und dem neuen Tool Whisk verfügbar. Wichtig zu wissen: Whisk startet erst einmal in den USA. Mööp.
Veo 2, die nächste Generation der Videogenerierung, erzeugt Videos in hoher Qualität mit einem breiten Spektrum an Motiven und Stilen. In direkten Vergleichen mit anderen führenden Modellen schnitt Veo 2 hervorragend ab – klar, was soll Google auch anderes sagen?
Das Modell verbessere das Verständnis von physikalischen Gesetzen und der Feinheiten menschlicher Bewegung und Mimik, was zu insgesamt realistischeren Ergebnissen führt. Veo 2 versteht auch die Sprache der Kinematografie. Es kann auf Anfragen nach Genres, Objektiven und filmischen Effekten eingehen und liefert Videos in 4K-Auflösung, die mehrere Minuten lang sein können. So sind Kamerafahrten, Nahaufnahmen mit geringer Tiefenschärfe und Aufnahmen mit spezifischen Objektiven wie einem 18mm-Objektiv (entspricht ca. 0,71 Zoll) problemlos umsetzbar.
Beispiele:
Google betont die Sicherheit und die verantwortungsvolle Entwicklung und hat die Verfügbarkeit von Veo 2 schrittweise erweitert. Die Ausgaben des Modells sind mit einem unsichtbaren SynthID-Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Veo 2 ist aktuell über VideoFX in Google Labs verfügbar. Eine Ausweitung auf YouTube Shorts und andere Produkte ist für das kommende Jahr geplant.
Auch das Bildgenerierungsmodell Imagen 3 hat ein Update erfahren. Es erzeugt nun hellere, besser komponierte Bilder und kann vielfältigere Kunststile darstellen – von Fotorealismus bis Anime. Es folgt den Prompts genauer und erzeugt reichhaltigere Details und Texturen. Auch hier wurden im Vergleich mit anderen führenden Modellen hervorragende Ergebnisse erzielt. Imagen 3 ist ab sofort in mehr als 100 Ländern über ImageFX in Google Labs zugänglich.
Zusätzlich wurde das oben erwähnte Whisk vorgestellt, ein neues Tool in Google Labs, mit dem Nutzer Bilder als Basis für ihre eigenen Kreationen verwenden können. Whisk kombiniert Imagen 3 mit den visuellen Fähigkeiten und Beschreibungsmöglichkeiten von Gemini. Gemini erstellt automatisch Bildunterschriften, die dann von Imagen 3 für die Bildgenerierung genutzt werden. So lassen sich Motive, Szenen und Stile auf neue Art kombinieren.
- GANZ GROSS. IN GANZ KLEIN. – Der viel leistungsstärkere, viel kleinere Mac mini Desktop-Computer: 12,7...
- MIT DER POWER DES M4 PRO ODER M4 MAX – Das 14" MacBook Pro mit M4 Pro oder M4 Max Chip bietet...
- BRILLLLLLANT – Der iMac ist der ultimative All in One Desktop-Computer. Mit der Power des M4 Chip und...
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
ImageFX wird mir ebenfalls für DEutschland als NICHT verfügbar angezeigt wenn man das anklickt
Exakt, und das ging zuvor mal. Man konnte einfach USA wählen und wurde dann freigeschaltet später.
Hmm, imagen 3 hab ich hier in Gemini Advanced die gante Zeit. Und in imagefx konnte man bereits Monate zuvor zwischen 2 und 3 wechseln.
Erschreckend, wie schnell die Entwicklung voranschreitet. Natürlich sind das nur ausgewählte Beispiele und in der Realität sind viele Ergebnisse nich ganz so toll. Aber die Geschwindigkeit, in der KI verbessert wird und in der diese in unseren Alltag dringt, ist schon atemberaubend. Und darf einem Angst machen, denn die Entwicklung ist desruptiv und wird vieles in kurzer Zeit grundlegend verändern. Schauspieler und Drehbuchautoren werden nicht die einzigen sein, die sich um ihre Jobs fürchten.
Ich sehe es ähnlich, wie du es siehst. Das ganze geht extrem schnell und lässt einen fürchten, wie diese Technik zukünftig genutzt wird. Es ist an der Zeit, über ein Grundeinkommen für jeden Bürger zu sprechen und unsere gesamte Wirtschaft umzustellen. Der Mensch hat sich durchaus auf andere Sachen, wie heute fokussieren, aber dazu bedarf es staatliche Unterstützung, sowie faire Verteilung des Geldes. Leider sehe ich unsere Politik dazu nicht in der Lage und die Gesellschaft leider ebenfalls wenig. Da bedarf es ein starkes miteinander und dies existiert bei uns momentan nicht.
@hugo: Hast du zufällig das Buch von Ray Kurzweil und der Singularität um 2045 gelesen? 😀
In der Realität sind die Ergebnisse teils noch weitaus besser, aber bereits lange vor dem Hype. Z.B. in diversen wissenschaftlichen Bereichen. Und Angst muss man kene haben. Es viel Wunschdenken vorhanden, viel Hype und es werden viele Dinge besser, aber es wird auch ein Plateau kommen. Und ab diesem Punkt gehts dann um Details, so dass die KI auch tatsächlich alltagstauglich wird.