Neue KI-Modelle für Video und Bild von Google vorgestellt

Google hat seine neuesten Entwicklungen im Bereich der KI-gestützten Video- und Bilderzeugung vorgestellt. Die neuen Modelle, Veo 2 für Videos und Imagen 3 für Bilder, versprechen eine deutliche Verbesserung in Qualität und Realismus. Diese Modelle sind jetzt in den Google Labs-Experimenten VideoFX, ImageFX und dem neuen Tool Whisk verfügbar. Wichtig zu wissen: Whisk startet erst einmal in den USA. Mööp.

Veo 2, die nächste Generation der Videogenerierung, erzeugt Videos in hoher Qualität mit einem breiten Spektrum an Motiven und Stilen. In direkten Vergleichen mit anderen führenden Modellen schnitt Veo 2 hervorragend ab – klar, was soll Google auch anderes sagen?

Das Modell verbessere das Verständnis von physikalischen Gesetzen und der Feinheiten menschlicher Bewegung und Mimik, was zu insgesamt realistischeren Ergebnissen führt. Veo 2 versteht auch die Sprache der Kinematografie. Es kann auf Anfragen nach Genres, Objektiven und filmischen Effekten eingehen und liefert Videos in 4K-Auflösung, die mehrere Minuten lang sein können. So sind Kamerafahrten, Nahaufnahmen mit geringer Tiefenschärfe und Aufnahmen mit spezifischen Objektiven wie einem 18mm-Objektiv (entspricht ca. 0,71 Zoll) problemlos umsetzbar.

Beispiele:

Google betont die Sicherheit und die verantwortungsvolle Entwicklung und hat die Verfügbarkeit von Veo 2 schrittweise erweitert. Die Ausgaben des Modells sind mit einem unsichtbaren SynthID-Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Veo 2 ist aktuell über VideoFX in Google Labs verfügbar. Eine Ausweitung auf YouTube Shorts und andere Produkte ist für das kommende Jahr geplant.

Auch das Bildgenerierungsmodell Imagen 3 hat ein Update erfahren. Es erzeugt nun hellere, besser komponierte Bilder und kann vielfältigere Kunststile darstellen – von Fotorealismus bis Anime. Es folgt den Prompts genauer und erzeugt reichhaltigere Details und Texturen. Auch hier wurden im Vergleich mit anderen führenden Modellen hervorragende Ergebnisse erzielt. Imagen 3 ist ab sofort in mehr als 100 Ländern über ImageFX in Google Labs zugänglich.

Zusätzlich wurde das oben erwähnte Whisk vorgestellt, ein neues Tool in Google Labs, mit dem Nutzer Bilder als Basis für ihre eigenen Kreationen verwenden können. Whisk kombiniert Imagen 3 mit den visuellen Fähigkeiten und Beschreibungsmöglichkeiten von Gemini. Gemini erstellt automatisch Bildunterschriften, die dann von Imagen 3 für die Bildgenerierung genutzt werden. So lassen sich Motive, Szenen und Stile auf neue Art kombinieren.

Apple Mac Mini Desktop-Computer mit M4 Chip mit 10 Core CPU und 10 Core GPU: 16 GB gemeinsamer Arbeitsspeicher, 256...
  • GANZ GROSS. IN GANZ KLEIN. – Der viel leistungsstärkere, viel kleinere Mac mini Desktop-Computer: 12,7...

Angebot
Apple 2024 MacBook Pro Laptop mit M4 Pro Chip mit 12-Core CPU und 16-Core GPU: 14,2" Liquid Retina XDR Display, 24...
  • MIT DER POWER DES M4 PRO ODER M4 MAX – Das 14" MacBook Pro mit M4 Pro oder M4 Max Chip bietet...

Angebot
Apple iMac All-in-One Desktop-Computer mit M4 Chip mit 8 Core CPU und 8 Core GPU: 24" Retina Display, 16 GB...
  • BRILLLLLLANT – Der iMac ist der ultimative All in One Desktop-Computer. Mit der Power des M4 Chip und...

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

7 Kommentare

  1. ImageFX wird mir ebenfalls für DEutschland als NICHT verfügbar angezeigt wenn man das anklickt

  2. Hmm, imagen 3 hab ich hier in Gemini Advanced die gante Zeit. Und in imagefx konnte man bereits Monate zuvor zwischen 2 und 3 wechseln.

  3. Erschreckend, wie schnell die Entwicklung voranschreitet. Natürlich sind das nur ausgewählte Beispiele und in der Realität sind viele Ergebnisse nich ganz so toll. Aber die Geschwindigkeit, in der KI verbessert wird und in der diese in unseren Alltag dringt, ist schon atemberaubend. Und darf einem Angst machen, denn die Entwicklung ist desruptiv und wird vieles in kurzer Zeit grundlegend verändern. Schauspieler und Drehbuchautoren werden nicht die einzigen sein, die sich um ihre Jobs fürchten.

    • Ich sehe es ähnlich, wie du es siehst. Das ganze geht extrem schnell und lässt einen fürchten, wie diese Technik zukünftig genutzt wird. Es ist an der Zeit, über ein Grundeinkommen für jeden Bürger zu sprechen und unsere gesamte Wirtschaft umzustellen. Der Mensch hat sich durchaus auf andere Sachen, wie heute fokussieren, aber dazu bedarf es staatliche Unterstützung, sowie faire Verteilung des Geldes. Leider sehe ich unsere Politik dazu nicht in der Lage und die Gesellschaft leider ebenfalls wenig. Da bedarf es ein starkes miteinander und dies existiert bei uns momentan nicht.

    • In der Realität sind die Ergebnisse teils noch weitaus besser, aber bereits lange vor dem Hype. Z.B. in diversen wissenschaftlichen Bereichen. Und Angst muss man kene haben. Es viel Wunschdenken vorhanden, viel Hype und es werden viele Dinge besser, aber es wird auch ein Plateau kommen. Und ab diesem Punkt gehts dann um Details, so dass die KI auch tatsächlich alltagstauglich wird.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.