Apple veröffentlicht Pico-Banana-400K: Neues KI-Modell für Text-to-Image-Editing

Apple überrascht aktuell mit zwei Projekten im Bereich KI-Bildbearbeitung: Dem Open-Source-Datensatz „Pico-Banana-400K“ und dem neuen Nano-Banana-Editing-Modell. Mit rund 400.000 Beispielen bietet Pico-Banana-400K Hunderttausende Bild–Text–Edit-Tripletts an. Dazu gehören Beispiele von „Färbe das Auto blau“ bis „Ersetze den Himmel durch eine Stadtsilhouette im Sonnenuntergang“. Die Bildbearbeitung erfolgte dabei automatisiert per KI. Die Bildanweisungen stammen von Gemini, die finale Bearbeitung und die Qualitätskontrolle übernimmt Nano-Banana und eine Bewertung durch Gemini-2.5-Pro.

Das Set deckt 35 Bearbeitungstypen in acht Kategorien ab: Von Color-Grading bis zu komplexen Objektaustauschs, Stiltransfers (z.B. „im Stil von Van Gogh“) oder Änderungen an Personen (z.B. „ändere den Gesichtsausdruck“). Enthalten sind auch Bearbeitungen mit mehreren Schritten und gescheiterte Bearbeitungsbeispiele, was wiederum gut für das Fine-Tuning von Modellen ist.

Damit liefert Apple der Forschung und der Community erstmals einen großen, qualitativ geprüften Datensatz aus echten Bildern inklusive KI-Bearbeitung. Die Daten sind öffentlich und stehen für Bereitwillige zur Verfügung.

Spannend zu sehen, dass Apple sich dafür das Modell von Google gegriffen hat. Das unterstreicht auch die Aussage, dass man sich mit mehreren Anbietern beschäftigen möchte und nicht nur auf OpenAI setzt. Ob Apple mit den Erkenntnissen etwas in iOS oder macOS anfangen wird, wird sich zeigen.

Zum Nachlesen könnt ihr euch das Paper und das GitHub-Projekt ansehen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hauptberuflich im SAP-Geschäft tätig und treibt gerne Menschen an. Behauptet von sich den Spagat zwischen Familie, Arbeit und dem Interesse für Gadgets und Co. zu meistern. Hat ein Faible für Technik im Allgemeinen. Auch zu finden bei X (Twitter), Threads, Instagram, XING und Linkedin, per Website oder via Mail

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

8 Kommentare

  1. Bin mal gespannt auf das nächste Update von Photomator und iOS 27 Foto App.

    • Ich auch. Habe Pixelmator und Photomator von Tag 1 des Release und bin täglicher Nutzer. Aber dass da aktuell weder Updates, noch Infos kommen, nervt schon gewaltig. Vor allem weil bei Photomator noch super viel fehlt und es eine gute Roadmap gab.

  2. Der Artikel ist glaube ich ein wenig missverständlich. Der Titel suggeriert, dass es um ein KI-Modell ginge, Apple hat aber einen neuen Datensatz generiert, mehr auch nicht. Und zwar erstellt mit Nano-Banana, das von Google stammt. Generell wird nirgendwo Google erwähnt, auch nicht bei Gemini.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.