Apple veröffentlicht Pico-Banana-400K: Neues KI-Modell für Text-to-Image-Editing

Apple überrascht aktuell mit zwei Projekten im Bereich KI-Bildbearbeitung: Dem Open-Source-Datensatz „Pico-Banana-400K“ und dem neuen Nano-Banana-Editing-Modell. Mit rund 400.000 Beispielen bietet Pico-Banana-400K Hunderttausende Bild–Text–Edit-Tripletts an. Dazu gehören Beispiele von „Färbe das Auto blau“ bis „Ersetze den Himmel durch eine Stadtsilhouette im Sonnenuntergang“. Die Bildbearbeitung erfolgte dabei automatisiert per KI. Die Bildanweisungen stammen von Gemini, die finale Bearbeitung und die Qualitätskontrolle übernimmt Nano-Banana und eine Bewertung durch Gemini-2.5-Pro.

Das Set deckt 35 Bearbeitungstypen in acht Kategorien ab: Von Color-Grading bis zu komplexen Objektaustauschs, Stiltransfers (z.B. „im Stil von Van Gogh“) oder Änderungen an Personen (z.B. „ändere den Gesichtsausdruck“). Enthalten sind auch Bearbeitungen mit mehreren Schritten und gescheiterte Bearbeitungsbeispiele, was wiederum gut für das Fine-Tuning von Modellen ist.

Damit liefert Apple der Forschung und der Community erstmals einen großen, qualitativ geprüften Datensatz aus echten Bildern inklusive KI-Bearbeitung. Die Daten sind öffentlich und stehen für Bereitwillige zur Verfügung.
Spannend zu sehen, dass Apple sich dafür das Modell von Google gegriffen hat. Das unterstreicht auch die Aussage, dass man sich mit mehreren Anbietern beschäftigen möchte und nicht nur auf OpenAI setzt. Ob Apple mit den Erkenntnissen etwas in iOS oder macOS anfangen wird, wird sich zeigen.
Zum Nachlesen könnt ihr euch das Paper und das GitHub-Projekt ansehen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Bin mal gespannt auf das nächste Update von Photomator und iOS 27 Foto App.
Ich auch. Habe Pixelmator und Photomator von Tag 1 des Release und bin täglicher Nutzer. Aber dass da aktuell weder Updates, noch Infos kommen, nervt schon gewaltig. Vor allem weil bei Photomator noch super viel fehlt und es eine gute Roadmap gab.
Der Artikel ist glaube ich ein wenig missverständlich. Der Titel suggeriert, dass es um ein KI-Modell ginge, Apple hat aber einen neuen Datensatz generiert, mehr auch nicht. Und zwar erstellt mit Nano-Banana, das von Google stammt. Generell wird nirgendwo Google erwähnt, auch nicht bei Gemini.
Google ist verlinkt, allerdings führt der Link zu 404 NOT FOUND 😀
Außer im letzten Absatz. Aber vielleicht kam der später hinzu.
der war schon vorher da
Gemini und Nano Banana, da war so viel Buzz drumrum, das ist denke ich den meisten Lesern des Blogs klar, dass es um Google geht. Im letzten Absatz steht auch Google nochmal separat.
Was heißt das jetzt ? Kommt das irgendwo bei Apple Intelligence rein ? Ich werde nicht schlau aus dem Artikel