Stability AI: Generative Audio-Plattform „Stable Audio“ geht an den Start
Das Unternehmen Stability AI ist für seine Modelle für generative KI bekannt. Unter anderem gehört da „Stable Diffusion“ mit zum Portfolio. Die neue AI-Audio-Plattform „Stable Audio“ basiert ebenfalls auf demselben Diffusionsmodell, wird dann allerdings mit Audio-Inhalten statt Bildern trainiert.
Stable Audio ist eine latente Diffusions-Modell-Architektur für Audio. Diese ermöglicht die Kontrolle über Inhalt und Länge des generierten Audios. Hinzugefügt muss neben den Text-Metadaten auch Start- und Endzeit eines Songs. So lassen sich Audiodateien mit einer bestimmten Länge bis zur Größe der Trainingslänge erzeugen. Lässt sich beispielsweise verwenden, um Songs oder auch Hintergrundmusik zu erstellen. Audio-Samples und technische Hintergründe zeigt man an dieser Stelle.
Man sei damit herkömmlichen Audio-Diffusionsmodellen einen Schritt voraus. Diese werden oft mit zufällig geschnittenen Audioabschnitten trainiert, um die Trainingslänge aufzufüllen. Das Modell neigt dann allerdings auch dazu, willkürliche Abschnitte eines Liedes zu erzeugen, die in der Mitte einer musikalischen Phrase beginnen oder enden können. Nach Angaben des Unternehmens hat man das Modell mit mehr als 800.000 Audioinhalten (Musik, Soundeffekte etc.) trainiert.
Stable Audio gibt es in drei verschiedenen Abo-Stufen. In der kostenfreien Variante können Nutzer 45-sekündige Inhalte für 20 Tracks im Monat erstellen. Diese lassen sich dann aber auch nicht kommerziell nutze. Beim Professional-Abo für 11,99 US-Dollar sind es gar 500 Tracks mit 90 Sekunden, alles Weitere steht lediglich Unternehmen zur Verfügung.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.
Du willst nichts verpassen?
Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.