Stability AI: Generative Audio-Plattform „Stable Audio“ geht an den Start

Das Unternehmen Stability AI ist für seine Modelle für generative KI bekannt. Unter anderem gehört da „Stable Diffusion“ mit zum Portfolio. Die neue AI-Audio-Plattform „Stable Audio“ basiert ebenfalls auf demselben Diffusionsmodell, wird dann allerdings mit Audio-Inhalten statt Bildern trainiert.

Stable Audio ist eine latente Diffusions-Modell-Architektur für Audio. Diese ermöglicht die Kontrolle über Inhalt und Länge des generierten Audios. Hinzugefügt muss neben den Text-Metadaten auch Start- und Endzeit eines Songs. So lassen sich Audiodateien mit einer bestimmten Länge bis zur Größe der Trainingslänge erzeugen. Lässt sich beispielsweise verwenden, um Songs oder auch Hintergrundmusik zu erstellen. Audio-Samples und technische Hintergründe zeigt man an dieser Stelle.

Man sei damit herkömmlichen Audio-Diffusionsmodellen einen Schritt voraus. Diese werden oft mit zufällig geschnittenen Audioabschnitten trainiert, um die Trainingslänge aufzufüllen. Das Modell neigt dann allerdings auch dazu, willkürliche Abschnitte eines Liedes zu erzeugen, die in der Mitte einer musikalischen Phrase beginnen oder enden können. Nach Angaben des Unternehmens hat man das Modell mit mehr als 800.000 Audioinhalten (Musik, Soundeffekte etc.) trainiert.

Stable Audio gibt es in drei verschiedenen Abo-Stufen. In der kostenfreien Variante können Nutzer 45-sekündige Inhalte für 20 Tracks im Monat erstellen. Diese lassen sich dann aber auch nicht kommerziell nutze. Beim Professional-Abo für 11,99 US-Dollar sind es gar 500 Tracks mit 90 Sekunden, alles Weitere steht lediglich Unternehmen zur Verfügung.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Baujahr 1995. Technophiler Schwabe & Lehrer. Unterwegs vor allem im Bereich Smart Home und ständig auf der Suche nach neuen Gadgets & Technik-Trends aus Fernost. X; Threads; LinkedIn. Mail: felix@caschys.blog

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.
Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.