Gemini-App erhält KI-gestützte Audio-Zusammenfassungen
Google erweitert die Funktionalität seiner Gemini-App um ein weiteres Feature. Ab sofort können Nutzer ihre Dokumente und Präsentationen in Podcast-ähnliche Gespräche umwandeln lassen. Die Technologie dahinter stammt aus NotebookLM und generiert automatisch Diskussionen zwischen zwei KI-Moderatoren, die unterschiedliche Perspektiven einbringen. Leider funktioniert das Ganze nicht in der deutschen Sprache – noch nicht.
Die Bedienung gestaltet sich denkbar einfach: Nach dem Upload der gewünschten Dateien erscheint ein Vorschlag-Chip über der Eingabezeile. Ein Klick genügt, und die KI erstellt eine Audio-Zusammenfassung. Diese lässt sich sowohl über den Browser als auch in der mobilen App abspielen und für die Offline-Nutzung herunterladen. Das ist schon abgefahren gut, ich habe das mal mit diesem Text, den ihr gerade lest, gemacht. Hört selbst.
- roborock DuoRoller-Bürste Saug- und Wischroboter mit extremre Saugkraft von 5500 Pa. Die doppelten...
Besonders interessant ist die Funktion für Geschäftskunden und den Bildungsbereich. Nutzer können Unterrichtsnotizen, Lehrpläne, Forschungsarbeiten oder lange E-Mail-Konversationen einsprechen lassen. Die Audio-Überblicke helfen dabei, Inhalte auch beim Multitasking zu erfassen.
Allerdings gibt es neben der Ausgangssprache einige Einschränkungen: Das Feature steht ausschließlich Google-Workspace-Nutzern ab 18 Jahren zur Verfügung. Verfügbar ist die Funktion für zahlreiche Google Workspace-Editionen, darunter Business Starter bis Plus, Enterprise-Varianten sowie Education-Pakete. Auch Nutzer mit speziellen Gemini-Zusatzpaketen wie Business, Enterprise und Education können das Feature nutzen. Eine separate Aktivierung durch Administratoren ist nicht erforderlich.
- WARUM IPAD AIR − Das iPad Air ist leistungsstark, vielseitig und in zwei Größen erhältlich. Es kommt...
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Hammer. Einfach nur krass.
Mit bestimmten Befehlen bekommt man die beiden dazu, Deutsch zu sprechen. Und das ist der wahre Gamechanger.
Ja, nur leider verkacken die immer gegen Mitte der Dokuments und fangen an zu halluzinieren. Ich habe da verschiedene Hörspiel Skripte „besprechen“ lassen. Ab einem bestimmten Zeitpunkt erfinden die nicht vorhandene Handlungsstränge oder stellen vorhandene Handlungsstränge völlig falsch da. Da ist noch ne Menge Arbeit zu tun…
Meinst Du bei Gemini oder Notebook LM?
Bei Notebook LM gibt es noch ein Bereich, wo ich zusätzliche Infos zur Zusammenfassung eingeben kann. Dott soll man in englisch z.B. schreiben, dass die Sprecher Deutsch sprechen sollen, dass die Daten Deutsch sind und das alles Deutsch ausgegeben werden soll. Das klingt schon sehr gut. manchmal klingt es wie jemanden mit einem amerikanischen Akzent.
Genau. Da gibst du dann folgendes ein
Diese Episode richtet sich an ein ausschließlich deutschsprachiges Publikum:
– Die Hosts unterhalten sich ausschließlich auf Deutsch.
Du kannst natürlich auch noch dazu auffordern Witze oder andere Dinge in den Podcast einzubauen. Klappt recht gut.
Wo finde ich das in der App? Bisher nur im Browser gesehen.
(Galaxy S20, Android 13)