NVIDIA RTX Voice: Neues Plugin für RTX-Besitzer entfernt nahezu alle Umgebungsgeräusche dank KI
NVDIA hat ein neues Plugin als Beta für alle Besitzer einer NVIDIA GeForce RTX beziehungsweise Quadro RTX am Start, das sich RTX Voice nennt und quasi als übermächtiger Filter für Umgebungsgeräusche beim Sprechen in Sprach-Chats, Videokonferenzen oder Live-Übertragungen beim Zocken funktioniert. Auch wenn das Ganze noch als Beta betitelt wird, funktioniert es schon außerordentlich beeindruckend, wie das nachstehende Video zeigt:
RTX Voice emuliert dabei ein zusätzliches Mikrofon und auch Lautsprecher innerhalb eures Systems, welche dann in vielen bekannten Diensten eingesetzt werden können. Hierzu zählen unter anderem OBS Studio, Streamlabs, XSplit Broadcaster, XSplit Gamecaster, Twitch Studio, Discord, Google Chrome und der Battle.net Chat. Etwas fehlerbehaftet, aber nutzbar, läuft RTX Voice in Verbindung mit WebEx, Skype, Zoom und Slack.
Im Steam Chat muss wiederum die im Dienst verfügbare Funktion „Noise Cancellation“ deaktiviert werden, damit RTX Voice keine Probleme macht. Ich finde das Plugin auf jeden Fall spannend und bin überrascht, wie gut das alles schon zu funktionieren scheint. Mich würde interessieren, ob auch andere Stimmen so zuverlässig von der KI erkannt und herausgefiltert werden, wie die Geräusche, die dem Sprecher von der Software nicht zugeordnet werden können.
Soll doch auch bei GTX Karten funktionieren.
Ja funktioniert auch bei GTX Karten, wenn man vorher die Fehlermeldung aus der config löscht
Allerdings ist das dann nur noch für Büroarbeiten tauglich, weil sie im Gegensatz zur RTX Karten wohl stark in die Knie gehen und gleichzeitig spielen wohl kaum noch möglich ist – so hab ich das gelesen. Aber in Zeiten von Home-Office auch ne gute Sache 😉
Auf meiner GTX1660ti funktioniert das beim Spielen problemlos nebenher (Witcher 3 in 4k sowie CoD Warzone)
Interessant…danke 🙂
Läuft sogar auf einer alten Miningkarte Nvidia P106-100, welche ich mir nur wegen ein paar AI-Geschichten geschossen habe, Bin beeindruckt von dem Tool.
@Benjamin: Der Begriff „Plugin“ ist hier nicht zutreffend.
Ich zitiere dir da gern Nvidia (siehe Quelle):
„ NVIDIA RTX Voice is a new plugin that leverages NVIDIA RTX GPUs and their AI capabilities to remove distracting background noise from your broadcasts, voice chats, and remote video conferencing meetings.“
😉 Nvidia nennt das selbst eben so, daher übernehme ich das auch gern
so laeuft es auch noch auf anderen NVidia Grafikkarten ohne RTX: https://www.deskmodder.de/blog/2020/04/24/nvidia-rtx-voice-funktioniert-auch-mit-anderen-nvidia-grafikkarten/
Hier ist ein beeindruckendes Video dazu von einem Streamer, der es mit einem Vaccum Reiniger demonstriert.
https://www.youtube.com/watch?v=HA6R9NmZO80
Vacuum Reiniger? Wir sagen dazu auch gerne Staubsauger.
Und das im Video ist ein Laubbläser…
Hier hastn Keks.
Es geht um die Technik und nicht um den 100% richtigen Namen. Ich habe den Titel „Vaccum Cleaner“ einfach schnell übersetzt… Oh man.
*Vacuum Cleaner
Getestet und für nicht wirklich brauchbar gehalten.
Die eigene Stimme wird doch ziemlich extrem verändert. Ein S hört sich fast wie ein F an, Wörter mit tz sind auch auffällig stark verändert.
Konnte es bisher aber nur mit den Mikrofonen von Webcam und Webcam Notebook sowie Headset (Arctic Wireless Pro, vermutlich aber mit einem Mikrofon defekt, da der Pegel ohnehin extrem leise ist trotz max gain etc)
Also ist die Zeit vorbei in der man die Mutter des Kindes im TeamSpeak aus dem Hintergrund nach 300 Gramm Schokolade schreien hört?
Vorab: getestet habe ich es noch nicht, aber ich habe einen Bose NC Kopfhörer hier. Und ich bin sicher, dass die NV-Lösung genau die gleichen Probleme hat wie so ein Kopfhörer. Die Geräusche aus dem Testvideo sind relativ einfach rauszurechnen, da sie doch halbwegs monoton sind. Aber bereits bei der Sirene wirds hakelig. Die Königsdisziplin sind ungleichmäßige Geräusche und vor allem Sprache. Ein monotones Lüfterrauschen zB hört man irgendwann nicht mehr (wenn es nicht so ein Laubbläser ist wie hier), aber Sprache in Form von Hintergrundgesabbel nervt universell und ist der eigentliche Grund, wieso man solche Technik haben will.