Home Assistant Voice: Hardware für quelloffenen Sprachassistenten ab sofort verfügbar
Die Macher hinter Home Assistant feilen schon länger an einem eigenen (Open-Source) Sprachassistenten. Jetzt soll eigene Hardware das Projekt weiter voranbringen, darüber hatte Nabu Casa bereits im Rahmen der Roadmap geplaudert. Diese erlaubt den Betrieb eines eigenen Sprachassistenten, wahlweise ohne Internetzugang oder eben mit einer datenschutzfreundlichen Cloud-Lösung.
Die vorgestellte Hardware von Nabu Casa hört auf den Namen Home Assistant Voice (derzeit: Voice Preview Edition“). Sie erlaubt eine nahtlose Verbindung mit Home Assistant und einen einfacheren Einstieg ins Thema der lokalen, Open-Source-Sprachassistenten.
Hardwareseitig setzt man auf einen dedizierten Audioprozessor (XMOS) sowie zwei Mikrofone. Dies soll es erlauben, die Stimme aus dem ganzen Raum einzufangen. Ein LED-Ring zeigt an, wenn das Gerät zuhört. Hier werden verschiedene Farben für die LED unterstützt. Es gibt zudem einen Hardware-Stummschalter, welcher die Stromzufuhr zu den Mikrofonen unterbricht. Zudem verfügt die Hardware im kompakten Gehäuse (gefertigt im Spritzgussverfahren) über ein taktiles Drehrad, mit dem sich Lautstärke sowie weitere Einstellungen, wie die LED-Farbe, anpassen lassen. Zudem gibt es eine Multifunktionstaste, die sich konfigurieren lässt. Die Stromversorgung erfolgt über einen USB-C-Anschluss. Nach der Einrichtung lässt sich das Gerät sowie seine Einstellungen über Home Assistant verwalten. Mit einem 3,5-mm-Audioanschluss lassen sich auch externe Lautsprecher anschließen und Home Assistant Voice kann so zum Mediaplayer werden.
Unterstützt wird der Sprachassistent „Assist“ von Home Assistant. Dieser kann das smarte Zuhause auch ohne Internetzugang per Sprache steuern. Für den lokalen Betrieb ist eine potente Hardware notwendig, ansonsten kann man die Sprachverarbeitung auch in die Cloud auslagern. Hierbei werden jedoch keine Daten gespeichert. Die Cloud unterstützt mehr Sprachen, ist schneller und genauer und speichert oder trainiert keine Nutzerdaten. Die Hardware für den Sprachassistenten greift hierbei auf die Instanz des Home Assistants sowie dessen Hardware und Rechenpower zurück. Ein Home Assistant Green bzw. Raspberry Pi 4 ist für den lokalen Betrieb zu schwach, da muss man notgedrungen auf die Cloud ausweichen. Mindestanforderung sei ein Intel N100 oder gleichwertig. Verwenden lassen muss sich das Whisper-Base-Modell von OpenAI, auf das man bei der lokalen Sprachausgabe setzt.
Kostenpunkt sind 59 Euro. Bestellbar ist der Home Assistant Voice in der Preview Edition ab sofort. Der Hardware-Kauf kommt zudem dem Home-Assistant-Projekt im Gesamten zugute. Der Code für den Sprachassistenten selbst ist kostenlos und quelloffen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
…und schwupps ist er ausverkauft. Hatte ihn schon im Warenkorb, aber auf dem Weg zum Checkout „Ein Produkt aus ihrem Warenkorb ist nicht mehr verfügbar“ – blöd wenn das einzige Produkt im Warenkorb der HA Voice ist. Auch die anderen Ländershops zwischen „DDoS“ und „Out of Stock“.
Naja, dann eben irgendwann im Frühjahr…
Eine nicht Verfügbarkeit einer Webseite durch zu viele Anfragen ist kein DDoS.
Zwar wird ein DDoS praktiziert durch eine große verteilte Menge an Anfragen und führt zum selben Erlebnis ist dennoch etwas anderes.
Ist etwas wie nicht jedes Auto ist ein Porsche aber jeder Porsche ist ein Auto.
Ein DDoS ist immer ein mutwilliger Angriff.
Finde ich super. Warte schon lange drauf meine verbliebenen Echos endlich abzulösen, welche ich eh nur noch zum Schalten von Lampen nutze.
ab sofort ausverkauft
FTFY
aber geil, wird auf jeden Fall vorbestellt.
Ist openwakeword in dem gerät integriert oder streamt es die ganze Zeit alls zum Homeassistant Server und nutzt openwakeword dort zentral?
auf dem gerät integriert für „Ok Nabu“, „Hey Jarvis“ und „Hey Mycroft“
ich wünsche dem Projekt viel Erfolg und dass es Anklang bei der Masse findet, den Amazon wird immer frecher und zeigt ungewollt auf meinem gekauften Eco Show Werbung.
deshalb ist es wichtig und richtig dass es funktionierende Produkte in der Hand der Community gibt, denn das seit Jahren sinken der Boot muss man wohl bald verlassen. 🙂
Schon sehr cool, Assist ist in vielen Fällen schon verdammt gut und deckt auch vieles ab, was ich ordinär benötige.
Hätte mir nur gewünscht, dass das Ding direkt auch Musik spielen kann – muss ja kein riesiges Feuerwerk abfeuern können, aber morgens einfach eine Playlist in Bad anschmeißen wäre nett.
ich finde es so tatsächlich besser. Ein Lautsprecher in der Qualität eines Google Home Mini braucht es meiner Meinung nach nirgendswo. Und wenn das Gerät einen brauchbaren Lautsprecher verbaut hätte wäre es direkt deutlich teurer. So ist der Preis noch in Ordnung und jeder kann den Lautsprecher seiner Wahl damit koppeln.
Das Teil ist doch im Vergleich zu einem Nest Mini 2. Gen total überteuert. Hab mir gestern die Präsi angeschaut und war jetzt nicht so geflashed. Klar, lokale Verarbeitung ist USP aber dafür kann ich auf dem Google-Teil auch out of the Box (mit Netzteil) für unter 40€ Musik hören. Richtig Dampf brauche ich nur im Wohnzimmer.
Sehr interessant danke für die News!
Sehr nice! Gar nicht mitbekommen, dass sowas in Arbeit war. Mein letzter Stand war noch, dass Leute einen Raspberry mit Mikrofon als Eingabegerät für den Assistant nutzen. Finde die eigenen Produkte von Nabu Casa aber immer sehr durchdacht, wird direkt bestellt.
No brainer. Danke
Moin Caschy,
ich frage mich, ob das der erste quelloffene assisten bzw. hardware ist.
hab‘ wohl bereits vor ca. 10 jahren, als die ersten priopritären kame danach gesucht und etwas gefunden.
kann nicht mehr sagen, ob es dieser war.
hardware gab es damals wohl dazu noch keine.
gruß aj
Mycroft war es damals wahrscheinlich
Bin ich der einzige der mit Sprachassistenten so gar nichts anfangen kann und auch nicht mit denen sprechen will? 😉
Nein, der einzige mit Sicherheit nicht.
Aber gefühlt liegt bzw. lag es bei vielen die das bisher nicht wollten, daran dass die Daten in der Cloud bzw. bei einem Konzern landen. Mit dem Home Assistant Voice hat man nun eine Alternative die man ohne viel Gefrickel völlig lokal betreiben kann.
Bin ich der einzige der mit diesem Kommentar so gar nichts anfangen kann?
Das habe ich leider nicht verstanden. Bitte versuche es später noch einmal.
Gerade zwei bestellt, aber Lieferung wird frühestens Mitte Januar erfolgen.
… warum kost das Ding bei/für uns 69,99€ – sonst überall 59€?!
alternativ kannst du es vermutlich günstiger aus Frankreich oder sonstigem Umland kaufen
Meinst Du 59$ ohne Mehrwertsteuer?
Nein, er meint, dass der einzige deutschen Händler (im Gegensatz zu seinen Kollegen in anderen EU-Ländern) 69€ und nicht 59€ verlangt. Dieser Händler wird von mir gleich mal auf die Ignore-Liste gesetzt.
Gestern Abend waren es noch 64,99€. Dann kamen die vielen Bestellungen und die Gier wurde größer…
Verwende bei der Bestellung den Coupon MAILCOUPON5 und dann bist Du wieder bei dem vorherigen Preis.
Bestellung bei welchem Anbieter?
War ja klar, nachdem ich mich für einen passiv gekühlten MiniPC mit J4105 für HA entschieden und diesen gekauft habe, kommt da ein N100 als Mindestanforderung.
Na ja, vieleicht ist es ja auch nur eine Empfehlung weil es sonst zu langsam ist.
Mein HA läuft in einer VM auf einem J5040.
Aber ich werde noch warten.
Erstens ist es so noch deutlich zu teuer und zweitens ist der Lautsprecher zu schlecht.
Oder sie bringen eine Variante nur mit Micro, die dann kleiner und günstiger ist, und eine bessere Version mit gutem Lautsprecher.
Ich denke da wird sich noch einiges tun.
Ist ja auch erst Preview.
Ich denke, kurzfristig wird eine Erweiterungs- Lautsprecher-Box kommen. der Connector-Port an der Unterseite ist sich nicht nur zur Zierde da.
Wenn du was langsameres hast, wird es dennoch funktionieren. Ich habe mit einem M5Atom den HA Voice Assistant getestet an einem noch langsameren HA-Host als dem J4105 – funktionieren tut es, aber es dauert eben lange, bis eine Eingabe verarbeitet wurde. Du kannst es also benutzen, aber wenn du das Gefühl hast, dass zwischen deinem Sprachkommando und dem Ausführen der Aktion zu viel Zeit vergeht, dann liegt das tatsächlich am J4105. Beim N100 würde ich eine Reaktionszeit nahe an „sofort“ erwarten.
Was ist da drin? Ein Mikrofon, ein Lautsprecher und ein ESP32? Also überhaupt keine Rechenpower für Sprache. Das lohnt sich nicht. Wenn schon dann müsste so eine Box das machen, was die Amazon-Cloud für die Alexa macht.
Das macht die Box ja. Home Assistent hat einen eigenen Cloud Dienst, der sich Nabu Casa nennt. Über diesen kannst du den Voice Assistent nutzen. Wenn du allerdings einen eigenen Voice Server (zB Llama) laufen hast, dann kann die Box auch diesen nutzen.
Vielleicht erst mal mit der Hardware auseinander setzen, bevor du meckerst?
Ich bin schon länger mit einer ESP32-S3 Box 3 bei Voice Assistent dabei und ich kann nur sagen, Oh Boy… das ist noch ne ganz schöne Baustelle. An die Leute die des jetzt Bestellt haben, erwartet bitte keine Wunder und gebt dem ganzen bitte noch mindestens nen Jahr Zeit.
Dem kann ich nur zustimmen. Ich habe es auf nem Raspi mit MicHat und auf einem M5Atom laufen. Es funktioniert aber die Reaktionszeiten sind lange nicht auf dem gewohnten Niveau. Was mich auch stört sind diese Stimmen, da gibt es keine wo man sagen könnte das hört sich gut an. Alle sind irgendwie creepy auf dem M5 absolut unbrauchbar das klingt wie ein Piezo. Aber die Erkennung ist schon ok wenn man im HA bisschen mit Aliasen arbeitet ganz gut.
Du findest die Erkennung ok? Darf ich fragen welche Einstellungen du für Whisper benutzt?
Bei mir läuft das leider alles andere als optimal, eigentlich funktioniert nix. Entweder tut er sich schon mit den Worten schwer und kombiniert diese. Holt man etwas Luft wird direkt ein Komma eingefügt… alles in allem funktioniert die Ausführung eines Kommandos in weniger al 5% der Fälle. Also eigentlich gar nicht.
Aus einem „Rollenaden Büro schließen“ wird ein „rollandenbüro schließen“, „rolladen büroschließen“ oder „Roll aden, Büro, schließen“…
HA läuft bei mir in einer VM auf einem recht potenten System, Ich habe auch quasi kaum eine Verzögerung bei der Sprachverarbeitung aber halt nicht das erwartet Ergebnis. So ist der Spaß leider nicht zu gebrauchen. Bin schon am überlegen mir einen Google Streamer als Home Hub zu kaufen und HA via des Matterhub Add-Ons zu steuern
Bisschen überspitzt OK 🙂 Ich nutze HA in docker und habe als noch faster-whisper und piper laufen. Als Konversationsagent nutze ich ChatGPT. Die Erkennung beider Microphone ist aber insgesamt nicht gut. Man muss wirklich laut und deutlich sprechen, wenn man so wie ich etwas nuschelt dann geht nix mehr. Hat bei mir etwas gedauert bis es einigermassen ging (Stunden im Debugmodus). Es ist aber wie das Teil hier auch absolute Spielerei, das System gibt halt mit whisper und piper aktuell nicht mehr her, da hilft es auch nicht neue Hardware rauszubringen. Es scheitert meiner Meinung nach an der Software, trotz der investieren Zeit ist das keinesfalls Endnutzertauglich. Bis man die System brauchbar am laufen hat dauert das schon seine Zeit. Die Casa Cloud nutze ich nicht.
In der Live Präsi waren die Reaktionszeiten bei 0,2 s und jeder hat betont das das „way ahead der S3 “ ist. Die Mikrophon-Hardware ist wohl auch der ausschlaggebende Punkt.
ok das klingt ganz nach meinen Erfahrungen, also leider nichts was man seiner Frau an die Hand geben kann 😀
Werde dann wohl weiter nach einer passenden Lösung suchen müssen. Danke für die Rückmeldung
Hat S3 einfach nix mit der HA Voice PE tun. Wenn der 7-jährige Sohn des Developers es in 3 Sprachen benutzen kann, wird es deine Frau wohl auch können.
Klingt ja interessant, aber was ist der Vorteil zu einem einfachen Raummico am PI + Lautsprecher? Verstehe den Unterschied nicht…