Home Assistant Voice: Hardware für quelloffenen Sprachassistenten ab sofort verfügbar

von Felix Frank Dez. 19, 2024 | 42 Kommentare

Die Macher hinter Home Assistant feilen schon länger an einem eigenen (Open-Source) Sprachassistenten. Jetzt soll eigene Hardware das Projekt weiter voranbringen, darüber hatte Nabu Casa bereits im Rahmen der Roadmap geplaudert. Diese erlaubt den Betrieb eines eigenen Sprachassistenten, wahlweise ohne Internetzugang oder eben mit einer datenschutzfreundlichen Cloud-Lösung.

Die vorgestellte Hardware von Nabu Casa hört auf den Namen Home Assistant Voice (derzeit: Voice Preview Edition“). Sie erlaubt eine nahtlose Verbindung mit Home Assistant und einen einfacheren Einstieg ins Thema der lokalen, Open-Source-Sprachassistenten.

Hardwareseitig setzt man auf einen dedizierten Audioprozessor (XMOS) sowie zwei Mikrofone. Dies soll es erlauben, die Stimme aus dem ganzen Raum einzufangen. Ein LED-Ring zeigt an, wenn das Gerät zuhört. Hier werden verschiedene Farben für die LED unterstützt. Es gibt zudem einen Hardware-Stummschalter, welcher die Stromzufuhr zu den Mikrofonen unterbricht. Zudem verfügt die Hardware im kompakten Gehäuse (gefertigt im Spritzgussverfahren) über ein taktiles Drehrad, mit dem sich Lautstärke sowie weitere Einstellungen, wie die LED-Farbe, anpassen lassen. Zudem gibt es eine Multifunktionstaste, die sich konfigurieren lässt. Die Stromversorgung erfolgt über einen USB-C-Anschluss. Nach der Einrichtung lässt sich das Gerät sowie seine Einstellungen über Home Assistant verwalten. Mit einem 3,5-mm-Audioanschluss lassen sich auch externe Lautsprecher anschließen und Home Assistant Voice kann so zum Mediaplayer werden.

Unterstützt wird der Sprachassistent „Assist“ von Home Assistant. Dieser kann das smarte Zuhause auch ohne Internetzugang per Sprache steuern. Für den lokalen Betrieb ist eine potente Hardware notwendig, ansonsten kann man die Sprachverarbeitung auch in die Cloud auslagern. Hierbei werden jedoch keine Daten gespeichert. Die Cloud unterstützt mehr Sprachen, ist schneller und genauer und speichert oder trainiert keine Nutzerdaten. Die Hardware für den Sprachassistenten greift hierbei auf die Instanz des Home Assistants sowie dessen Hardware und Rechenpower zurück. Ein Home Assistant Green bzw. Raspberry Pi 4 ist für den lokalen Betrieb zu schwach, da muss man notgedrungen auf die Cloud ausweichen. Mindestanforderung sei ein Intel N100 oder gleichwertig. Verwenden lassen muss sich das Whisper-Base-Modell von OpenAI, auf das man bei der lokalen Sprachausgabe setzt.

Kostenpunkt sind 59 Euro. Bestellbar ist der Home Assistant Voice in der Preview Edition ab sofort. Der Hardware-Kauf kommt zudem dem Home-Assistant-Projekt im Gesamten zugute. Der Code für den Sprachassistenten selbst ist kostenlos und quelloffen.

#	Produkt	Preis
1	Seagate Portable Drive 2TB, Tragbare Externe Festplatte, 2.5 Zoll, USB 3.0, inkl. Data Rescue...	87,99 EUR	Bei Amazon ansehen
2	Seagate Portable Drive 5TB, Tragbare Externe Festplatte, 2.5 Zoll, USB 3.0, inkl. Data Rescue...	151,99 EUR	Bei Amazon ansehen
3	Seagate BarraCuda 2TB, Interne Festplatte HDD, 3.5 Zoll, 7200 U/Min, 256 MB Cache, SATA 6GB/s,...	73,79 EUR	Bei Amazon ansehen

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Felix Frank

Baujahr 1995. Technophiler Schwabe & Lehrer. Unterwegs vor allem im Bereich Smart Home und ständig auf der Suche nach neuen Gadgets & Technik-Trends aus Fernost. X; Threads; LinkedIn. Mail: felix@caschys.blog

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Harry says:
19. Dezember 2024 um 22:25 Uhr

…und schwupps ist er ausverkauft. Hatte ihn schon im Warenkorb, aber auf dem Weg zum Checkout „Ein Produkt aus ihrem Warenkorb ist nicht mehr verfügbar“ – blöd wenn das einzige Produkt im Warenkorb der HA Voice ist. Auch die anderen Ländershops zwischen „DDoS“ und „Out of Stock“.
Naja, dann eben irgendwann im Frühjahr…
- Bastian says:
  20. Dezember 2024 um 11:54 Uhr
  
  Eine nicht Verfügbarkeit einer Webseite durch zu viele Anfragen ist kein DDoS.
  
  Zwar wird ein DDoS praktiziert durch eine große verteilte Menge an Anfragen und führt zum selben Erlebnis ist dennoch etwas anderes.
  Ist etwas wie nicht jedes Auto ist ein Porsche aber jeder Porsche ist ein Auto.
  
  Ein DDoS ist immer ein mutwilliger Angriff.
Mule says:
19. Dezember 2024 um 23:00 Uhr

Finde ich super. Warte schon lange drauf meine verbliebenen Echos endlich abzulösen, welche ich eh nur noch zum Schalten von Lampen nutze.
Möger says:
19. Dezember 2024 um 23:32 Uhr

ab sofort ausverkauft
FTFY

aber geil, wird auf jeden Fall vorbestellt.
- Ingo says:
  20. Dezember 2024 um 08:21 Uhr
  
  Ist openwakeword in dem gerät integriert oder streamt es die ganze Zeit alls zum Homeassistant Server und nutzt openwakeword dort zentral?
  - Paul says:
    20. Dezember 2024 um 11:23 Uhr
    
    auf dem gerät integriert für „Ok Nabu“, „Hey Jarvis“ und „Hey Mycroft“
Heisenberg says:
19. Dezember 2024 um 23:50 Uhr

ich wünsche dem Projekt viel Erfolg und dass es Anklang bei der Masse findet, den Amazon wird immer frecher und zeigt ungewollt auf meinem gekauften Eco Show Werbung.
deshalb ist es wichtig und richtig dass es funktionierende Produkte in der Hand der Community gibt, denn das seit Jahren sinken der Boot muss man wohl bald verlassen. 🙂
Andi says:
20. Dezember 2024 um 00:01 Uhr

Schon sehr cool, Assist ist in vielen Fällen schon verdammt gut und deckt auch vieles ab, was ich ordinär benötige.
Hätte mir nur gewünscht, dass das Ding direkt auch Musik spielen kann – muss ja kein riesiges Feuerwerk abfeuern können, aber morgens einfach eine Playlist in Bad anschmeißen wäre nett.
- Andy says:
  20. Dezember 2024 um 13:29 Uhr
  
  ich finde es so tatsächlich besser. Ein Lautsprecher in der Qualität eines Google Home Mini braucht es meiner Meinung nach nirgendswo. Und wenn das Gerät einen brauchbaren Lautsprecher verbaut hätte wäre es direkt deutlich teurer. So ist der Preis noch in Ordnung und jeder kann den Lautsprecher seiner Wahl damit koppeln.
  - Thorsten G. says:
    20. Dezember 2024 um 13:53 Uhr
    
    Das Teil ist doch im Vergleich zu einem Nest Mini 2. Gen total überteuert. Hab mir gestern die Präsi angeschaut und war jetzt nicht so geflashed. Klar, lokale Verarbeitung ist USP aber dafür kann ich auf dem Google-Teil auch out of the Box (mit Netzteil) für unter 40€ Musik hören. Richtig Dampf brauche ich nur im Wohnzimmer.
GOLDEN says:
20. Dezember 2024 um 00:53 Uhr

Sehr interessant danke für die News!
Andy says:
20. Dezember 2024 um 02:52 Uhr

Sehr nice! Gar nicht mitbekommen, dass sowas in Arbeit war. Mein letzter Stand war noch, dass Leute einen Raspberry mit Mikrofon als Eingabegerät für den Assistant nutzen. Finde die eigenen Produkte von Nabu Casa aber immer sehr durchdacht, wird direkt bestellt.
Per says:
20. Dezember 2024 um 05:50 Uhr

No brainer. Danke
aj says:
20. Dezember 2024 um 07:02 Uhr

Moin Caschy,
ich frage mich, ob das der erste quelloffene assisten bzw. hardware ist.
hab‘ wohl bereits vor ca. 10 jahren, als die ersten priopritären kame danach gesucht und etwas gefunden.
kann nicht mehr sagen, ob es dieser war.
hardware gab es damals wohl dazu noch keine.
gruß aj
- Teek says:
  23. Dezember 2024 um 19:38 Uhr
  
  Mycroft war es damals wahrscheinlich
Gast says:
20. Dezember 2024 um 07:30 Uhr

Bin ich der einzige der mit Sprachassistenten so gar nichts anfangen kann und auch nicht mit denen sprechen will? 😉
- Hömpi says:
  20. Dezember 2024 um 08:13 Uhr
  
  Nein, der einzige mit Sicherheit nicht.
  
  Aber gefühlt liegt bzw. lag es bei vielen die das bisher nicht wollten, daran dass die Daten in der Cloud bzw. bei einem Konzern landen. Mit dem Home Assistant Voice hat man nun eine Alternative die man ohne viel Gefrickel völlig lokal betreiben kann.
- PieMan says:
  20. Dezember 2024 um 08:42 Uhr
  
  Bin ich der einzige der mit diesem Kommentar so gar nichts anfangen kann?
- Siri says:
  20. Dezember 2024 um 08:56 Uhr
  
  Das habe ich leider nicht verstanden. Bitte versuche es später noch einmal.
Tom says:
20. Dezember 2024 um 08:33 Uhr

Gerade zwei bestellt, aber Lieferung wird frühestens Mitte Januar erfolgen.
Spacey says:
20. Dezember 2024 um 09:28 Uhr

… warum kost das Ding bei/für uns 69,99€ – sonst überall 59€?!
- dehydrate635 says:
  20. Dezember 2024 um 11:51 Uhr
  
  alternativ kannst du es vermutlich günstiger aus Frankreich oder sonstigem Umland kaufen
- PieMan says:
  20. Dezember 2024 um 12:16 Uhr
  
  Meinst Du 59$ ohne Mehrwertsteuer?
  - Mule says:
    20. Dezember 2024 um 15:09 Uhr
    
    Nein, er meint, dass der einzige deutschen Händler (im Gegensatz zu seinen Kollegen in anderen EU-Ländern) 69€ und nicht 59€ verlangt. Dieser Händler wird von mir gleich mal auf die Ignore-Liste gesetzt.
Gisbert says:
20. Dezember 2024 um 10:14 Uhr

Gestern Abend waren es noch 64,99€. Dann kamen die vielen Bestellungen und die Gier wurde größer…
- PieMan says:
  20. Dezember 2024 um 12:19 Uhr
  
  Verwende bei der Bestellung den Coupon MAILCOUPON5 und dann bist Du wieder bei dem vorherigen Preis.
  - oSIRus says:
    20. Dezember 2024 um 12:42 Uhr
    
    Bestellung bei welchem Anbieter?
Alex says:
20. Dezember 2024 um 14:58 Uhr

War ja klar, nachdem ich mich für einen passiv gekühlten MiniPC mit J4105 für HA entschieden und diesen gekauft habe, kommt da ein N100 als Mindestanforderung.
- Udo says:
  20. Dezember 2024 um 16:36 Uhr
  
  Na ja, vieleicht ist es ja auch nur eine Empfehlung weil es sonst zu langsam ist.
  Mein HA läuft in einer VM auf einem J5040.
  Aber ich werde noch warten.
  Erstens ist es so noch deutlich zu teuer und zweitens ist der Lautsprecher zu schlecht.
  Oder sie bringen eine Variante nur mit Micro, die dann kleiner und günstiger ist, und eine bessere Version mit gutem Lautsprecher.
  Ich denke da wird sich noch einiges tun.
  Ist ja auch erst Preview.
  - Thorsten G. says:
    22. Dezember 2024 um 19:47 Uhr
    
    Ich denke, kurzfristig wird eine Erweiterungs- Lautsprecher-Box kommen. der Connector-Port an der Unterseite ist sich nicht nur zur Zierde da.
- Harry says:
  20. Dezember 2024 um 17:12 Uhr
  
  Wenn du was langsameres hast, wird es dennoch funktionieren. Ich habe mit einem M5Atom den HA Voice Assistant getestet an einem noch langsameren HA-Host als dem J4105 – funktionieren tut es, aber es dauert eben lange, bis eine Eingabe verarbeitet wurde. Du kannst es also benutzen, aber wenn du das Gefühl hast, dass zwischen deinem Sprachkommando und dem Ausführen der Aktion zu viel Zeit vergeht, dann liegt das tatsächlich am J4105. Beim N100 würde ich eine Reaktionszeit nahe an „sofort“ erwarten.
Martin Fischer says:
20. Dezember 2024 um 18:03 Uhr

Was ist da drin? Ein Mikrofon, ein Lautsprecher und ein ESP32? Also überhaupt keine Rechenpower für Sprache. Das lohnt sich nicht. Wenn schon dann müsste so eine Box das machen, was die Amazon-Cloud für die Alexa macht.
- Der Ben says:
  20. Dezember 2024 um 19:30 Uhr
  
  Das macht die Box ja. Home Assistent hat einen eigenen Cloud Dienst, der sich Nabu Casa nennt. Über diesen kannst du den Voice Assistent nutzen. Wenn du allerdings einen eigenen Voice Server (zB Llama) laufen hast, dann kann die Box auch diesen nutzen.
- Thorsten G. says:
  22. Dezember 2024 um 19:42 Uhr
  
  Vielleicht erst mal mit der Hardware auseinander setzen, bevor du meckerst?
Der Ben says:
20. Dezember 2024 um 19:24 Uhr

Ich bin schon länger mit einer ESP32-S3 Box 3 bei Voice Assistent dabei und ich kann nur sagen, Oh Boy… das ist noch ne ganz schöne Baustelle. An die Leute die des jetzt Bestellt haben, erwartet bitte keine Wunder und gebt dem ganzen bitte noch mindestens nen Jahr Zeit.
- Andreas says:
  21. Dezember 2024 um 10:56 Uhr
  
  Dem kann ich nur zustimmen. Ich habe es auf nem Raspi mit MicHat und auf einem M5Atom laufen. Es funktioniert aber die Reaktionszeiten sind lange nicht auf dem gewohnten Niveau. Was mich auch stört sind diese Stimmen, da gibt es keine wo man sagen könnte das hört sich gut an. Alle sind irgendwie creepy auf dem M5 absolut unbrauchbar das klingt wie ein Piezo. Aber die Erkennung ist schon ok wenn man im HA bisschen mit Aliasen arbeitet ganz gut.
  - Alex says:
    21. Dezember 2024 um 14:07 Uhr
    
    Du findest die Erkennung ok? Darf ich fragen welche Einstellungen du für Whisper benutzt?
    Bei mir läuft das leider alles andere als optimal, eigentlich funktioniert nix. Entweder tut er sich schon mit den Worten schwer und kombiniert diese. Holt man etwas Luft wird direkt ein Komma eingefügt… alles in allem funktioniert die Ausführung eines Kommandos in weniger al 5% der Fälle. Also eigentlich gar nicht.
    Aus einem „Rollenaden Büro schließen“ wird ein „rollandenbüro schließen“, „rolladen büroschließen“ oder „Roll aden, Büro, schließen“…
    
    HA läuft bei mir in einer VM auf einem recht potenten System, Ich habe auch quasi kaum eine Verzögerung bei der Sprachverarbeitung aber halt nicht das erwartet Ergebnis. So ist der Spaß leider nicht zu gebrauchen. Bin schon am überlegen mir einen Google Streamer als Home Hub zu kaufen und HA via des Matterhub Add-Ons zu steuern
    - Andreas says:
      21. Dezember 2024 um 15:12 Uhr
      
      Bisschen überspitzt OK 🙂 Ich nutze HA in docker und habe als noch faster-whisper und piper laufen. Als Konversationsagent nutze ich ChatGPT. Die Erkennung beider Microphone ist aber insgesamt nicht gut. Man muss wirklich laut und deutlich sprechen, wenn man so wie ich etwas nuschelt dann geht nix mehr. Hat bei mir etwas gedauert bis es einigermassen ging (Stunden im Debugmodus). Es ist aber wie das Teil hier auch absolute Spielerei, das System gibt halt mit whisper und piper aktuell nicht mehr her, da hilft es auch nicht neue Hardware rauszubringen. Es scheitert meiner Meinung nach an der Software, trotz der investieren Zeit ist das keinesfalls Endnutzertauglich. Bis man die System brauchbar am laufen hat dauert das schon seine Zeit. Die Casa Cloud nutze ich nicht.
    - Thorsten G says:
      22. Dezember 2024 um 19:45 Uhr
      
      In der Live Präsi waren die Reaktionszeiten bei 0,2 s und jeder hat betont das das „way ahead der S3 “ ist. Die Mikrophon-Hardware ist wohl auch der ausschlaggebende Punkt.
Alex says:
21. Dezember 2024 um 18:48 Uhr

ok das klingt ganz nach meinen Erfahrungen, also leider nichts was man seiner Frau an die Hand geben kann 😀
Werde dann wohl weiter nach einer passenden Lösung suchen müssen. Danke für die Rückmeldung
- Thorsten G. says:
  22. Dezember 2024 um 19:49 Uhr
  
  Hat S3 einfach nix mit der HA Voice PE tun. Wenn der 7-jährige Sohn des Developers es in 3 Sprachen benutzen kann, wird es deine Frau wohl auch können.
af says:
24. Dezember 2024 um 21:21 Uhr

Klingt ja interessant, aber was ist der Vorteil zu einem einfachen Raummico am PI + Lautsprecher? Verstehe den Unterschied nicht…

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

Home Assistant Voice: Hardware für quelloffenen Sprachassistenten ab sofort verfügbar

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

42 Kommentare

Umfrage des Monats

Diese Woche beliebt