Home Assistant Voice Chapter 9: Weitere Neuerungen für Sprachassistenten

Die Macher von Home Assistant haben 2023 begonnen, verstärkt am Thema Sprachsteuerung zu arbeiten. Der Home Assistant soll sich im per Sprache steuern lassen, hierbei greift man aber nicht auf Alexa oder den Google Assistant zurück. Die Plattform „Assist“ hat man mittlerweile sukzessive ausgebaut. Nach der Unterstützung für den Standardassistenten von Android und der Wakeword-Erkennung gibt es mit dem Home Assistant Voice inzwischen auch eigene Hardware – zumindest im Preview-Stadium. Auch an der Anbindung von LLM, sprich künstlicher Intelligenz, arbeitet man.

Im Rahmen von „Voice Chapter 9“ hat man weitere Neuerungen verlauten lassen. Mit Speech-to-Phrase unterstützt man jetzt eine Reihe von vor-trainierten Phrasen. Diese Phrasen werden automatisch generiert und auf Basis von Geräten, Bereichen und Satzauslösern feiner abgestimmt. Das ist – im Gegensatz zur Umwandlung von Sprache in Text – ressourcenschonender. Das Ergebnis: Sprache wird in weniger als einer Sekunde auf einem Home Assistant Green oder Raspberry Pi 4 transkribiert. Der Raspberry Pi 5 verarbeitet Befehle siebenmal schneller, nämlich in 150 Millisekunden pro Befehl. Das alles vollständig lokal und offline.

Damit kommen natürlich auch Einschränkung: Speech-to-Phrase unterstützt nur eine Teilmenge der Assist-Sprachbefehle sowie Dinge wie Einkaufslisten und Timer. Zufällige Wörter (Wildcards) werden nicht erlaubt, entsprechend ist das auch für die Haussteuerung und nicht für LLMs gedacht.

Die wichtigsten Befehle für die Haussteuerung werden unterstützt, z. B. das Ein- und Ausschalten von Lichtern, das Ändern von Helligkeit und Farbe, das Abrufen des Wetters, das Einstellen von Timern und das Steuern von Media-Playern. Es können auch benutzerdefinierte Sätze hinzugefügt werden, um Dinge auszulösen, die von den aktuellen Befehlen nicht abgedeckt werden.

Unterstützt wird neben Deutsch auch Englisch, Französisch, Niederländisch sowie Spanisch und Italienisch. Man arbeitet an mehr Sprachen – das sei einfacher als bei Speech-to-Text.

Mit der Home Assistant Voice Preview hat man ein Ökosystem gestartet. Auch selbstgebaute Geräte funktionieren hier und man arbeitet mit ESPHome 2025.2 zusammen: ESP-Home-basierte Sprachassistenten unterstützen das Senden von Nachrichten sowie die neuen Sprachassistenten.

Neuerungen gibt es für Sprachmodelle, sprich LLM. Man unterstützt bereits eine breite Palette an Modellen. Sowohl Cloud-basiert als auch lokal. Hier gibt es jetzt neue Funktionen. Es gibt eine neue Einstellung, Befehle bevorzugt lokal zu verarbeiten. So wird mit integrierten Konversationsagenten zuerst versucht, den Befehl auszuführen, bevor das LLM konsultiert wird. Letzteres verlangsamt teilweise Abläufe und verschwendet API-Token für simple Befehle, wie das Einschalten von Licht.

Die lokal verarbeiteten Befehle werden dennoch als Gesprächsverlauf mit dem LLM geteilt. So klappen Folgefragen mit Kontext dennoch.

In Home Assistant 2025.3 wird man die Unterstützung für LLMs einführen, die ihre Antwort in den Chat streamen, sodass die Benutzer mit dem Lesen beginnen können, während die Antwort generiert wird. So muss man nicht erst auf eine vollständige Antwort warten. Befehle werden jetzt zudem ausgeführt, ohne den Rest der Nachricht abzuwarten. Bisher hatte man auf die vollständige Antwort des LLMs gewartet.

Streaming wird zunächst für Ollama und OpenAI vorgesehen. Man unterstützt zudem das Model Context Protocol (MCP) von Anthropic. Dieses Protokoll ermöglicht es LLMs externe Dienste zu steuern. Auch der Home Assistant kann jetzt MCP sprechen und man externe MCP-Server anbinden.

Mit der neuen Server-Integration des Model Context Protocol können die LLM-Tools des Home Assistant in andere KI-Apps integriert werden, z. B. in die Desktop-App Claude.

Der Konversationsagent erhält zwei neue Funktionen: Die Broadcast-Funktion erlaubt das Senden von Nachrichten an andere Assist-Satelliten im Haus. Kennen wir von Alexa beispielsweise als Ankündigungen. Assist kann jetzt nicht nur die Temperatur der Heizung mitteilen, sondern diese auch ändern.

Man kann sich zudem vom Home Assistant für Benachrichtigungen anrufen lassen. Auf einem analogen Telefon. Wer auf ein LLM als Sprachassistent setzt, der kann auch ein Gespräch über einen Anruf initiieren. Zudem kann dem LLM zusätzlicher Kontext, etwa geöffnete Fenster, an die Hand gegeben werden.

Mit dem kommenden Home Assistant 2025.3 unterstützt man Ansagen für Wyoming-Satelliten. Das ist der Standard zur Verknüpfung diverser Teile, die ein Sprachassistent benötigt. Hier unterstützt man auch die neue Broadcast-Funktion. Zudem gibt es eine neue Engine für WakeWords (microWakeWord) als Alternative zu openWakeWord.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Baujahr 1995. Technophiler Schwabe & Lehrer. Unterwegs vor allem im Bereich Smart Home und ständig auf der Suche nach neuen Gadgets & Technik-Trends aus Fernost. X; Threads; LinkedIn. Mail: felix@caschys.blog

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

6 Kommentare

  1. Die Erfahrungsberichte sind noch durchwachsen (YT/Reddit etc) … und es fehlt halt aktuell (noch) an passender Audio Hardware von der ich hoffe das sie noch kommt. Dann fliegen endlich mal die ganzen Alex Geräte raus.

  2. Es ist im Moment einfach nicht gut genug für die normale Nutzung. Das sollte sich mit dem Update hier verbessern.
    Ich hab den direkten vergleich mit Alexa + MatterHub (in HA) was das selbe schaltet (Zigbee) und da ist der Unterschied viel viel zu groß das man das freiwillig nehmen würde. Alexa schaltet in unter einer Sekunde durch Musik und Nebengeräusche hinweg, HA Voice braucht ca 5-10sekunden und dabei muss es wirklich still sein. Die Fehlerquote liegt locker bei 70%.

    • Genau dieselbe Erfahrung habe ich auch gemacht, allerdings in Kombination mit Siri + Matterhub in HA.
      Siri funktioniert in dem Fall einfach zu schnell und zu gut um im Moment auf lokales HA zu wechseln.

  3. Ich habe hier den Home Assistant Voice Preview liegen… war bisher wenig brauchbar, was aber auch an meinem schwachen Serverchen liegt. Mal schauen, wie es mit 2025.3 so wird und ich muss mal dringend den HA auf den neuen Bastel-Server umziehen mit mehr CPU-Bumms.
    Eigentlich finde ich die Idee der Sprachsteuerung ja ganz charmant, aber das muss dann auch funktionieren. Im Moment ist es noch zu unzuverlässig und für ordentliche Performance zu viel Hardwarepower notwendig. Aber Speech-to-Phrase könnte das ja ändern.

  4. ich verfolge diese eigene Sprachsteuerung (nur lesend) auch schon eine Weile.

    Aber außer Datenschutz sehe ich eigentlich wenig technischen Grund Alexa zu ersetzen. Sie hält den Mund die Schlagwort-Erkennung funktioniert, sie kostet keine Abo Gebühr (noch)
    Die Hardware ist im Angebot spottbillig und kann auch auf Spotify zugreifen, nachdem sie Prime Music zerstört haben.

    Es bleibt das ungute Gefühl der Wanze in der eigenen Wohnung.

    Schließlich muss ich feststellen, dass ich in aller Regel doch das Handy nehme, wenn ich manuellen Zugriff auf das Smarthome will. Das habe ich eh dabei und kann dann auch gleich nach anderen Parameter schauen. Mal schauen, ob ich vom Spieltrieb abgesehen wirklich Interesse an neuer Sprachsteuerung habe.

  5. Wenn ich über die HA App in diesen Assist nutze und dort eine einfache Frage stelle, wie z.B. „wie ist die Temperatur im Wohnzimmer“ und dann die Meldung bekomme „Temperatur ist im ist im Bereich Wohnzimmer nicht vorhanden“. Was kann man denn da machen?
    Das Hygrometer im Wohnzimmer ist natürlich auch dem Bereich Wohnzimmer zugeordnet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.