Smart Building ›
Das digitale Ohr – Sprachsteuerung im Smart Home
Siri, Alexa und Co. – Sprachassistenzsysteme halten immer mehr Einzug in unseren Alltag und somit auch in unsere Haushalte. Schnell per Sprachbefehl das Licht dimmen oder die Temperatur senken, ohne sich von der Stelle bewegen zu müssen – die Möglichkeiten werden immer vielfältiger und sind mittlerweile auch für den Laien einfach anzuwenden.
Dabei wird die Zahl der Produkte immer unübersichtlicher und auch die Qualität der verschiedenen Dienste schwankt stark: Was gibt es überhaupt auf dem Markt? Was sind die Vorteile der verschiedenen Dienste? Und wie funktionieren diese überhaupt? Tobias Kleine und Tobias Abraham (DIAL) haben Mitte Oktober beim Veranstaltungsformat OpenLab einen Überblick über die verschiedenen Anwendungen auf dem Markt gegeben. Wir haben einige Punkte der Veranstaltung zusammengefasst und geben hier einen Überblick über die wichtigsten Unterschiede der verschiedenen Anbieter und deren Funktionsweise:
Lokale vs. cloudbasierte Systeme
Nutzer von Smart Home Anwendungen haben generell die Möglichkeit zwischen lokalen und cloudbasierten Systemen zu wählen. Beide Systeme haben Vor- und Nachteile. Bei lokalen Diensten wird die Sprache offline dekodiert. Die Spracherkennung erfolgt meist nach einem festen Muster. Der Nachteil: Der Nutzer muss sozusagen die Sprache des digitalen Ohrs erlernen, da das System keine intelligente Syntaxerkennung hat. Vorteile liegen hingegen im Datenschutz. Die Daten werden nicht an Drittanbieter weitergegeben und der Dienst funktioniert auch offline.
Ein deutlicher Trend geht derzeit zu den cloudbasierten Diensten, wie man sie beispielsweise von Siri, Alexa oder auch Google Home kennt. Diese Dienste benötigen eine ständige Internetverbindung und werden teilweise aus Datenschutzperspektive kritisch gesehen, da die Daten oftmals über Dritte offen gelegt werden.
Die Sprache wird bei diesen Anbietern online dekodiert – in der Cloud. Die Syntax ist dabei flexibel, der Sprachassistenz lernt sozusagen und reagiert auch auf Schlagwörter. So sind auch verschiedene Varianten einer Aussage möglich. Ist diese nicht ganz klar sind auch Rückfragen vom Sprachassistenzsystem möglich. Um ein Beispiel zu nennen: Der Sprachbefehl lautet: »Erhöhe die Temperatur um 2 Grad Celsius«, das Gerät erkennt, dass die Aussage nicht klar ist und fragt aktiv nach: »Entschuldigung, welches Gerät meinst Du? «
Künstliche Intelligenz lernt die Sprache des Anwenders
Für die verschiedenen cloudbasierten Systeme gibt es immer mehr Dienste für den Smart Home Bereich. Beispielsweise gibt es für Alexa derzeit 155 integrierte Dienste (Stand Oktober 2017). Diese sorgen dafür, dass das Sprachassistenzsystem mit den Endgeräten im Smart Home (Heizung, Jalousien etc.) kommunizieren kann. Und so funktioniert es: Der gesprochene Befehl wird als Audiodatei in eine NPL-Einheit (Natural Processing Language) umgewandelt. Das ist die Einheit, welche die Computerlingusitik darstellt und Teil der künstlichen Intelligenz ist. Mit Hilfe von Grammatikregeln, Lexika, Statistiken und Algorithmen lernt die Cloud nach und nach Ausprägungen der Sprachbefehle zu erkennen. Nach der Analyse werden die Sätze im JSON (JavaScriptObjekt Notation) Format gespeichert und dann von den oben genannten integrierten Diensten verwendet.
Diese Dienste sind Teil der AWS-Lambda. Dies ist ein serverloser Datenverarbeitungsservice, der den Code beim Eintreten bestimmter Ereignisse ausführt und dessen Ressourcen verwaltet. AWS-Lambda arbeitet mit den unterschiedlichsten Endgeräten und Softwarelösungen zusammen und
verwaltet sozusagen die Kommunikation zwischen der Cloud des Sprachassistenten und des Endgeräts. Lautet der Befehl: »Stelle die Temperatur im Wohnzimmer auf 22°C ein«,
erkennt die Cloud, das die Soll - Temperatur im Wohnzimmer auf 22°C gestellt werden soll. Dies wird an das Endgerät übergeben und die Temperatur wird auf 22°C gestellt.
Schnittstellen nach Bedarf konfigurieren
Das Prinzip der Zusammenarbeit zwischen der Cloud und den cloudbasierten Endgeräten ist bei allen Anwendern ähnlich gestaltet. Um lokale Systeme (KNX, Artnet, …) zu steuern, gibt es diverse cloudbasierte Anwendungen, die als Gateway zwischen der Cloud mit Sprachservice und den lokalen Endgeräten dienen. Der Anwender kann damit selbst die Schnittstellen zwischen dem Sprachassistenzsystem und dem lokalen Endgerät nach Bedarf konfigurieren. Auch viele etablierte Hersteller haben den Trend erkannt und bieten diverse Lösungen für die Anbindung von Sprachassistenzsystemen im Smart Home an.