„Aktivierungswort“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Referenz hinzugefügt
Referenz hinzugefügt
Zeile 3: Zeile 3:
Das Aktivierungswort kann – je nach Sprachassistenzsystem – entweder
Das Aktivierungswort kann – je nach Sprachassistenzsystem – entweder


* fix vorgegeben,
* fix vorgegeben,<ref name=":6" />
* aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder<ref name=":3">{{Internetquelle |autor= |url=https://www.amazon.de/b?ie=UTF8&node=17084417031 |titel=Häufige Fragen |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-23 |sprache=de}}</ref>
* aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder<ref name=":3">{{Internetquelle |autor= |url=https://www.amazon.de/b?ie=UTF8&node=17084417031 |titel=Häufige Fragen |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-23 |sprache=de}}</ref><ref name=":5" />
* vom Benutzer individuell frei vorgebbar sein.<ref name=":0">{{Internetquelle |autor= |url=https://snips.ai/ |titel=Snips {{!}} Voice AI Platform |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref>
* vom Benutzer individuell frei vorgebbar sein.<ref name=":0">{{Internetquelle |autor= |url=https://snips.ai/ |titel=Snips {{!}} Voice AI Platform |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref>


Zeile 14: Zeile 14:
Die zum Erkennen des Aktivierungsworts nötige [[Rechenleistung]] wird [[offline]], also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten [[online]], also per [[Internetverbindung]] über [[Server]] des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die [[Spracherkennung]] für das Erkennen des Benutzerwunschs und die [[Sprachsynthese]] für die sprachliche Antwort des Systems an den Benutzer.<ref name=":2" /><ref name=":4" /> Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.<ref name=":0" /><ref name=":1">{{Internetquelle |autor= |url=https://jasperproject.github.io/ |titel=Jasper {{!}} Control everything with your voice |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref><ref name=":2" />
Die zum Erkennen des Aktivierungsworts nötige [[Rechenleistung]] wird [[offline]], also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten [[online]], also per [[Internetverbindung]] über [[Server]] des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die [[Spracherkennung]] für das Erkennen des Benutzerwunschs und die [[Sprachsynthese]] für die sprachliche Antwort des Systems an den Benutzer.<ref name=":2" /><ref name=":4" /> Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.<ref name=":0" /><ref name=":1">{{Internetquelle |autor= |url=https://jasperproject.github.io/ |titel=Jasper {{!}} Control everything with your voice |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref><ref name=":2" />


Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z.&nbsp;B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.<ref name=":5">{{Internetquelle |autor= |url=https://support.google.com/pixelslate/answer/9136588?hl=en |titel=Turn "OK Google" (hotword) on or off - Pixel Slate Help |werk= |hrsg=[[Google LLC]] |datum= |abruf=2019-09-23 |sprache=en}}</ref>
Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z.&nbsp;B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.<ref name=":5">{{Internetquelle |autor= |url=https://support.google.com/pixelslate/answer/9136588?hl=en |titel=Turn "OK Google" (hotword) on or off - Pixel Slate Help |werk= |hrsg=[[Google LLC]] |datum= |abruf=2019-09-23 |sprache=en}}</ref><ref name=":6" />


== Herausforderungen und Problembereiche ==
== Herausforderungen und Problembereiche ==
Zeile 69: Zeile 69:
|[[Apple]]
|[[Apple]]
|
|
* „Hey, Siri“<ref>{{Internetquelle |autor= |url=https://support.apple.com/de-de/HT204389 |titel=Siri auf allen Apple-Geräten verwenden |werk= |hrsg=[[Apple]] |datum=2019-05-06 |abruf=2019-09-22 |sprache=de}}</ref>
* „Hey, Siri“<ref name=":6">{{Internetquelle |autor= |url=https://support.apple.com/de-de/HT204389 |titel=Siri auf allen Apple-Geräten verwenden |werk= |hrsg=[[Apple]] |datum=2019-05-06 |abruf=2019-09-22 |sprache=de}}</ref>
|-
|-
|Bixby
|Bixby

Version vom 23. September 2019, 15:34 Uhr

Ein Aktivierungswort (englisch hotword), gelegentlich auch Aufwachwort oder Aufwachbefehl genannt, ist ein Wort, das – wenn es vom Benutzer ausgesprochen wird – dazu dient, einen Sprachassistenten zu aktivieren, um dann mit ihm – meist verbal und akustisch in (annähernd) natürlicher Sprache – zu interagieren.[1][2] Ein Aktivierungswort ist also ein spezieller Sprachbefehl, der einen Sprachassistenten zwecks weiterer Konversation aktiviert. Anstelle eines einzelnen Worts kann auch eine Phrase (z. B. häufig in Form einer Anrede) als Aktivierungswort dienen.

Das Aktivierungswort kann – je nach Sprachassistenzsystem – entweder

  • fix vorgegeben,[3]
  • aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder[4][5]
  • vom Benutzer individuell frei vorgebbar sein.[6]

Manche Systeme können nicht nur mit einem einzigen Aktivierungswort, sondern mit mehreren verschiedenen Aktivierungswörtern aktiviert werden.

Funktionsablauf

Das Aktivierungswort wird vom Benutzer so ausgesprochen, dass es von den Mikrofonen des Endgeräts des Sprachassistenzsystems empfangen wird. Erkennt das System das Aktivierungswort, gibt es dem Benutzer üblicherweise eine entsprechende Rückmeldung, dass es nun aktiv (also interaktionsbereit) ist. Der Benutzer kann dann seine eigentliche Konversation mit dem Assistenten beginnen und ihm beispielsweise eine Frage stellen oder einen Befehl erteilen.[1][7]

Die zum Erkennen des Aktivierungsworts nötige Rechenleistung wird offline, also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten online, also per Internetverbindung über Server des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die Spracherkennung für das Erkennen des Benutzerwunschs und die Sprachsynthese für die sprachliche Antwort des Systems an den Benutzer.[1][7] Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.[6][8][1]

Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z. B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.[5][3]

Herausforderungen und Problembereiche

Ideales Sprachassistenzsystem

Ein ideales Sprachassistenzsystem erkennt einerseits sein Aktivierungswort stets einwandfrei. Andererseits aktiviert es sich (abgesehen von der manuellen Aktivierung) nie ohne sein Aktivierungswort.

Nichtaktivierung: Nichterkennung des Aktivierungsworts

Im praktischen Einsatz kann es – je nach Aussprache des Benutzers oder Geräuschkulisse rund um die Mikrofone – vorkommen, dass das Sprachassistenzsystem das Aktivierungswort nicht als solches erkennt.

Der Benutzer ist dann gefordert, einen neuerlichen Versuch zu unternehmen. Das Aktivierungswort deutlicher oder lauter auszusprechen, zielgerichteter in Richtung der Mikrofone zu sprechen und für eine ruhigere Umgebung mit weniger Störgeräuschen zu sorgen, erhöhen die Chancen auf eine korrekte Erkennung.

Alternativ kann der Benutzer, sofern es das System unterstützt, auf dessen manuelle Aktivierung ausweichen.

Fehlaktivierung: Aktivierung trotz nicht gesprochenen Aktivierungsworts

Auch der umgekehrte Fall kann in der Praxis auftreten, nämlich, dass das Sprachassistenzsystem nicht nur (korrekterweise) auf das Aktivierungswort, sondern auch fälschlicherweise auf ähnlich klingende Wörter oder (andere) Geräusche reagiert und sich aktiviert. Dies kann z. B. durch Musik oder sich untereinander unterhaltende Personen ausgelöst werden. Eine solche Fehlaktivierung kann bei Online-Systemen Probleme beispielsweise hinsichtlich Privatsphäre oder Datenschutz nach sich ziehen, weil dann Gesprochenes oder Umgebungsgeräusche unvermutet und unabsichtlich auf den Servern des Anbieters landen.

Um Fehlaktivierungen zu vermeiden, ist es – sofern es das Sprachassistenzsystem zulässt – im Rahmen eines systematischen Vorgehens ratsam, das Aktivierungswort so zu wählen, dass dieses Aktivierungswort sowie auch ähnlich klingende Wörter in der Alltagssprache des Benutzers möglichst nicht vorkommen.

Unterscheidung verschiedener Benutzer

Je nach Anwendungsfall kann es gewünscht sein, dass sich das Sprachassistenzsystem von verschiedenen Benutzern gleichermaßen aktivieren lässt. Dann muss es das Aktivierungswort trotz unterschiedlicher Dialekte, Stimmlagen, Sprechtempi oder Wortbetonungen erkennen.

Im Gegensatz dazu kann es in anderen Szenarien gewünscht sein, dass sich das Sprachassistenzsystem nur von bestimmten Benutzern aktivieren lässt und von allen anderen nicht. Beispielsweise kann es sinnvoll sein, die Aktivierung nur dem Fahrer eines Fahrzeugs zu erlauben, den Mitfahrenden jedoch nicht.

Auch kann es gewünscht sein, dass das Sprachassistenzsystem verschiedene Benutzer unterscheiden kann und ihnen, abhängig von ihren jeweiligen Berechtigungen, unterschiedliche Dienste anbietet. Dann muss es den Benutzer identifizieren können, z. B. anhand des Aktivierungsworts oder anderer Parameter wie der Position des Benutzers. Beispielsweise können Fahrer und Beifahrer anhand ihrer Sitzposition unterschieden werden, und der Beifahrer soll nur einen eingeschränkten Funktionsumfang des Assistenten nutzen dürfen.

Audio Injection

Sprachassistenzsysteme können durch Audio Injection angegriffen und missbraucht werden.

Beispiele

Beispiele für Sprachassistenten und deren Aktivierungswörter sind:

Sprachassistenten und Aktivierungswörter
Sprachassistent Anbieter Aktivierungswort
Alexa Amazon
  • „Alexa“
  • „Amazon“[9][10]
  • „Computer“
  • „Echo“[4]
Google Assistant Google
  • „Hey, Google“
  • „Okay, Google“[5]
Siri Apple
  • „Hey, Siri“[3]
Bixby Samsung
  • „Hey, Bixby“
Cortana Microsoft
  • „Hey, Cortana“[11]
ID Volkswagen (VW.os)
  • „Hello, ID“
Intelligent Personal Assistant BMW
  • „Hey, BMW“
  • (weitere individualisierbar)[12]
Jasper Open-Source-GitHub-Projekt
  • „Jasper“[8]
MBUX Mercedes-Benz
  • „Hey, Mercedes“[13]
Snips Snips
  • „Hey, Snips“
  • (weitere individualisierbar)[6]


Einzelnachweise

  1. a b c d Sven Hansen, Nico Jurran, Stefan Porteck: Sprachassistenten durchdringen den Alltag. heise online, 13. September 2019, abgerufen am 23. September 2019.
  2. Axel Kannenberg: Googles Sprachassistent: Mitarbeiter hören und bewerten Audioaufnahmen. heise online, 11. Juli 2019, abgerufen am 23. September 2019.
  3. a b c Siri auf allen Apple-Geräten verwenden. Apple, 6. Mai 2019, abgerufen am 22. September 2019.
  4. a b Häufige Fragen. Amazon, abgerufen am 23. September 2019.
  5. a b c Turn "OK Google" (hotword) on or off - Pixel Slate Help. Google LLC, abgerufen am 23. September 2019 (englisch).
  6. a b c Snips | Voice AI Platform. Abgerufen am 22. September 2019 (englisch).
  7. a b Datenschutzportal für Alexa. Amazon, abgerufen am 23. September 2019.
  8. a b Jasper | Control everything with your voice. Abgerufen am 22. September 2019 (englisch).
  9. Hilfe: Aktivierungswort ändern. Amazon, abgerufen am 22. September 2019.
  10. Hilfe: Verwenden Sie Alexa auf Ihrem Fire Tablet. Amazon, abgerufen am 22. September 2019.
  11. Was ist Cortana? Microsoft, 21. Mai 2019, abgerufen am 22. September 2019.
  12. Der BMW Intelligent Personal Assistant heute und morgen. In: AutoFrey. 15. Januar 2019, abgerufen am 22. September 2019.
  13. André Berton: MBUX Voice Assistant: Versteht dich von selbst. Daimler AG, 28. Dezember 2018, abgerufen am 22. September 2019.