„Aktivierungswort“ – Versionsunterschied

Versionsgeschichte interaktiv durchsuchen

[gesichtete Version]

Inhalt gelöscht Inhalt hinzugefügt

Inline

Aktuelle Version vom 26. Oktober 2023, 20:06 Uhr

Ein Aktivierungswort (englisch hotword oder wake word), gelegentlich auch Aufwachwort, Aufwachbefehl oder Triggerwort genannt, ist ein Wort, das – wenn es vom Benutzer ausgesprochen wird – dazu dient, einen Sprachassistenten zu aktivieren, um dann mit ihm – meist verbal und akustisch in (annähernd) natürlicher Sprache – zu interagieren.^[1]^[2] Ein Aktivierungswort ist also ein spezieller Sprachbefehl im Zusammenhang mit Sprachsteuerung, der einen Sprachassistenten zwecks weiterer Konversation aktiviert. Anstelle eines einzelnen Worts kann auch eine Phrase (z. B. häufig in Form einer Anrede) als Aktivierungswort dienen.

Das Aktivierungswort kann – je nach Sprachassistenzsystem – entweder

fix vorgegeben,^[3]^[4]^[5]
aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder^[6]^[7]
vom Benutzer individuell frei vorgebbar sein.^[8]

Manche Systeme können nicht nur mit einem einzigen Aktivierungswort, sondern mit mehreren verschiedenen Aktivierungswörtern aktiviert werden. Dies können zum Beispiel Geräte sein, die nicht nur einen, sondern mehrere verschiedene Sprachassistenten integriert haben.^[9]

Funktionsablauf

Allgemeines

Das Aktivierungswort wird vom Benutzer so ausgesprochen, dass es von den Mikrofonen des Endgeräts des Sprachassistenzsystems empfangen wird. Erkennt das System das Aktivierungswort, gibt es dem Benutzer üblicherweise eine entsprechende Rückmeldung, dass es nun aktiv (also interaktionsbereit) ist. Der Benutzer kann dann seine eigentliche Konversation mit dem Assistenten beginnen und ihm beispielsweise eine Frage stellen oder einen Befehl erteilen.^[1]^[10]

Die zum Erkennen des Aktivierungsworts nötige Rechenleistung wird offline, also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten online, also per Internetverbindung über Server des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die Spracherkennung für das Erkennen des Benutzerwunschs und die Sprachsynthese für die sprachliche Antwort des Systems an den Benutzer.^[1]^[10] Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.^[8]^[11]^[1]

Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z. B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.^[7]^[3]^[5]

Theorie

Jene Funktionseinheit des Sprachassistenzsystems, die auf Basis eines empfangenen Audiosignals, das als mögliches Aktivierungswort interpretiert werden könnte, entscheidet, ob das Sprachassistenzsystem aktiviert oder nicht aktiviert wird, arbeitet als binärer Klassifikator. Diese Klassifizierung der Audiosignale funktioniert in der Praxis nicht perfekt, es passieren Fehler (was auch auf den Einsatz von Künstlicher Intelligenz zurückzuführen ist).^[12] Es können somit die folgenden vier Fälle auftreten:

Richtig positiv: Das Aktivierungswort wurde gesprochen, und es wurde korrekterweise als Aktivierungswort erkannt; das Sprachassistenzsystem wurde also korrekterweise aktiviert.
Falsch negativ: Das Aktivierungswort wurde gesprochen, aber es wurde fälschlicherweise nicht als Aktivierungswort erkannt; das Sprachassistenzsystem wurde also fälschlicherweise nicht aktiviert.
Falsch positiv: Das Aktivierungswort wurde nicht gesprochen, aber es wurde fälschlicherweise als Aktivierungswort eingestuft; das Sprachassistenzsystem wurde also fälschlicherweise aktiviert.
Richtig negativ: Das Aktivierungswort wurde nicht gesprochen, und es wurde korrekterweise nicht als Aktivierungswort eingestuft; das Sprachassistenzsystem wurde also korrekterweise nicht aktiviert.

Um Fehlklassifikationen (hier also die beiden Fälle 2 und 3) möglichst zu vermeiden, ist es nötig, dass der Klassifikator geeignet parametriert ist. Bei manchen Sprachassistenzsystemen kann der Benutzer hierzu bestimmte Einstellungen selbst vornehmen. So soll es etwa Google Assistant erlauben, die Empfindlichkeit des Ansprechens auf dessen Aktivierungswort an die jeweiligen Vorlieben des Benutzers anzupassen.^[13]

Herausforderungen und Problembereiche

Ideales Sprachassistenzsystem

Ein ideales Sprachassistenzsystem erkennt einerseits sein Aktivierungswort stets einwandfrei. Andererseits aktiviert es sich (abgesehen von der manuellen Aktivierung) nie ohne sein Aktivierungswort.

Nichtaktivierung: Nichterkennung des Aktivierungsworts

Im praktischen Einsatz kann es – je nach Aussprache des Benutzers oder Geräuschkulisse rund um die Mikrofone – vorkommen, dass das Sprachassistenzsystem das Aktivierungswort nicht als solches erkennt.

Der Benutzer ist dann gefordert, einen neuerlichen Versuch zu unternehmen. Das Aktivierungswort deutlicher oder lauter auszusprechen, zielgerichteter in Richtung der Mikrofone zu sprechen und für eine ruhigere Umgebung mit weniger Störgeräuschen zu sorgen, erhöhen die Chancen auf eine korrekte Erkennung.

Alternativ kann der Benutzer, sofern es das System unterstützt, auf dessen manuelle Aktivierung ausweichen.

Fehlaktivierung: Aktivierung trotz nicht gesprochenen Aktivierungsworts

Auch der umgekehrte Fall kann in der Praxis auftreten, nämlich, dass das Sprachassistenzsystem nicht nur (korrekterweise) auf das Aktivierungswort, sondern auch fälschlicherweise auf ähnlich klingende Wörter oder (andere) Geräusche reagiert und sich aktiviert. Dies kann z. B. durch Musik oder sich untereinander unterhaltende Personen ausgelöst werden. Eine solche Fehlaktivierung kann bei Online-Systemen Probleme beispielsweise hinsichtlich Privatsphäre oder Datenschutz nach sich ziehen, weil dann Gesprochenes oder Umgebungsgeräusche unvermutet und unabsichtlich auf den Servern des Anbieters landen.

Um Fehlaktivierungen zu vermeiden, ist es – sofern es das Sprachassistenzsystem zulässt – im Rahmen eines systematischen Vorgehens ratsam, das Aktivierungswort so zu wählen, dass dieses Aktivierungswort sowie auch ähnlich klingende Wörter in der Alltagssprache des Benutzers möglichst nicht vorkommen.

Unterscheidung verschiedener Benutzer

Benutzerunabhängigkeit

Je nach Anwendungsfall kann es gewünscht sein, dass sich das Sprachassistenzsystem von verschiedenen Benutzern gleichermaßen aktivieren lässt. Dann muss es das Aktivierungswort trotz unterschiedlicher Dialekte, Stimmlagen, Sprechtempi oder Wortbetonungen erkennen.

Unterscheidung von Benutzer-Rollen

Im Gegensatz dazu kann es in anderen Szenarien gewünscht sein, dass sich das Sprachassistenzsystem nur von bestimmten Benutzern aktivieren lässt und von allen anderen nicht. Beispielsweise kann es sinnvoll sein, die Aktivierung nur dem Fahrer eines Fahrzeugs zu erlauben, den Mitfahrenden jedoch nicht. Eine Sprecherauthentifizierung, also die Erkennung des Individuums, ist dazu unter Umständen nicht nötig; es kann ausreichend sein, wenn das System die Rolle des Sprechers, beispielsweise anhand seiner Sitzposition, ermittelt und dadurch den Aktivierungsberechtigten, im Beispiel also den Fahrer, als solchen erkennt. Ein Sprachassistenzsystem, das Sprecher zwar nicht identifizieren, jedoch deren Rollen unterscheiden kann, kann den Benutzern unterschiedliche Dienste anbieten, die an deren Rollen geknüpft sind. Zum Beispiel können Fahrer und Beifahrer anhand ihrer Sitzposition unterschieden werden, ohne sie hierfür identifizieren zu müssen, indem der Assistent auswertet, von welcher Seite das Aktivierungswort bzw. der Schall primär kommt; und der Beifahrer darf nur einen eingeschränkten Funktionsumfang des Assistenten nutzen.^[14]

Unterscheidung von Benutzer-Individuen

Wie bei einem klassischen Mehrbenutzersystem kann es gewünscht sein, dass das Sprachassistenzsystem verschiedene Benutzer (als Individuum) unterscheiden kann, um ihnen personalisierte Dienste anzubieten. Dann muss es den Benutzer identifizieren können, z. B. anhand seiner Stimme, des Aktivierungsworts oder anderer Parameter. Beispiel: Wenn Benutzer A den Assistenten anweist, einen Termin zu notieren, dann soll dieser Termin im persönlichen Kalender dieses Benutzers A eingetragen werden und nicht im Kalender eines anderen Benutzers B landen.

Angriffsszenarien

Audio Injection

Sprachassistenzsysteme können durch Audio Injection angegriffen und missbraucht werden.

Laser-Based Audio Injection

Durch direktes Bestrahlen des Mikrofons mit einem Laserstrahl kann es Angreifern gelingen, Sprachassistenzsysteme zu befehligen – ihnen also „Lichtbefehle“ zu erteilen. Dazu wird der Laserstrahl derart in seiner Lichtintensität moduliert, dass er im Mikrofon sehr ähnliche elektrische Signale induziert, wie sie sich normalerweise durch die echten Sprachbefehle ergeben würden. So können das Aktivierungswort und zudem auszuführende Befehle unhörbar und auch aus zig Metern Entfernung an das Sprachassistenzsystem übermittelt werden. Insbesondere anfällig für diese Art von Attacke sind Systeme mit MEMS-Mikrofonen, da sie die Eigenschaft haben, nicht nur Schall, sondern auch Licht, das direkt auf sie gerichtet ist, in elektrische Signale umzuwandeln.^[15]^[16]

Gesellschaftliche Auswirkungen

Aktivierungswörter, die gleichlautend wie menschliche Namen sind, können gesellschaftliche Auswirkungen nach sich ziehen:^[17]

So hat sich wegen Amazons Aktivierungswort „Alexa“ gezeigt, dass in den USA kurz nach der Vorstellung des Sprachassistenten etwas mehr Kinder auf den Vornamen Alexa getauft wurden, in den Jahren danach aber ein starker Rückgang zu verzeichnen war. Auch in anderen Staaten wie Deutschland, England und Kanada waren ähnliche Effekte zu beobachten.

Kinder und Mädchen namens Alexa sind mitunter Hänseleien oder sogar Mobbing ausgesetzt. Ihnen werden beispielsweise Befehle erteilt – so, als wären sie Dienerinnen oder Sklavinnen.

Beispiele

Beispiele für Sprachassistenten und deren Aktivierungswörter sowie für Geräte, die diese Assistenten nutzen können, sind:

Sprachassistenten und Aktivierungswörter
Sprachassistent	Anbieter	Aktivierungswort	Beispiele für nutzende Geräte
Alexa	Amazon	„Alexa“ „Amazon“^[18]^[19] „Computer“ „Echo“^[6] „Ziggy“^[20]	Amazon Echo Hallo Magenta^[9] Xbox One^[21] Sonos One, Move und Beam^[22]^[23]
Google Assistant	Google	„Hey, Google“ „Okay, Google“^[7]	Google Home Xbox One^[24] Sonos One, Move und Beam^[22]^[25]
Siri	Apple	„Hey, Siri“^[3]	Apple Watch iPad iPhone HomePod PCs mit macOS^[26]
Bixby	Samsung	„Hi, Bixby“^[5]^[27]	Galaxy
Cortana	Microsoft	„Hey, Cortana“^[4]	PCs mit Windows 10 Xbox One^[24]
Hallo Magenta	Deutsche Telekom	„Hallo Magenta“^[9]^[28] „Hey Magenta“ „Hi Magenta“ („Alexa“ … Amazon)^[28]	Smart Speaker^[29] Smart Speaker Mini^[30]
Voice Mate	LG Electronics	(nur per Tastendruck)^[31]	bestimmte LG-Fernseher mit webOS
	Volkswagen (vw.os)	„Hallo, ID“ (deutsch)^[32] bzw. „Hello, ID“ (englisch)^[14]^[33]	VW ID.3 VW ID.4
Laura	Škoda Auto	„Okay, Laura“^[34]^[35]	Škoda Enyaq
Intelligent Personal Assistant	BMW	„Hey, BMW“ (weitere individualisierbar)^[36]
MBUX	Mercedes-Benz	„Hey, Mercedes“^[37]
Jasper	Open-Source-GitHub-Projekt	„Jasper“^[11]
Sonos Voice Control	Sonos	„Hey Sonos“
Mycroft	Mycroft	„Hey, Mycroft“ (weitere individualisierbar)^[38]	PCs Raspberry Pi
	Sony	„Hey, Playstation“^[39]	PlayStation 5
	Fortebit (EasyVR 3 Plus)	„Robot“ (ersetzbar) (weitere individualisierbar)	nutzbar per UART-Schnittstelle, z. B. mit Arduino^[40]

Siehe auch

Einzelnachweise

↑ ^a ^b ^c ^d Sven Hansen, Nico Jurran, Stefan Porteck: Sprachassistenten durchdringen den Alltag. In: heise online. Heise Medien, 13. September 2019, abgerufen am 23. September 2019.
↑ Axel Kannenberg: Googles Sprachassistent: Mitarbeiter hören und bewerten Audioaufnahmen. In: heise online. Heise Medien, 11. Juli 2019, abgerufen am 23. September 2019.
↑ ^a ^b ^c Siri auf allen Apple-Geräten verwenden. Apple, 6. Mai 2019, abgerufen am 22. September 2019.
↑ ^a ^b Was ist Cortana? Microsoft, 21. Mai 2019, abgerufen am 22. September 2019.
↑ ^a ^b ^c Bixby: Die 4 Wege mit Bixby zu sprechen. Abgerufen am 24. September 2019.
↑ ^a ^b Häufige Fragen. Amazon, abgerufen am 23. September 2019.
↑ ^a ^b ^c Turn "OK Google" (hotword) on or off - Pixel Slate Help. Google, abgerufen am 23. September 2019 (englisch).
↑ ^a ^b Snips | Voice AI Platform. Abgerufen am 22. September 2019 (englisch).
↑ ^a ^b ^c Hallo Magenta: Der Telekom Smart Speaker | Telekom. Telekom Deutschland, abgerufen am 30. September 2019.
↑ ^a ^b Datenschutzportal für Alexa. Amazon, abgerufen am 23. September 2019.
↑ ^a ^b Jasper | Control everything with your voice. Abgerufen am 22. September 2019 (englisch).
↑ Daniel Herbig: Studie: "Gilmore Girls" und "The Office" lösen Alexa und Co. besonders oft aus. In: heise online. Heise Medien, 24. Februar 2020, abgerufen am 23. April 2020.
↑ Daniel Herbig: Google Assistant: Wakeword-Empfindlichkeit lässt sich bald einstellen. In: heise online. Heise Medien, 22. April 2020, abgerufen am 23. April 2020.
↑ ^a ^b VW ID.3 | Erster Check | Sitzprobe | Display | Bedienung – 163 Grad im Volkswagen ID.3 auf der IAA. Abgerufen am 24. September 2019.
↑ Dennis Schirrmacher: Sicherheitsforscher befehligen Alexa, Siri & Co. via Laserstrahl. In: heise online. Heise Medien, 6. November 2019, abgerufen am 9. November 2019.
↑ Takeshi Sugawara, Benjamin Cyr, Sara Rampazzi, Daniel Genkin, Kevin Fu: Light Commands: Laser-Based Audio Injection on Voice-Controllable Systems. 2019, abgerufen am 9. November 2019 (englisch).
↑ Martin Holland: Amazons Alexa: Eltern meiden "verdorbenen Vornamen", Kinder beklagen Mobbing. In: heise online. Heise Medien, 23. August 2021, abgerufen am 24. August 2021.
↑ Hilfe: Aktivierungswort ändern. Amazon, abgerufen am 22. September 2019.
↑ Hilfe: Verwenden Sie Alexa auf Ihrem Fire Tablet. Amazon, abgerufen am 22. September 2019.
↑ Daniel Herbig: Amazon: Assistentin Alexa hört nun auf "Ziggy". In: heise online. Heise Medien, 15. März 2022, abgerufen am 15. März 2022.
↑ Denise Bergert: Microsoft: Alexa Xbox Skill kommt nach Deutschland. In: heise online. Heise Medien, 9. Juli 2019, abgerufen am 30. September 2019.
↑ ^a ^b Setup, Installation und Steuerung. Sonos, abgerufen am 15. Oktober 2019.
↑ Alexa auf Sonos. Sonos, abgerufen am 15. Oktober 2019.
↑ ^a ^b Bernd Mewes: Xbox: Microsoft erweitert Sprachsteuerung mit Google Assistant. In: heise online. Heise Medien, 27. September 2019, abgerufen am 30. September 2019.
↑ Google Assistant auf Sonos. Sonos, abgerufen am 15. Oktober 2019.
↑ Geräte, die "Hey Siri" unterstützen. Apple, 6. September 2019, abgerufen am 11. Oktober 2019.
↑ Bixby | Apps & Services. Samsung, abgerufen am 24. September 2019.
↑ ^a ^b Hallo Magenta: Der Telekom Smart Speaker | Telekom. Telekom Deutschland, abgerufen am 10. Juni 2020.
↑ Telekom Smart Speaker bestellen | Telekom. Telekom Deutschland, archiviert vom Original (nicht mehr online verfügbar) am 10. Juni 2020; abgerufen am 10. Juni 2020. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.telekom.de
↑ Smart Speaker Mini | Telekom. Telekom Deutschland, archiviert vom Original (nicht mehr online verfügbar) am 10. Juni 2020; abgerufen am 10. Juni 2020. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.telekom.de
↑ [LG webOS TV] Verwendung der Spracherkennung. In: FAQ's. LG Electronics, 21. Juli 2015, abgerufen am 11. Oktober 2019.
↑ VW ID.3: eine neue Ära der E-Mobilität. In: Volkswagen AG. Porsche Austria, 2020, abgerufen am 2. August 2020.
↑ VW ID.3 Multimedia, HUD mit augmented reality und Displays – IAA Live. Abgerufen am 30. September 2019.
↑ LAURA. Abgerufen am 11. Oktober 2021.
↑ ŠKODA Connect. ŠKODA AUTO Deutschland, abgerufen am 11. Oktober 2021.
↑ Der BMW Intelligent Personal Assistant heute und morgen. In: AutoFrey. 15. Januar 2019, abgerufen am 22. September 2019.
↑ André Berton: MBUX Voice Assistant: Versteht dich von selbst. Daimler AG, 28. Dezember 2018, archiviert vom Original (nicht mehr online verfügbar) am 22. September 2019; abgerufen am 22. September 2019. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/blog.daimler.com
↑ Using a Custom Wake Word. In: mycroft.ai. Abgerufen am 27. Januar 2022.
↑ Daniel Herbig: Sony: Playstation 5 hört auf Sprachkommandos. In: heise online. Heise Medien, 9. Februar 2022, abgerufen am 10. Februar 2022.
↑ Heinz Behling: Video-Tutorial: Sprachgesteuerte Infrarot- und Funk-Fernbedienung mit Arduino. In: heise online. Heise Medien, 4. Mai 2020, abgerufen am 4. Mai 2020.

[:2-1] Sven Hansen, Nico Jurran, Stefan Porteck: Sprachassistenten durchdringen den Alltag. In: heise online. Heise Medien, 13. September 2019, abgerufen am 23. September 2019.

[2] Axel Kannenberg: Googles Sprachassistent: Mitarbeiter hören und bewerten Audioaufnahmen. In: heise online. Heise Medien, 11. Juli 2019, abgerufen am 23. September 2019.

[:6-3] Siri auf allen Apple-Geräten verwenden. Apple, 6. Mai 2019, abgerufen am 22. September 2019.

[:7-4] Was ist Cortana? Microsoft, 21. Mai 2019, abgerufen am 22. September 2019.

[:8-5] Bixby: Die 4 Wege mit Bixby zu sprechen. Abgerufen am 24. September 2019.

[:3-6] Häufige Fragen. Amazon, abgerufen am 23. September 2019.

[:5-7] Turn "OK Google" (hotword) on or off - Pixel Slate Help. Google, abgerufen am 23. September 2019 (englisch).

[:0-8] Snips | Voice AI Platform. Abgerufen am 22. September 2019 (englisch).

[:10-9] Hallo Magenta: Der Telekom Smart Speaker | Telekom. Telekom Deutschland, abgerufen am 30. September 2019.

[:4-10] Datenschutzportal für Alexa. Amazon, abgerufen am 23. September 2019.

[:1-11] Jasper | Control everything with your voice. Abgerufen am 22. September 2019 (englisch).

[12] Daniel Herbig: Studie: "Gilmore Girls" und "The Office" lösen Alexa und Co. besonders oft aus. In: heise online. Heise Medien, 24. Februar 2020, abgerufen am 23. April 2020.

[13] Daniel Herbig: Google Assistant: Wakeword-Empfindlichkeit lässt sich bald einstellen. In: heise online. Heise Medien, 22. April 2020, abgerufen am 23. April 2020.

[:9-14] VW ID.3 | Erster Check | Sitzprobe | Display | Bedienung – 163 Grad im Volkswagen ID.3 auf der IAA. Abgerufen am 24. September 2019.

[15] Dennis Schirrmacher: Sicherheitsforscher befehligen Alexa, Siri & Co. via Laserstrahl. In: heise online. Heise Medien, 6. November 2019, abgerufen am 9. November 2019.

[16] Takeshi Sugawara, Benjamin Cyr, Sara Rampazzi, Daniel Genkin, Kevin Fu: Light Commands: Laser-Based Audio Injection on Voice-Controllable Systems. 2019, abgerufen am 9. November 2019 (englisch).

[:14-17] Martin Holland: Amazons Alexa: Eltern meiden "verdorbenen Vornamen", Kinder beklagen Mobbing. In: heise online. Heise Medien, 23. August 2021, abgerufen am 24. August 2021.

[18] Hilfe: Aktivierungswort ändern. Amazon, abgerufen am 22. September 2019.

[19] Hilfe: Verwenden Sie Alexa auf Ihrem Fire Tablet. Amazon, abgerufen am 22. September 2019.

[20] Daniel Herbig: Amazon: Assistentin Alexa hört nun auf "Ziggy". In: heise online. Heise Medien, 15. März 2022, abgerufen am 15. März 2022.

[21] Denise Bergert: Microsoft: Alexa Xbox Skill kommt nach Deutschland. In: heise online. Heise Medien, 9. Juli 2019, abgerufen am 30. September 2019.

[:12-22] Setup, Installation und Steuerung. Sonos, abgerufen am 15. Oktober 2019.

[23] Alexa auf Sonos. Sonos, abgerufen am 15. Oktober 2019.

[:11-24] Bernd Mewes: Xbox: Microsoft erweitert Sprachsteuerung mit Google Assistant. In: heise online. Heise Medien, 27. September 2019, abgerufen am 30. September 2019.

[25] Google Assistant auf Sonos. Sonos, abgerufen am 15. Oktober 2019.

[26] Geräte, die "Hey Siri" unterstützen. Apple, 6. September 2019, abgerufen am 11. Oktober 2019.

[27] Bixby | Apps & Services. Samsung, abgerufen am 24. September 2019.

[:13-28] Hallo Magenta: Der Telekom Smart Speaker | Telekom. Telekom Deutschland, abgerufen am 10. Juni 2020.

[29] Telekom Smart Speaker bestellen | Telekom. Telekom Deutschland, archiviert vom Original (nicht mehr online verfügbar) am 10. Juni 2020; abgerufen am 10. Juni 2020. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.telekom.de

[30] Smart Speaker Mini | Telekom. Telekom Deutschland, archiviert vom Original (nicht mehr online verfügbar) am 10. Juni 2020; abgerufen am 10. Juni 2020. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.telekom.de

[31] [LG webOS TV] Verwendung der Spracherkennung. In: FAQ's. LG Electronics, 21. Juli 2015, abgerufen am 11. Oktober 2019.

[32] VW ID.3: eine neue Ära der E-Mobilität. In: Volkswagen AG. Porsche Austria, 2020, abgerufen am 2. August 2020.

[33] VW ID.3 Multimedia, HUD mit augmented reality und Displays – IAA Live. Abgerufen am 30. September 2019.

[34] LAURA. Abgerufen am 11. Oktober 2021.

[35] ŠKODA Connect. ŠKODA AUTO Deutschland, abgerufen am 11. Oktober 2021.

[36] Der BMW Intelligent Personal Assistant heute und morgen. In: AutoFrey. 15. Januar 2019, abgerufen am 22. September 2019.

[37] André Berton: MBUX Voice Assistant: Versteht dich von selbst. Daimler AG, 28. Dezember 2018, archiviert vom Original (nicht mehr online verfügbar) am 22. September 2019; abgerufen am 22. September 2019. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/blog.daimler.com

[38] Using a Custom Wake Word. In: mycroft.ai. Abgerufen am 27. Januar 2022.

[39] Daniel Herbig: Sony: Playstation 5 hört auf Sprachkommandos. In: heise online. Heise Medien, 9. Februar 2022, abgerufen am 10. Februar 2022.

[40] Heinz Behling: Video-Tutorial: Sprachgesteuerte Infrarot- und Funk-Fernbedienung mit Arduino. In: heise online. Heise Medien, 4. Mai 2020, abgerufen am 4. Mai 2020.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

„Aktivierungswort“ – Versionsunterschied

Aktuelle Version vom 26. Oktober 2023, 20:06 Uhr

Inhaltsverzeichnis

Funktionsablauf

Allgemeines

Theorie

Herausforderungen und Problembereiche

Ideales Sprachassistenzsystem

Nichtaktivierung: Nichterkennung des Aktivierungsworts

Fehlaktivierung: Aktivierung trotz nicht gesprochenen Aktivierungsworts

Unterscheidung verschiedener Benutzer

Benutzerunabhängigkeit

Unterscheidung von Benutzer-Rollen

Unterscheidung von Benutzer-Individuen

Angriffsszenarien

Audio Injection

Laser-Based Audio Injection

Gesellschaftliche Auswirkungen

Beispiele

Siehe auch

Einzelnachweise

Navigationsmenü

@@ Zeile 1: / Zeile 1: @@
-Ein '''Aktivierungswort''' ({{EnS|hotword}}), gelegentlich auch '''Aufwachwort''' oder '''Aufwachbefehl''' genannt, ist ein [[Wort]], das –&nbsp;wenn es vom [[Benutzer]] [[Sprechen|ausgesprochen]] wird&nbsp;– dazu dient, einen [[Sprachassistent|Sprachassistenten]] zu aktivieren, um dann mit ihm –&nbsp;meist verbal und akustisch in (annähernd) [[Natürliche Sprache|natürlicher Sprache]]&nbsp;– zu [[Interaktion|interagieren]].<ref name=":2" /><ref>{{Internetquelle |autor=Axel Kannenberg |url=https://heise.de/-4467985 |titel=Googles Sprachassistent: Mitarbeiter hören und bewerten Audioaufnahmen |werk= |hrsg=[[heise online]] |datum=2019-07-11 |abruf=2019-09-23 |sprache=de}}</ref> Ein Aktivierungswort ist also ein spezieller Sprachbefehl im Zusammenhang mit [[Sprachsteuerung]], der einen Sprachassistenten zwecks weiterer [[Konversation (Gespräch)|Konversation]] aktiviert. Anstelle eines einzelnen Worts kann auch eine [[Phrase (Linguistik)|Phrase]] (z.&nbsp;B. häufig in Form einer [[Anrede]]) als Aktivierungswort dienen.
+Ein '''Aktivierungswort''' ({{EnS|hotword}} oder ''{{lang|en|wake word}}''), gelegentlich auch '''Aufwachwort''', '''Aufwachbefehl''' oder '''Triggerwort''' genannt, ist ein [[Wort]], das –&nbsp;wenn es vom [[Benutzer]] [[Sprechen|ausgesprochen]] wird&nbsp;– dazu dient, einen [[Sprachassistent]]en zu aktivieren, um dann mit ihm –&nbsp;meist verbal und akustisch in (annähernd) [[Natürliche Sprache|natürlicher Sprache]]&nbsp;– zu [[Interaktion|interagieren]].<ref name=":2" /><ref>{{Internetquelle |autor=Axel Kannenberg |url=https://heise.de/-4467985 |titel=Googles Sprachassistent: Mitarbeiter hören und bewerten Audioaufnahmen |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2019-07-11 |abruf=2019-09-23}}</ref> Ein Aktivierungswort ist also ein spezieller Sprachbefehl im Zusammenhang mit [[Sprachsteuerung]], der einen Sprachassistenten zwecks weiterer [[Konversation (Gespräch)|Konversation]] aktiviert. Anstelle eines einzelnen Worts kann auch eine [[Phrase (Linguistik)|Phrase]] (z.&nbsp;B. häufig in Form einer [[Anrede]]) als Aktivierungswort dienen.
 Das Aktivierungswort kann –&nbsp;je nach Sprachassistenzsystem&nbsp;– entweder
 * fix vorgegeben,<ref name=":6" /><ref name=":7" /><ref name=":8" />
-* aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder<ref name=":3">{{Internetquelle |autor= |url=https://www.amazon.de/b?ie=UTF8&node=17084417031 |titel=Häufige Fragen |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-23 |sprache=de}}</ref><ref name=":5" />
+* aus einer Liste von fix vorgegebenen Aktivierungswörtern auswählbar oder<ref name=":3">{{Internetquelle |url=https://www.amazon.de/b?ie=UTF8&node=17084417031 |titel=Häufige Fragen |hrsg=[[Amazon]] |abruf=2019-09-23}}</ref><ref name=":5" />
-* vom Benutzer individuell frei vorgebbar sein.<ref name=":0">{{Internetquelle |autor= |url=https://snips.ai/ |titel=Snips {{!}} Voice AI Platform |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref>
+* vom Benutzer individuell frei vorgebbar sein.<ref name=":0">{{Internetquelle |url=https://snips.ai/ |titel=Snips {{!}} Voice AI Platform |abruf=2019-09-22 |sprache=en}}</ref>
-Manche Systeme können nicht nur mit einem einzigen Aktivierungswort, sondern mit mehreren verschiedenen Aktivierungswörtern aktiviert werden.
+Manche Systeme können nicht nur mit einem einzigen Aktivierungswort, sondern mit mehreren verschiedenen Aktivierungswörtern aktiviert werden. Dies können zum Beispiel Geräte sein, die nicht nur einen, sondern mehrere verschiedene Sprachassistenten integriert haben.<ref name=":10" />
 == Funktionsablauf ==
+=== Allgemeines ===
-Das Aktivierungswort wird vom Benutzer so ausgesprochen, dass es von den [[Mikrofon|Mikrofonen]] des [[Endgerät|Endgeräts]] des Sprachassistenzsystems empfangen wird. Erkennt das System das Aktivierungswort, gibt es dem Benutzer üblicherweise eine entsprechende [[Feedback (Kommunikation)|Rückmeldung]], dass es nun aktiv (also interaktionsbereit) ist. Der Benutzer kann dann seine eigentliche Konversation mit dem Assistenten beginnen und ihm beispielsweise eine [[Frage]] stellen oder einen [[Instruktion|Befehl]] erteilen.<ref name=":2">{{Internetquelle |autor=Sven Hansen, Nico Jurran, Stefan Porteck |url=https://heise.de/-4517343 |titel=Sprachassistenten durchdringen den Alltag |werk= |hrsg=[[heise online]] |datum=2019-09-13 |abruf=2019-09-23 |sprache=de}}</ref><ref name=":4">{{Internetquelle |autor= |url=https://www.amazon.de/Datenschutzportal-f%C3%BCr-Alexa/b?ie=UTF8&node=17084415031 |titel=Datenschutzportal für Alexa |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-23 |sprache=de}}</ref>
+Das Aktivierungswort wird vom Benutzer so ausgesprochen, dass es von den [[Mikrofon]]en des [[Endgerät]]s des Sprachassistenzsystems empfangen wird. Erkennt das System das Aktivierungswort, gibt es dem Benutzer üblicherweise eine entsprechende [[Feedback (Kommunikation)|Rückmeldung]], dass es nun aktiv (also interaktionsbereit) ist. Der Benutzer kann dann seine eigentliche Konversation mit dem Assistenten beginnen und ihm beispielsweise eine [[Frage]] stellen oder einen [[Instruktion|Befehl]] erteilen.<ref name=":2">{{Internetquelle |autor=Sven Hansen, Nico Jurran, Stefan Porteck |url=https://heise.de/-4517343 |titel=Sprachassistenten durchdringen den Alltag |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2019-09-13 |abruf=2019-09-23}}</ref><ref name=":4">{{Internetquelle |url=https://www.amazon.de/Datenschutzportal-f%C3%BCr-Alexa/b?ie=UTF8&node=17084415031 |titel=Datenschutzportal für Alexa |hrsg=[[Amazon]] |abruf=2019-09-23}}</ref>
-Die zum Erkennen des Aktivierungsworts nötige [[Rechenleistung]] wird [[offline]], also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten [[online]], also per [[Internetverbindung]] über [[Server]] des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die [[Spracherkennung]] für das Erkennen des Benutzerwunschs und die [[Sprachsynthese]] für die sprachliche Antwort des Systems an den Benutzer.<ref name=":2" /><ref name=":4" /> Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.<ref name=":0" /><ref name=":1">{{Internetquelle |autor= |url=https://jasperproject.github.io/ |titel=Jasper {{!}} Control everything with your voice |werk= |hrsg= |datum= |abruf=2019-09-22 |sprache=en}}</ref><ref name=":2" />
+Die zum Erkennen des Aktivierungsworts nötige [[Rechenleistung]] wird [[offline]], also lokal vom Endgerät erbracht. Erst die eigentliche Interaktion läuft bei vielen Sprachassistenten [[online]], also per [[Internetverbindung]] über [[Server]] des jeweiligen Assistenten-Anbieters. Diese Server leisten dann die [[Spracherkennung]] für das Erkennen des Benutzerwunschs und die [[Sprachsynthese]] für die sprachliche Antwort des Systems an den Benutzer.<ref name=":2" /><ref name=":4" /> Es gibt auch Systeme, die rein offline arbeiten und somit keine Internetverbindung benötigen.<ref name=":0" /><ref name=":1">{{Internetquelle |url=https://jasperproject.github.io/ |titel=Jasper {{!}} Control everything with your voice |abruf=2019-09-22 |sprache=en}}</ref><ref name=":2" />
-Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z.&nbsp;B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.<ref name=":5">{{Internetquelle |autor= |url=https://support.google.com/pixelslate/answer/9136588?hl=en |titel=Turn "OK Google" (hotword) on or off - Pixel Slate Help |werk= |hrsg=[[Google LLC]] |datum= |abruf=2019-09-23 |sprache=en}}</ref><ref name=":6" /><ref name=":8" />
+Je nach Sprachassistenzsystem oder dessen Konfiguration horchen die Mikrofone des Endgeräts entweder permanent auf das Aktivierungswort, oder es werden die Mikrofone erst nach einer manuellen Aktivierung, z.&nbsp;B. per Tastendruck, aktiviert. Im letztgenannten Fall entfällt das Aktivierungswort, da es hier durch die manuelle Aktivierung ersetzt wird.<ref name=":5">{{Internetquelle |url=https://support.google.com/pixelslate/answer/9136588?hl=en |titel=Turn "OK Google" (hotword) on or off - Pixel Slate Help |hrsg=[[Google LLC|Google]] |abruf=2019-09-23 |sprache=en}}</ref><ref name=":6" /><ref name=":8" />
+=== Theorie ===
+Jene Funktionseinheit des Sprachassistenzsystems, die auf Basis eines empfangenen [[Audiosignal]]s, das als mögliches Aktivierungswort interpretiert werden könnte, entscheidet, ob das Sprachassistenzsystem aktiviert oder nicht aktiviert wird, arbeitet als binärer [[Klassifikator]]. Diese [[Klassifizierung]] der Audiosignale funktioniert in der Praxis nicht perfekt, es passieren [[Fehler]] (was auch auf den Einsatz von [[Künstliche Intelligenz|Künstlicher Intelligenz]] zurückzuführen ist).<ref>{{Internetquelle |autor=Daniel Herbig |url=https://heise.de/-4666640 |titel=Studie: "Gilmore Girls" und "The Office" lösen Alexa und Co. besonders oft aus |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2020-02-24 |abruf=2020-04-23}}</ref> Es können somit die folgenden vier Fälle auftreten:
+# ''Richtig positiv'': Das Aktivierungswort wurde gesprochen, und es wurde korrekterweise als Aktivierungswort erkannt; das Sprachassistenzsystem wurde also korrekterweise aktiviert.
+# ''Falsch negativ'': Das Aktivierungswort wurde gesprochen, aber es wurde fälschlicherweise nicht als Aktivierungswort erkannt; das Sprachassistenzsystem wurde also fälschlicherweise nicht aktiviert.
+# ''Falsch positiv'': Das Aktivierungswort wurde nicht gesprochen, aber es wurde fälschlicherweise als Aktivierungswort eingestuft; das Sprachassistenzsystem wurde also fälschlicherweise aktiviert.
+# ''Richtig negativ'': Das Aktivierungswort wurde nicht gesprochen, und es wurde korrekterweise nicht als Aktivierungswort eingestuft; das Sprachassistenzsystem wurde also korrekterweise nicht aktiviert.
+Um Fehlklassifikationen (hier also die beiden Fälle 2 und 3) möglichst zu vermeiden, ist es nötig, dass der Klassifikator geeignet parametriert ist. Bei manchen Sprachassistenzsystemen kann der Benutzer hierzu bestimmte Einstellungen selbst vornehmen. So soll es etwa [[Google Assistant]] erlauben, die Empfindlichkeit des Ansprechens auf dessen Aktivierungswort an die jeweiligen Vorlieben des Benutzers anzupassen.<ref>{{Internetquelle |autor=Daniel Herbig |url=https://heise.de/-4707201 |titel=Google Assistant: Wakeword-Empfindlichkeit lässt sich bald einstellen |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2020-04-22 |abruf=2020-04-23}}</ref>
+{{Siehe auch|Beurteilung eines binären Klassifikators}}
 == Herausforderungen und Problembereiche ==
@@ Zeile 23: / Zeile 36: @@
 Im praktischen Einsatz kann es –&nbsp;je nach [[Aussprache]] des Benutzers oder [[Geräuschkulisse]] rund um die Mikrofone&nbsp;– vorkommen, dass das Sprachassistenzsystem das Aktivierungswort nicht als solches erkennt.
-Der Benutzer ist dann gefordert, einen neuerlichen Versuch zu unternehmen. Das Aktivierungswort deutlicher oder lauter auszusprechen, zielgerichteter in Richtung der Mikrofone zu sprechen und für eine ruhigere Umgebung mit weniger [[Störgeräusch|Störgeräuschen]] zu sorgen, erhöhen die Chancen auf eine korrekte Erkennung.
+Der Benutzer ist dann gefordert, einen neuerlichen Versuch zu unternehmen. Das Aktivierungswort deutlicher oder lauter auszusprechen, zielgerichteter in Richtung der Mikrofone zu sprechen und für eine ruhigere Umgebung mit weniger [[Störgeräusch]]en zu sorgen, erhöhen die Chancen auf eine korrekte Erkennung.
 Alternativ kann der Benutzer, sofern es das System unterstützt, auf dessen manuelle Aktivierung ausweichen.
 === Fehlaktivierung: Aktivierung trotz nicht gesprochenen Aktivierungsworts ===
-Auch der umgekehrte Fall kann in der Praxis auftreten, nämlich, dass das Sprachassistenzsystem nicht nur (korrekterweise) auf das Aktivierungswort, sondern auch fälschlicherweise auf ähnlich klingende Wörter oder (andere) [[Geräusch|Geräusche]] reagiert und sich aktiviert. Dies kann z.&nbsp;B. durch Musik oder sich untereinander unterhaltende Personen ausgelöst werden. Eine solche Fehlaktivierung kann bei Online-Systemen Probleme beispielsweise hinsichtlich [[Privatsphäre]] oder [[Datenschutz]] nach sich ziehen, weil dann Gesprochenes oder Umgebungsgeräusche unvermutet und unabsichtlich auf den Servern des Anbieters landen.
+Auch der umgekehrte Fall kann in der Praxis auftreten, nämlich, dass das Sprachassistenzsystem nicht nur (korrekterweise) auf das Aktivierungswort, sondern auch fälschlicherweise auf ähnlich klingende Wörter oder (andere) [[Geräusch]]e reagiert und sich aktiviert. Dies kann z.&nbsp;B. durch Musik oder sich untereinander unterhaltende Personen ausgelöst werden. Eine solche Fehlaktivierung kann bei Online-Systemen Probleme beispielsweise hinsichtlich [[Privatsphäre]] oder [[Datenschutz]] nach sich ziehen, weil dann Gesprochenes oder Umgebungsgeräusche unvermutet und unabsichtlich auf den Servern des Anbieters landen.
 Um Fehlaktivierungen zu vermeiden, ist es –&nbsp;sofern es das Sprachassistenzsystem zulässt&nbsp;– im Rahmen eines systematischen Vorgehens ratsam, das Aktivierungswort so zu wählen, dass dieses Aktivierungswort sowie auch ähnlich klingende Wörter in der [[Alltagssprache]] des Benutzers möglichst nicht vorkommen.
 === Unterscheidung verschiedener Benutzer ===
+==== Benutzerunabhängigkeit ====
 Je nach Anwendungsfall kann es gewünscht sein, dass sich das Sprachassistenzsystem von verschiedenen Benutzern gleichermaßen aktivieren lässt. Dann muss es das Aktivierungswort trotz unterschiedlicher [[Dialekt]]e, [[Stimmlage]]n, [[Sprechtempo|Sprechtempi]] oder [[Wortbetonung]]en erkennen.
+==== Unterscheidung von Benutzer-Rollen ====
-Im Gegensatz dazu kann es in anderen Szenarien gewünscht sein, dass sich das Sprachassistenzsystem nur von bestimmten Benutzern aktivieren lässt und von allen anderen nicht. Beispielsweise kann es sinnvoll sein, die Aktivierung nur dem [[Fahrer]] eines [[Fahrzeug]]s zu erlauben, den Mitfahrenden jedoch nicht.
+Im Gegensatz dazu kann es in anderen Szenarien gewünscht sein, dass sich das Sprachassistenzsystem nur von bestimmten Benutzern aktivieren lässt und von allen anderen nicht. Beispielsweise kann es sinnvoll sein, die Aktivierung nur dem [[Fahrer]] eines [[Fahrzeug]]s zu erlauben, den Mitfahrenden jedoch nicht. Eine [[Sprecherauthentifizierung]], also die Erkennung des [[Individuum]]s, ist dazu unter Umständen nicht nötig; es kann ausreichend sein, wenn das System die Rolle des Sprechers, beispielsweise anhand seiner Sitzposition, ermittelt und dadurch den Aktivierungsberechtigten, im Beispiel also den Fahrer, als solchen erkennt. Ein Sprachassistenzsystem, das Sprecher zwar nicht identifizieren, jedoch deren Rollen unterscheiden kann, kann den Benutzern unterschiedliche Dienste anbieten, die an deren Rollen geknüpft sind. Zum Beispiel können Fahrer und [[Beifahrer]] anhand ihrer Sitzposition unterschieden werden, ohne sie hierfür identifizieren zu müssen, indem der Assistent auswertet, von welcher Seite das Aktivierungswort bzw. der [[Schall]] primär kommt; und der Beifahrer darf nur einen eingeschränkten Funktionsumfang des Assistenten nutzen.<ref name=":9" />
+==== Unterscheidung von Benutzer-Individuen ====
-Auch kann es gewünscht sein, dass das Sprachassistenzsystem verschiedene Benutzer unterscheiden kann und ihnen, abhängig von ihren jeweiligen Berechtigungen, unterschiedliche Dienste anbietet. Dann muss es den [[Sprecherauthentifizierung|Benutzer identifizieren]] können, z.&nbsp;B. anhand des Aktivierungsworts oder anderer Parameter wie der Position des Benutzers. Beispielsweise können Fahrer und [[Beifahrer]] anhand ihrer Sitzposition unterschieden werden, und der Beifahrer soll nur einen eingeschränkten Funktionsumfang des Assistenten nutzen dürfen.<ref name=":9" />
+Wie bei einem klassischen [[Mehrbenutzersystem]] kann es gewünscht sein, dass das Sprachassistenzsystem verschiedene Benutzer (als Individuum) unterscheiden kann, um ihnen [[Personalisierung (Informationstechnik)|personalisierte]] Dienste anzubieten. Dann muss es den [[Sprecherauthentifizierung|Benutzer identifizieren]] können, z.&nbsp;B. anhand seiner [[Menschliche Stimme|Stimme]], des Aktivierungsworts oder anderer Parameter. Beispiel: Wenn Benutzer ''A'' den Assistenten anweist, einen Termin zu notieren, dann soll dieser Termin im persönlichen Kalender dieses Benutzers ''A'' eingetragen werden und nicht im Kalender eines anderen Benutzers ''B'' landen.
-=== Audio Injection ===
+=== Angriffsszenarien ===
+==== Audio Injection ====
 {{Hauptartikel|Audio Injection}}
-Sprachassistenzsysteme können durch [[Audio Injection]] angegriffen und missbraucht werden.
+Sprachassistenzsysteme können durch Audio Injection angegriffen und missbraucht werden.
+==== Laser-Based Audio Injection ====
+Durch direktes Bestrahlen des Mikrofons mit einem [[Laser]]strahl kann es Angreifern gelingen, Sprachassistenzsysteme zu befehligen&nbsp;– ihnen also „Lichtbefehle“ zu erteilen. Dazu wird der Laserstrahl derart in seiner [[Lichtintensität]] [[Modulation (Technik)|moduliert]], dass er im Mikrofon sehr ähnliche [[Elektrisches Signal|elektrische Signale]] induziert, wie sie sich normalerweise durch die echten Sprachbefehle ergeben würden. So können das Aktivierungswort und zudem auszuführende Befehle unhörbar und auch aus zig Metern Entfernung an das Sprachassistenzsystem übermittelt werden. Insbesondere anfällig für diese Art von Attacke sind Systeme mit [[Mikrosystem (Technik)#Mikrofone|MEMS-Mikrofon]]en, da sie die Eigenschaft haben, nicht nur Schall, sondern auch [[Licht]], das direkt auf sie gerichtet ist, in elektrische Signale umzuwandeln.<ref>{{Internetquelle |autor=Dennis Schirrmacher |url=https://heise.de/-4579025 |titel=Sicherheitsforscher befehligen Alexa, Siri & Co. via Laserstrahl |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2019-11-06 |abruf=2019-11-09}}</ref><ref>{{Internetquelle |autor=Takeshi Sugawara, Benjamin Cyr, Sara Rampazzi, Daniel Genkin, Kevin Fu |url=https://lightcommands.com/ |titel=Light Commands: Laser-Based Audio Injection on Voice-Controllable Systems |datum=2019 |abruf=2019-11-09 |sprache=en}}</ref>
+=== Gesellschaftliche Auswirkungen ===
+Aktivierungswörter, die gleichlautend wie menschliche [[Name#Personennamen (Anthroponyme)|Namen]] sind, können [[Gesellschaft (Soziologie)|gesellschaftliche]] Auswirkungen nach sich ziehen:<ref name=":14">{{Internetquelle |autor=Martin Holland |url=https://heise.de/-6171840 |titel=Amazons Alexa: Eltern meiden "verdorbenen Vornamen", Kinder beklagen Mobbing |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2021-08-23 |abruf=2021-08-24}}</ref>
+So hat sich wegen Amazons Aktivierungswort „Alexa“ gezeigt, dass in den [[Vereinigte Staaten|USA]] kurz nach der Vorstellung des Sprachassistenten etwas mehr Kinder auf den [[Vorname]]n [[Alexa (Vorname)|Alexa]] getauft wurden, in den Jahren danach aber ein starker Rückgang zu verzeichnen war. Auch in anderen Staaten wie [[Deutschland]], [[England]] und [[Kanada]] waren ähnliche Effekte zu beobachten.
+Kinder und [[Mädchen]] namens Alexa sind mitunter [[Hänseln|Hänseleien]] oder sogar [[Mobbing]] ausgesetzt. Ihnen werden beispielsweise Befehle erteilt&nbsp;– so, als wären sie [[Diener]]innen oder [[Sklaverei|Sklavinnen]].
 == Beispiele ==
-Beispiele für Sprachassistenten und deren Aktivierungswörter sind:
+Beispiele für Sprachassistenten und deren Aktivierungswörter sowie für Geräte, die diese Assistenten nutzen können, sind:
 {| class="wikitable sortable"
-|+Sprachassistenten und Aktivierungswörter
+|+ Sprachassistenten und Aktivierungswörter
-!Sprachassistent
+! Sprachassistent
-!Anbieter
+! Anbieter
 ! class="unsortable" |Aktivierungswort
+! class="unsortable" |Beispiele für nutzende Geräte
 |-
-|[[Amazon Echo|Alexa]]
+| Alexa
-|[[Amazon]]
+| [[Amazon]]
 |
 * „Alexa“
-* „Amazon“<ref>{{Internetquelle |autor= |url=https://www.amazon.de/gp/help/customer/display.html?nodeId=201971890 |titel=Hilfe: Aktivierungswort ändern |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-22 |sprache=de}}</ref><ref>{{Internetquelle |autor= |url=https://www.amazon.de/gp/help/customer/display.html?nodeId=202083830 |titel=Hilfe: Verwenden Sie Alexa auf Ihrem Fire Tablet |werk= |hrsg=[[Amazon]] |datum= |abruf=2019-09-22 |sprache=de}}</ref>
+* „Amazon“<ref>{{Internetquelle |url=https://www.amazon.de/gp/help/customer/display.html?nodeId=201971890 |titel=Hilfe: Aktivierungswort ändern |hrsg=[[Amazon]] |abruf=2019-09-22}}</ref><ref>{{Internetquelle |url=https://www.amazon.de/gp/help/customer/display.html?nodeId=202083830 |titel=Hilfe: Verwenden Sie Alexa auf Ihrem Fire Tablet |hrsg=[[Amazon]] |abruf=2019-09-22}}</ref>
 * „Computer“
 * „Echo“<ref name=":3" />
+* „Ziggy“<ref>{{Internetquelle |autor=Daniel Herbig |url=https://heise.de/-6549563 |titel=Amazon: Assistentin Alexa hört nun auf "Ziggy" |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2022-03-15 |abruf=2022-03-15}}</ref>
+|
+* [[Amazon Echo]]
+* [[Hallo Magenta]]<ref name=":10" />
+* [[Xbox One]]<ref>{{Internetquelle |autor=Denise Bergert |url=https://heise.de/-4466441 |titel=Microsoft: Alexa Xbox Skill kommt nach Deutschland |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2019-07-09 |abruf=2019-09-30}}</ref>
+* [[Sonos (Unternehmen)|Sonos]] One, Move und Beam<ref name=":12">{{Internetquelle |url=https://www.sonos.com/de-de/easy-to-use |titel=Setup, Installation und Steuerung |hrsg=[[Sonos (Unternehmen)|Sonos]] |abruf=2019-10-15}}</ref><ref>{{Internetquelle |url=https://www.sonos.com/de-de/alexa-on-sonos |titel=Alexa auf Sonos |hrsg=[[Sonos (Unternehmen)|Sonos]] |abruf=2019-10-15}}</ref>
 |-
-|[[Google Assistant]]
+| [[Google Assistant]]
-|[[Google LLC|Google]]
+| [[Google LLC|Google]]
 |
+* „{{lang|en|Hey, Google}}“
-* „Hey, Google“
-* „Okay, Google“<ref name=":5" />
+* „{{lang|en|Okay, Google}}“<ref name=":5" />
+|
+* [[Google Home]]
+* [[Xbox One]]<ref name=":11">{{Internetquelle |autor=Bernd Mewes |url=https://heise.de/-4541956 |titel=Xbox: Microsoft erweitert Sprachsteuerung mit Google Assistant |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2019-09-27 |abruf=2019-09-30}}</ref>
+* [[Sonos (Unternehmen)|Sonos]] One, Move und Beam<ref name=":12" /><ref>{{Internetquelle |url=https://www.sonos.com/de-de/google-assistant |titel=Google Assistant auf Sonos |hrsg=[[Sonos (Unternehmen)|Sonos]] |abruf=2019-10-15}}</ref>
 |-
-|[[Siri (Software)|Siri]]
+| [[Siri (Software)|Siri]]
-|[[Apple]]
+| [[Apple]]
 |
-* „Hey, Siri“<ref name=":6">{{Internetquelle |autor= |url=https://support.apple.com/de-de/HT204389 |titel=Siri auf allen Apple-Geräten verwenden |werk= |hrsg=[[Apple]] |datum=2019-05-06 |abruf=2019-09-22 |sprache=de}}</ref>
+* „{{lang|en|Hey, Siri}}“<ref name=":6">{{Internetquelle |url=https://support.apple.com/de-de/HT204389 |titel=Siri auf allen Apple-Geräten verwenden |hrsg=[[Apple]] |datum=2019-05-06 |abruf=2019-09-22}}</ref>
+|
+* [[Apple Watch]]
+* [[iPad]]
+* [[iPhone]]
+* [[HomePod]]
+* [[Personal Computer|PC]]s mit [[macOS]]<ref>{{Internetquelle |url=https://support.apple.com/de-de/HT209014 |titel=Geräte, die "Hey Siri" unterstützen |hrsg=[[Apple]] |datum=2019-09-06 |abruf=2019-10-11}}</ref>
 |-
-|Bixby
+| [[Bixby (Samsung)|Bixby]]
-|[[Samsung]]
+| [[Samsung]]
+|
+* „{{lang|en|Hi, Bixby}}“<ref name=":8">{{Internetquelle |url=https://www.youtube.com/watch?v=Xe-o60HI-6A |titel=Bixby: Die 4 Wege mit Bixby zu sprechen |abruf=2019-09-24}}</ref><ref>{{Internetquelle |url=https://www.samsung.com/de/apps/bixby/ |titel=Bixby {{!}} Apps & Services |hrsg=[[Samsung]] |abruf=2019-09-24}}</ref>
 |
+* [[Samsung Galaxy|Galaxy]]
-* „Hi, Bixby“<ref name=":8">{{Internetquelle |url=https://www.youtube.com/watch?v=Xe-o60HI-6A |titel=Bixby: Die 4 Wege mit Bixby zu sprechen |abruf=2019-09-24 |sprache=de}}</ref><ref>{{Internetquelle |autor= |url=https://www.samsung.com/de/apps/bixby/ |titel=Bixby {{!}} Apps & Services |werk= |hrsg=[[Samsung]] |datum= |abruf=2019-09-24 |sprache=de}}</ref>
 |-
-|[[Cortana (Software)|Cortana]]
+| [[Cortana (Software)|Cortana]]
-|[[Microsoft]]
+| [[Microsoft]]
 |
-* „Hey, Cortana“<ref name=":7">{{Internetquelle |autor= |url=https://support.microsoft.com/de-de/help/17214/cortana-what-is |titel=Was ist Cortana? |werk= |hrsg=[[Microsoft]] |datum=2019-05-21 |abruf=2019-09-22 |sprache=de}}</ref>
+* „{{lang|en|Hey, Cortana}}“<ref name=":7">{{Internetquelle |url=https://support.microsoft.com/de-de/help/17214/cortana-what-is |titel=Was ist Cortana? |hrsg=[[Microsoft]] |datum=2019-05-21 |abruf=2019-09-22}}</ref>
+|
+* [[Personal Computer|PC]]s mit [[Microsoft Windows 10|Windows 10]]
+* [[Xbox One]]<ref name=":11" />
+|-
+| [[Hallo Magenta]]
+| [[Deutsche Telekom]]
+|
+* „Hallo Magenta“<ref name=":10">{{Internetquelle |url=https://www.telekom.de/zuhause/geraete-und-zubehoer/smart-speaker |titel=Hallo Magenta: Der Telekom Smart Speaker {{!}} Telekom |hrsg=[[Telekom Deutschland]] |abruf=2019-09-30}}</ref><ref name=":13">{{Internetquelle |url=https://www.telekom.de/smarte-produkte/smart-speaker/telekom-smart-speaker |titel=Hallo Magenta: Der Telekom Smart Speaker {{!}} Telekom |hrsg=[[Telekom Deutschland]] |abruf=2020-06-10}}</ref>
+* „Hey Magenta“
+* „Hi Magenta“
+* („Alexa“ … Amazon)<ref name=":13" />
+|
+* Smart Speaker<ref>{{Internetquelle |url=https://www.telekom.de/zuhause/geraete-und-zubehoer/smart-speaker/telekom-smart-speaker-schwarz-weiss |titel=Telekom Smart Speaker bestellen {{!}} Telekom |hrsg=[[Telekom Deutschland]] |abruf=2020-06-10 |archiv-url=https://web.archive.org/web/20200610083410/https://www.telekom.de/zuhause/geraete-und-zubehoer/smart-speaker/telekom-smart-speaker-schwarz-weiss |archiv-datum=2020-06-10 |offline=1 |archiv-bot=2022-08-27 01:50:51 InternetArchiveBot }}</ref>
+* Smart Speaker Mini<ref>{{Internetquelle |url=https://www.telekom.de/zuhause/geraete-und-zubehoer/smart-speaker/telekom-smart-speaker-mini |titel=Smart Speaker Mini {{!}} Telekom |hrsg=[[Telekom Deutschland]] |abruf=2020-06-10 |archiv-url=https://web.archive.org/web/20200610083409/https://www.telekom.de/zuhause/geraete-und-zubehoer/smart-speaker/telekom-smart-speaker-mini |archiv-datum=2020-06-10 |offline=1 |archiv-bot=2022-08-27 01:50:51 InternetArchiveBot }}</ref>
+|-
+| Voice Mate
+| [[LG Electronics]]
+| (nur per Tastendruck)<ref>{{Internetquelle |url=https://www.lg.com/de/support/produkt-hilfe/CT20114005-1437469805822-others |titel=&#91;LG webOS TV&#93; Verwendung der Spracherkennung |werk=FAQ's |hrsg=[[LG Electronics]] |datum=2015-07-21 |abruf=2019-10-11}}</ref>
+|
+* bestimmte LG-Fernseher mit [[webOS]]
+|-
+|
+| [[Volkswagen AG|Volkswagen]] ([[vw.os]])
+|
+* „Hallo, ID“ (deutsch)<ref>{{Internetquelle |url=https://www.volkswagen.at/id3 |titel=VW ID.3: eine neue Ära der E-Mobilität |werk=[[Volkswagen AG]] |hrsg=Porsche Austria |datum=2020 |abruf=2020-08-02}}</ref> bzw.<br />„{{lang|en|Hello, ID}}“ (englisch)<ref name=":9">{{Internetquelle |url=https://www.youtube.com/watch?v=xfoHUFXaup4&t=367 |titel=VW ID.3 {{!}} Erster Check {{!}} Sitzprobe {{!}} Display {{!}} Bedienung&nbsp;– 163 Grad im Volkswagen ID.3 auf der IAA |abruf=2019-09-24}}</ref><ref>{{Internetquelle |url=https://www.youtube.com/watch?v=E7tE4WkNDsQ&t=187 |titel=VW ID.3 Multimedia, HUD mit augmented reality und Displays&nbsp;– IAA Live |abruf=2019-09-30}}</ref>
+|
+* [[VW ID.3]]
+* [[VW ID.4]]
 |-
+| Laura
+| [[Škoda Auto]]
 |
+* „Okay, Laura“<ref>{{Internetquelle |url=https://www.youtube.com/watch?v=kQEUA72Dym0 |titel=LAURA |abruf=2021-10-11}}</ref><ref>{{Internetquelle |url=https://www.skoda-auto.de/service/konnektivitaet |titel=ŠKODA Connect |hrsg=[[Škoda Auto|ŠKODA AUTO Deutschland]] |abruf=2021-10-11}}</ref>
-|[[Volkswagen AG|Volkswagen]] ([[VW.os]])
 |
+* [[Škoda Enyaq]]
-* „Hello, ID“<ref name=":9">{{Internetquelle |url=https://www.youtube.com/watch?v=xfoHUFXaup4&t=367 |titel=VW ID.3 {{!}} Erster Check {{!}} Sitzprobe {{!}} Display {{!}} Bedienung&nbsp;– 163 Grad im Volkswagen ID.3 auf der IAA |abruf=2019-09-24 |sprache=de}}</ref>
 |-
-|Intelligent Personal Assistant
+| Intelligent Personal Assistant
-|[[BMW]]
+| [[BMW]]
 |
 * „Hey, BMW“
-* (weitere individualisierbar)<ref>{{Internetquelle |autor= |url=https://www.autofrey.at/der-bmw-intelligent-personal-assistant-heute-und-morgen/ |titel=Der BMW Intelligent Personal Assistant heute und morgen |werk=AutoFrey |hrsg= |datum=2019-01-15 |abruf=2019-09-22 |sprache=de}}</ref>
+* (weitere individualisierbar)<ref>{{Internetquelle |url=https://www.autofrey.at/der-bmw-intelligent-personal-assistant-heute-und-morgen/ |titel=Der BMW Intelligent Personal Assistant heute und morgen |werk=AutoFrey |datum=2019-01-15 |abruf=2019-09-22}}</ref>
+|
 |-
+| [[Comand#MBUX NTG 6|MBUX]]
-|Jasper
+| [[Mercedes-Benz]]
-|[[Open Source|Open-Source]]-[[GitHub]]-Projekt
+|
+* „Hey, Mercedes“<ref>{{Internetquelle |autor=André Berton |url=https://blog.daimler.com/2018/12/28/mbux-voice-assistant-hey-mercedes/ |titel=MBUX Voice Assistant: Versteht dich von selbst |hrsg=[[Daimler AG]] |datum=2018-12-28 |abruf=2019-09-22 |archiv-url=https://web.archive.org/web/20190922144752/https://blog.daimler.com/2018/12/28/mbux-voice-assistant-hey-mercedes/ |archiv-datum=2019-09-22 |offline=ja |archiv-bot=2023-06-06 08:43:56 InternetArchiveBot }}</ref>
+|
+|-
+| Jasper
+| [[Open Source|Open-Source]]-[[GitHub]]-Projekt
 |
 * „Jasper“<ref name=":1" />
+|
 |-
+| Sonos Voice Control
-|[[Comand#MBUX NTG 6|MBUX]]
+| Sonos
-|[[Mercedes-Benz]]
+|
+* „{{lang|en|Hey Sonos}}“
 |
-* „Hey, Mercedes“<ref>{{Internetquelle |autor=André Berton |url=https://blog.daimler.com/2018/12/28/mbux-voice-assistant-hey-mercedes/ |titel=MBUX Voice Assistant: Versteht dich von selbst |werk= |hrsg=[[Daimler AG]] |datum=2018-12-28 |abruf=2019-09-22 |sprache=de}}</ref>
 |-
+| [[Mycroft (Sprachassistent)|Mycroft]]
-|Snips
+| Mycroft
-|Snips
+|
+* „{{lang|en|Hey, Mycroft}}“
+* (weitere individualisierbar)<ref>{{Internetquelle |url=https://mycroft-ai.gitbook.io/docs/using-mycroft-ai/customizations/wake-word |titel=Using a Custom Wake Word |werk=mycroft.ai |abruf=2022-01-27}}</ref>
+|
+* [[Personal Computer|PC]]s
+* [[Raspberry Pi]]
+|-
+|
+| [[Sony]]
+|
+* „{{lang|en|Hey, Playstation}}“<ref>{{Internetquelle |autor=Daniel Herbig |url=https://heise.de/-6360593 |titel=Sony: Playstation 5 hört auf Sprachkommandos |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2022-02-09 |abruf=2022-02-10}}</ref>
+|
+* [[PlayStation 5]]
+|-
+|
+| Fortebit (EasyVR 3 Plus)
+|
+* „{{lang|en|Robot}}“ (ersetzbar)
+* (weitere individualisierbar)
 |
+* nutzbar per [[Universal Asynchronous Receiver Transmitter|UART]]-Schnittstelle, z.&nbsp;B. mit [[Arduino (Plattform)|Arduino]]<ref>{{Internetquelle |autor=Heinz Behling |url=https://heise.de/-4713574 |titel=Video-Tutorial: Sprachgesteuerte Infrarot- und Funk-Fernbedienung mit Arduino |werk=[[heise online]] |hrsg=[[Verlag Heinz Heise#Heise Medien|Heise Medien]] |datum=2020-05-04 |abruf=2020-05-04}}</ref>
-* „Hey, Snips“
-* (weitere individualisierbar)<ref name=":0" />
 |}
@@ Zeile 114: / Zeile 217: @@
 == Einzelnachweise ==
-<references />
+<references responsive />
 [[Kategorie:Sprach-Interaktion]]

„Aktivierungswort“ – Versionsunterschied

Aktuelle Version vom 26. Oktober 2023, 20:06 Uhr

Funktionsablauf

Allgemeines

Theorie

Herausforderungen und Problembereiche

Ideales Sprachassistenzsystem

Nichtaktivierung: Nichterkennung des Aktivierungsworts

Fehlaktivierung: Aktivierung trotz nicht gesprochenen Aktivierungsworts

Unterscheidung verschiedener Benutzer

Benutzerunabhängigkeit

Unterscheidung von Benutzer-Rollen

Unterscheidung von Benutzer-Individuen

Angriffsszenarien

Audio Injection

Laser-Based Audio Injection

Gesellschaftliche Auswirkungen

Beispiele

Siehe auch

Einzelnachweise

Navigationsmenü

Suche