„Mycroft (Sprachassistent)“ – Versionsunterschied

[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
→‎Entwicklung: siehe quelle
→‎Siehe auch: −bkslink
Zeile 84: Zeile 84:
== Siehe auch ==
== Siehe auch ==
* [[Amazon Alexa]]
* [[Amazon Alexa]]
* [[Cortana]]
* [[Cortana (Software)|Cortana]]
* [[Google Assistant]]
* [[Google Assistant]]
* [[Siri]]
* [[Siri (Software)|Siri]]


==Einzelnachweise==
==Einzelnachweise==

Version vom 13. Dezember 2020, 16:43 Uhr

Mycroft

Basisdaten

Hauptentwickler Mycroft AI Team
Entwickler Mycroft AI, Inc.
Aktuelle Version 21.2.2[1]
(13. Dezember 2021)
Programmier­sprache Python 3
Lizenz Apache License
mycroft.ai

Mycroft ist ein freier Open-Source Sprachassistent auf NLU Basis (Sprachdialogsystem) welcher von der Firma Mycroft AI, Inc. mit Sitz im amerikanischen Kansas City und einer Open-Source Community entwickelt wird. Durch vollständige Quellcode Offenheit und der Möglichkeit offline betrieben zu werden unterscheidet sich Mycroft von vielen alternativen Sprachassistenten. Der Name basiert auf einem fiktionalen Computer aus dem 1996 veröffentlichten Roman The Moon Is a Harsh Mistress. Es wird unter einer freizügigen Open-Source Lizenz entwickelt.

Entwicklung

Die Idee für Mycroft entstand bei einem Besuch Ryan Sipes und Joshua Montgomerys in einem Makerspace in Kansas City, MO. Montgomery entdeckte einen simplen virtuellen Assistenten, erkannte das Potential dieser Technologie, aber sah mögliche Datenschutz- und Privatsphärebedenken. [2][3] Daraus resultierte das Versprechen, dass Mycroft Transparenz durch Open-Source sicherstellen werde.

  • 2016: Auszeichnung im Rahmen der Techweek's KC [4]
  • 2016: Teilnahme bei der Sprint Accelerator 2016-Klasse in Kansas City
  • 2017: Aufnahme in die 500 Startups (Batch 20) [5][6]
  • 2017: Strategische Investition von Jaguar Land Rover in Mycroft[7][8]

Ablauf einer Benutzeranfrage

Die folgende Grafik stellt den Ablauf einer Mensch <-> Mycroft Kommunikation dar. Die abgebildeten Komponenten werden im Nachgang genauer beschrieben.

  1. Benutzer spricht: "Hey Mycroft - wieviel Uhr ist es?"
  2. Mycroft: Wandelt die Sprache in Text um (speech to text)
  3. Mycroft: Prüft den Text auf eine Absicht (Intent) - hier: "Uhr"
  4. Mycroft: Gibt die Anfrage an den passenden Skill (Fähigkeit) weiter - hier "date-time-skill"
  5. Das Skill untersucht die Anfrage des Benutzers und ermittelt die aktuelle Uhrzeit
  6. Mycroft spricht: "Es ist aktuell 04:09 Uhr" (text to speech)

Softwarekomponenten

Die dazu notwendigen Softwarekomponenten werden auf Github gehostet und dort von Mycroft AI, Inc. und einer freiwilligen Entwicklercommunity aktiv weiterentwickelt. Die Software ist modular aufgebaut und auf folgenden Plattformen lauffähig:

Wake Word

Das "Wake Word" fungiert als Aktivierungsphrase (standardmäßig "Hey Mycroft") und muss vom Anwender vor der eigentlichen Anfrage gesprochen werden. Technologisch basiert die Erkennung auf der "Precise Wake Word Engine", die im Gegensatz zum früher eingesetzten PocketSphinx, auf machine learning und neuronalen Netzwerken basiert. Im (optionalen) Cloud basierten Mycroft Backend können alternative Wake Words ausgewählt werden. Ebenso besteht die Möglichkeit ein eigenes Wake Word zu trainieren. Die Erkennung der Aktivierungsphrase geschieht immer auf dem Mycroft Gerät lokal und benötigt keinerlei Internetzugang.

Speech to text (STT)

Als "speech to text" wird der Prozess bezeichnet, der menschliche Sprache in Text umwandelt. Standardmäßig werden die Anfragen über das Mycroft Cloud Backend an weitere Dienstleister gesendet. Die Konfiguration alternativer STT Dienste ist möglich. Im Rahmen einer Partnerschaft mit Mozilla Common Voice unterstützt Mycroft ebenfalls Deepspeech, was eine lokale Spracherkennung ermöglicht ohne die Notwendigkeit zur Nutzung von Cloud Diensten.

Text to speech (TTS)

"Text to speech" bedeutet die Umwandlung von Text in gesprochene Sprache und wird als Sprachsynthese bezeichnet. Die Qualität der Sprachausgabe ist ein entscheidender Faktor zur Benutzerakzeptanz eines Sprachassistenten. Mycroft bietet in diesem Bereich mehrere Möglichkeiten.

Cloud basierte Spracherzeugung

Mycroft kann für unterschiedliche deutschsprachige TTS-Cloudanbieter (beispielweise Google TTS oder Amazon Polly) konfiguriert werden. Allerdings funktionieren diese nur bei verfügbarer Internetverbindung und bringen Datenschutzbedenken auf.

Lokale Spracherzeugung

Aufgrund der Zusammenarbeit mit den Mozilla Common Voice Projekten kann Mycroft einen Mozilla TTS-Server zur Spracherzeugung verwenden. Dieser kann lokal betrieben werden und benötigt keinerlei Internetzugang. Er bietet mit "Thorsten (TTS-Stimme)" eine freie deutschsprachige und kommerziell nutzbare Stimme. Sie basiert auf einer Stimmspende von Thorsten Müller. [9][10][11]

Sollte keine andere TTS-Option zur Verfügung stehen, dient Mimic (basiert auf Festival Lite) als Fallback. Dieses bietet im Vergleich jedoch nur eine sehr geringe Qualität.

Skills

Skills bilden den Funktionsumfang von Mycroft ab. Es stehen viele Skills zur Verfügung. Dazu zählen beispielsweise Skills zum Stellen von Timern, Einrichten von Weckern und Erinnerungen, zur Steuerung von Smarthomes und vieles mehr. Neben den Basisskills die mit jeder Mycroft Installation ausgeliefert werden können weitere nach persönlichem Geschmack ergänzt werden.

Skills können direkt aus dem Github Repository des jeweiligen Entwicklers heruntergeladen werden, bieten dann jedoch keine offizielle Freigabe von Mycroft AI Inc. Vom Hersteller geprüfte und freigegebene Skills können im Skill-Marketplace von Mycroft heruntergeladen werden.

Intents

Intents (wörtlich übersetzt "Absicht") sind Schlüsselwörter anhand der Mycroft erkennt, welches Skill die Anfrage des Benutzers bearbeiten soll. Intents werden anhand der gesprochenen Benutzeranfrage ermittelt. So führt beispielsweise die Benutzeranfrage: "Wieviel Uhr ist es?" dazu, dass das Skill "date-time" diese Anfrage bearbeitet und eine entsprechende Antwort an den Benutzer erzeugt.

Hardware

Das Mycroft Projekt arbeitet neben der Software auch an der Erstellung und dem Verkauf von smarten Lautsprechern. Dabei ist das gesamte Hardwarekonzept und Design als Open-Source unter der CERN Open Hardware Lizenz.[12] Lizenz öffentlich.

Das erste Hardware Projekt, der Mark I, richtete sich dabei primär an eine Entwickler Zielgruppe und wurde anteilig durch eine Kickstarter Kampagne finanziert. Der Versand der Geräte startete im April 2016 [13].

Im Gegensatz zum Mark I richtet sich die nächste Generation, der Mark II, an keine bestimmte Zielgruppe. Es bietet zusätzlich zum Lautsprecher auch ein großes Display zur optischen Unterstützung der Benutzerinteraktion. Ebenso wie der Vorgänger wurde Mark II durch eine Kickstarter Kampagne finanziert und erreichte im Februar 2018 das 8-fache des ursprünglichen Kampagnenziels. Stand Dezember 2020 hat noch keine Auslieferung des Mark II an die Unterstützer begonnen. [14]

Siehe auch

Einzelnachweise

  1. github.com.
  2. Rebecca Harrington: Customize An Open-Source HAL For Your Home. In: Popular Science. 1. Januar 2016, abgerufen am 17. März 2017.
  3. Swapnil Bhartiya: Mycroft: Linux's Own AI. In: Linux.com. 17. Januar 2016, abgerufen am 19. April 2016.
  4. Alexa can you find me a better assistant? | Techweek (Memento des Originals vom 9. Juli 2018 im Internet Archive) In: Techweek, 11. September 2017. Abgerufen am 8. Juli 2018 (amerikanisches Englisch). 
  5. John Fein: Announcing the 2016 Class of the Sprint Accelerator Powered by Techstars! In: Techstars, 22 February 2016. Abgerufen im 29 September 2017 
  6. Matthew Lynley: Here's the 20th batch of 500 Startups companies In: TechCrunch, 8 February 2017. Abgerufen im 29 September 2017 
  7. Bobby Burch: Jaguar Land Rover invests in artificial intelligence startup Mycroft In: Startland News, 27 February 2017. Abgerufen im 29 September 2017 
  8. Mycroft AI. In: StartEngine. Abgerufen am 8. Juli 2018.
  9. Stimmspende Thorsten Müller. Thorsten Müller, abgerufen am 12. Dezember 2020.
  10. Motivation und Vergleich Thorsten-Sprachmodelle. Thorsten Müller, abgerufen am 12. Dezember 2020.
  11. Thorsten Müller: Why i’ve chosen to donate my (german) voice for mankind. 13. August 2020, abgerufen am 12. Dezember 2020 (englisch).
  12. Github: Mycroft Mark I hardware. In: GitHub. Abgerufen am 18. März 2018.
  13. Kris Adair: Making a Mycroft & First Shipment. In: Mycroft blog. 4. April 2016, abgerufen am 18. März 2018.
  14. Joshua Montgomery: Mycroft Mark II: The Open Voice Assistant. In: Kickstarter. 25. Januar 2018, abgerufen am 18. März 2018.