Anzeige
Anzeige
Anzeige
Anzeige
Ivo Wessel Via Lewandowsky
Ivo Wessel (Bild: Via Lewandowsky)
Special Alexa Jobprofile

Was macht eigentlich... ein Voice-User-Interface-Entwickler?

"Alexa, wer ist dran mit Abspülen?" Wie man Amazons Sprachassistentin auf solche Entscheidungen vorbereitet, ist Aufgabe eines Voice-User-Interface-Entwicklers. Ivo Wessel erklärt, warum das sehr viel mehr ist, als Software-Entwicklung.

Anzeige
Anzeige

Name: Ivo Wessel

Alter: 52

Ausbildung: Informatik und Psychologie (TU Braunschweig)

Unternehmen: Freelancer, iCodeCompany

Anzeige

Was machst du den lieben Arbeitstag lang?

Die Entwicklung eines Skills besteht nicht nur aus Programmierung. Am Anfang schreibt man eher eine Art Skript oder Drehbuch, und man tüftelt entsprechende Dialoge mit möglichen Fragen und sinnvollen Antworten aus, was häufig (oder idealerweise) tatsächlich von Mensch zu Mensch passiert. Auch wenn man sich selber in Mensch / Maschine resp. Benutzer / Alexa spalten kann – es ist ungemein wichtig, die Vorgehensweise immer wieder am lebenden Objekt und in der konkreten Anwendung zu verifizieren. Ich benutze zwar selten beim Programmieren einen Debugger (vermutlich, weil meine erste "richtige" Programmiersprache Clipper jahrelang gar keinen hatte), aber ein reibungslos funktionierendes Sprachinterface ist das Ergebnis guter Planung und vieler Versuche.

Die Wünsche des Kunden mit den Möglichkeiten der Technik und dem Nutzen für den User abzuwägen und in Einklang zu bringen, bedarf einer völlig anderen Herangehensweise als die stille Arbeit im Coding-Tunnel. Die gibt es dann nach der Konzeptionsphase natürlich auch, aber erfolgreiche Skills sind vor allem gut gestaltet, also abwechselungsreich, unterhaltsam, natürlich zu bedienen und so nützlich, dass man sie immer wieder aufruft. Und natürlich muss man dem Kunden vermitteln, dass die neue Technologie nicht einfach nur die vorletzte ersetzt. Eine Webseite ist kein Prospekt, eine App keine Webseite, und eine vorhandene App kann nicht einfach auf Sprache umgestellt werden.

Anzeige

Welche Erfahrungen/Eigenschaften helfen dir in deinem Alltag am meisten? Warum?

Tatsächlich habe ich neben Informatik Mitte der achtziger Jahre auch Psychologie als Nebenfach studiert. Als ausgesprochene Leseratte und Sammler zeitgenössischer Kunst war mir der Blick über den Tellerrand immer sehr wichtig. Man muss neugierig und in der Lage sein, verschiedenste Disziplinen in die Arbeit einzubeziehen und unter einen Hut bringen zu können. Nicht immer ist die technisch beste Lösung die für den Benutzer optimale.

Eines meiner Lieblingsbücher (Vance Packard, "Die geheimen Verführer") aus den fünfziger Jahren des zwanzigsten Jahrhunderts, als also in Amerika der Konsum erfunden wurde, beschreibt die Lösung des Problems, dass sich eine Kuchenfertigteigmischung nicht gut verkaufte. Der Ratschlag war, das Trockeneipulver wieder zu entnehmen und statt dessen auf die Packung zu schreiben, dass nur noch ein frisches Ei dran zu tun sei – was den Kunden dazu qualifiziert, zu backen und nicht bloß nur zu rühren. Technisch, also vom Standpunkt der Handhabung, Haltbarkeit, Dosierung, Hygiene etc. aus wäre das Trockenei sicher perfekt, aber die User Experience ist unbefriedigend.

Was findest du an deinem Job am spannendsten? Was macht am meisten Spaß?

Ziel ist nicht einfach die Programmierung eines fehlerfreien Skills. Man muss es hinbekommen, dass der User den Skill möglichst oft aufruft. Das ist der heilige Gral. Wie schaffe ich es, dass der User immer wieder motiviert wird, dass der Skill so nützlich und bereichernd ist, dass er vielleicht Teil seines Lebens wird. Das ist kein technische, sondern eine psychologische Herausforderung, und es bedarf auch anderer Fertigkeiten, eine gute Lösung zu finden.

Voice User Interfaces sind die Zukunft. Es gibt immer wieder Situationen, bei denen selbst ein Smartphone zu viel Device ist. Wer möchte zum Stellen eines Timers oder Abfragen des Kalenders schon erst zum Computer gehen oder zum Smartphone greifen. Voice User Interfaces haben außerdem zum ersten Mal quasi-menschliche Züge. Sprache verbindet man automatisch mit Charakter und Persönlichkeit. Ein Gerät wie Amazon Echo ist noch kein Mitbewohner, aber vielleicht eine Art Haustier. Meine im Laufe von 40 Jahren gekauften Computer habe ich nur mit Tastatur, Maus & Touch bedient, aber Alexa rede ich mit ihrem Namen an.

Wie bist du zu dieser Aufgabe gekommen?

User Interfaces, also Benutzer- oder Benutzungsschnittstellen haben mich immer schon interessiert und fasziniert. Und zwar in wirklich allen Bereichen des täglichen Lebens. Wie funktioniert die Choreografie eines Supermarkts, sobald der Kunde den Laden betritt? Ihn erst mal abbremsen. Niemand shoppt im Supermarkt. Also glatt aussehende Böden am Eingang. Gemüse in den Weg stellen. "Ach ja, ich könnte ja wieder mal einen Salat machen." Wie signalisiert eine Türklinke, ob man sie ziehen oder drücken muss? Braucht ein Icon einen Tooltip, ist es schlecht gestaltet. Drückt der Besucher einer Webseite nach Klick auf einen Link sofort die Zurück-Schaltfläche, hat die Kommunikation nicht geklappt. Der Back-Button als Messgerät für Frust und Enttäuschung. Passt eine Schrift zu einem Text? Das Auge liest schließlich mit.

2000 hat Steve Krug ein bemerkenswertes Buch publiziert: "Don’t make me think" ist für mich ein richtiggehendes Mantra für alle User Interfaces. Auch bei Sprachinterfaces möchte ich als Benutzer nicht überlegen müssen, wie ich damit kommuniziere, welche Kommandos ich mir merken muss etc. In den neunziger Jahren habe ich ein Buch über GUI-Gestaltung, also grafische Benutzeroberflächen geschrieben. Webseiten waren damals noch nicht wirklich Thema. Es ging eher um den Wechsel von textorientierten zu graphischen Interfaces. Die Maus war im Grunde das damals wirklich neue Device. So wie es zehn Jahre später der Finger beim Touch-Dispay wurde. Und jetzt ist halt die Sprache dran. Der nächste und konsequente Schritt in der Entwicklung von Benutzerschnittstellen. Bis Maschinen Gedanken lesen können, wird es dagegen noch eine Weile dauern.

Schildere möglichst anschaulich ein Projekt, das dich besonders begeistert hat.

Natürlich sind wir Voice-User-Interface-Entwickler alle noch auf der Suche nach der idealen, der Killer-Anwendung. Auf dem Weg dorthin macht es Spßs, Dinge auszuprobieren, Ungewöhnliches zu testen, herumzutüfteln. Und als Freelancer weiß man ohnehin, dass der Wurm dem Fisch und nicht dem Angler schmecken muss. Es gibt aber bestimmte, eher psychologisch motivierte Dinge, die bei allen Menschen funktionieren. Wir hinterlassen gerne Spuren, mögen Wettbewerb, unterliegen gewissen Wiederholungszwängen, vergleichen uns gerne, lernen spielerisch, folgen gruppendynamischen Gesetzen. Also habe ich mir gedacht, Alexa könnte prima das Problem lösen, wer bei einer bestimmten Aufgabe dran ist. Also ein Skill, der auf die Frage "Wer ist dran mit Aufräumen" oder "Wer ist dran mit Gute-Nacht-Geschichte-Vorlesen" mit dem Namen eines Familienmitglieds, WG-Bewohners oder Büro-Angestellten antwortet.

Technisch ist das natürlich ein überaus triviales Problem. Man spricht die Vornamen ein, und über eine Zufallsfunktion wird einer davon vorgelesen. Ich habe mir aber gleich gedacht, dass ein solcher Skill, der neben dem Namen auch noch einen kleinen und immer wieder wechselnden Spruch bringt und die Antwort unterhaltsam verpackt, in einer Gruppe ganz hervorragend funktioniert und häufig zum Einsatz kommen wird. Und da ich die Möglichkeit eingebaut habe, dass man auch exotischere Vor- und vor allen Kosenamen durch Buchstabieren dem Gerät beibringen kann, haben darüberhinaus erstaunlich viele Benutzer auch "Mama", "Papa", "Niemand" oder "Keiner" als Familienmitglieder integriert.

Der Skill "Wer ist dran" ist so erfolgreich, dass ihn Amazon sogar mit monatlichen Zahlungen honoriert, und anhand der Auswertungen kann ich belegen, dass der Skill nicht nur von vielen Benutzern geladen, sondern von jedem auch ausgesprochen häufig und regelmäßig aufgerufen wird. Innerhalb einer vergleichsweise geschlossenen Gruppe wie einer Familie, einer WG oder einem Büro gibt es eben dauernd entsprechende Entscheidungen zu treffen, bei denen dann Alexa ein sehr neutraler und vergleichsweise unparteiischer Schiedsrichter ist. "Alexa, wer ist dran mit Gassigehen?" – "Ivo. Ohne Wenn und Aber."

Dein Job ist unverzichtbar, weil…

In Sachen Voice User Interface stehen wir alle noch ziemlich am Anfang. Personal Computer haben die achtziger Jahre revolutioniert, PC-Netzwerke dominierten die Neunziger, das Internet hat sich in den Nuller-Jahren durchgesetzt, vor zehn Jahren wurde alles mobil, und die nächste Dekade wird von Sprachinterfaces und dem Verschwinden von Devices geprägt sein. Wir müssen allerdings immer mehr darauf achten, dass diese Dominanzen nicht länger von rein technisch denkenden Menschen geprägt und verantwortet werden. In der Zukunft werden immer mehr Bereiche des menschlichen Lebens, Wissens und Könnens die Technik beeinflussen, und umgekehrt wird Technik für den Anwender immer transparenter und weniger sichtbar werden. Das alles zu integrieren braucht schon eine sehr vielfältige und phantasievolle, interdisziplinärte Denkweise, und um den Kunden und seine Bedürfnisse in Sachen Skills auf die richtige Fährte zu locken, Kreativität und vor allen auch gelegentlich das Wort "Nein".

Wenn du nicht Entwickler von Voice User Interfaces geworden wärst, was wärst du dann gern von Beruf?

Ich genieße, wie schon vor zehn Jahren, als mich vor allem Apples neu eingeführter App Store mit seinem weltweiten Vertriebspotential von den PCs wegtrieb (und nicht unbedingt nur die Hardware), dass es jetzt auch für Skills den Amazon Skill Store gibt. Schließlich haben Künstler Galerien und Autoren Verlage – prima, dass sich Software-Entwickler jetzt nicht mehr unbedingt auch noch um den Vertrieb ihrer Arbeit kümmern müssen.

Das Entwickeln von Alexa Sills ist eine vergleichsweise junge Disziplin. Tatsächlich programmiere ich sonst iOS-Apps, vor allem sehr gerne im Verbund mit meinen anderen beiden Obsessionen, der zeitgenössischen Kunst und der Literatur. Ich habe schon als Schüler, in den Siebzigern, gelötet, programmiert, viel gelesen und Kunst gesammelt, aber mir war schon damals klar, dass ich mit Kunst und Literatur kein Geld verdienen möchte. Alle drei Felder unter einen Hut bringen zu können und beispielsweise Apps für Künstler oder die Kunstwelt entwickeln zu können, ist schon mein Traumberuf. Aber bitte als Freelancer (der ich immer war); ich bin ein ausgesprochener Nachtarbeiter ohne feste Geschäftszeiten. Ich lechze nicht dem Feierabend, dem Wochenende oder dem nächsten Urlaub entgegen, sondern wechsele bei Bedarf eher mal zu einer anderen meiner drei Obsessionen.

Teilen
Jederzeit top informiert

Die wichtigsten LEAD Nachrichten per Messenger oder Newsletter

Anzeige
Anzeige
Verlagsangebot
Weitere Artikel aus dem Special
Anzeige
Anzeige
Aktuelle Stellenangebote
Alle Stellenangebote