Telenoid R1 und das Uncanny Valley

Das Uncanny Valley (englisch für „unheimliches Tal“) ist die Bezeichnung für einen psychologischen Effekt, der in der Robotik bei humanoiden Robotern auftritt. Der Effekt ist scheinbar widersprüchlich, aber deutlich messbar. Er bewirkt, dass humanoide Roboter dem Menschen nicht in dem Maße vertrauter werden wie sie ihm ähnlicher werden.

/images/blog/uncanny-valley.png
Das Uncanny Valley, das unheimliche Tal

Bis zu einem gewissen Maße ist dies zwar der Fall: Ein ASIMO ist uns vertrauter als eine Blech­büch­se. Aber ir­gend­wann kippt dieser Ef­fekt und wir be­gin­nen, uns zu gruseln. Es ist der Moment, in dem unser Un­ter­be­wusst­sein beginnt, in dem Roboter tat­säch­lich eine mensch­li­che Ge­stalt zu erkennen. Unser Un­ter­be­wusst­sein be­ginnt in dem Mo­ment al­ler­dings auch, an diese mensch­­li­­che Ge­­stalt all die An­sprüche zu stellen, die wir an einen Men­schen stellen. Wir erwarten Mimik, dass sich der Brust­korb beim Atmen bewegt, dass die Augen mit uns Blick­kontakt aufnehmen, viel­leicht blinzeln und wir erwarten vor Allem weiche, natür­liche, mensch­liche Bewegung. Sehen wir eine mensch­liche Gestalt (die gilt übrigens im gleichen Maße für animierte Figuren etwa in einem Com­pu­ter­spiel) und vermis­sen diese Aspekte, signa­li­siert uns unser Unter­be­wusst­sein, dass irgend­etwas nicht stimmt. Schuld ist hier wie so oft unser Fort­pflan­zungs­trieb, der uns po­ten­tiel­le Partner kon­ti­nu­ier­lich auf Hin­weise auf Fehl­bild­ungen oder Krank­hei­ten absuchen lässt.

Der Effekt lässt sich wie gesagt messen und wie in obiger Grafik darstellen (entnommen der Wikipedia). Die Grafik zeigt in rot die intuitive Annahme, dass die (emotionale) Akzeptanz mit der Menschenähnlichkeit steigt und in blau die tatsächliche Akzeptanz, die kurz vor der Menschenähnlichkeit dramatisch einknickt und den Betrachter verstört.

Zurück zur Robotik: Das Uncanny Valley zu Umschiffen ist für die Erbauer humanoider Roboter eine wichtige Frage. Wollen Sie den Roboter für die Interaktion mit dem Menschen erbauen (und das ist bis auf wenige Ausnahmen bei Humanoiden der Fall), ist einem mit einem Roboter, der den Betrachter verstört, nicht viel geholfen.

Viele Entwickler entscheiden sich deshalb bewusst für eine schemenhafte, manchmal gar comic-hafte Gestalt, die uns schon vertraut ist, aber bewusst nicht ähnlich genug, um ins Uncanny Valley zu geraten. An dieser Stelle wollte ich auf ursprünglich auf den iCub verweisen, der für mich ein gutes Beispiel darstellt. Ein Kommentar in meinem Beitrag zum iCub zeigt jedoch, dass es da offenbar deutliche Unterschiede gibt. Simon ist vielleicht ein noch besseres Beispiel.

Und damit komme ich zum ursprünglichen Antrieb für diesen Blogbeitrag: Ein neuer Roboter auf der internationalen Bildfläche der Telenoid R1:

/images/blog/telenoid-r1.jpg
Telenoid R1

Der Roboter ist nicht nur ein humanoider, sondern er ist sogar ausdrücklich zur Kommunikation mit einem Menschen konstruiert. Er ist ein Telepräsenzroboter und damit dafür gedacht, einen Diskussionspartner zu vertreten, der irgendwo auf der Welt in eine Kamera spricht. Der Roboter gibt die Sprache weiter und versucht, die mit der Kamera aufgezeichnete Gesichtszüge und Mimik nachzuahmen.

Die reduzierte Gestalt des Roboters ist Absicht und soll erlauben, dass der Telepräsenzroboter sowohl weibliche als auch männliche, sowohl junge als auch ältere Gesprächspartner repräsentieren kann.

Hier scheint es mir doch deutlich der Fall zu sein, dass die Uncanny-Valley-Empfindung im japanischen Raum entweder eine komplett andere ist oder von dem allgemeinen Robotik-Enthusiasmus schlicht überschrieben wird. Dass jemand 6.000 Euro bezahlt (der geplante Preis bei Markt-Einführung), um sich in einem Gespräch von dem merkwürdig anmutenden Telenoid mit seinen Stummelarmen vertreten zu lassen, scheint mir in westlichen Ländern mindestens unwahrscheinlich. Das Konzept, die Telepräsenz auf die Art und Weise durch die physische Präsenz eines Avatars noch realistischer zu machen, ist mir zwar einleuchtend, aber wer will schon während der Telepräsenz tief im Uncanny Valley sitzen?

Und hier sieht man den Roboter im Einsatz, für mich sieht das nicht nach einer besonders vorteilhaften Gesprächssituation aus:

Demonstration eines Ferngesprächs mit dem Telenoid

Der Telenoid kommt übrigens von dem gleichen Schaffer, Hiroshi Ishiguro, der auch schon für den Geminoid verantwortlich zeichnet, der ähnliche Reaktionen hervorrief.

Fußballroboter trainiert im Weltall

Der Nao, französischer Fußballroboter und aktuelle Standardplattform in der RoboCup-Fußballliga, soll in Zukunft im Weltall trainieren. Allerdings nicht sich selbst, sondern die dortigen Langzeitastronauten.

/images/blog/nao.jpg
Nao

Der Nao soll als Personal Trainer die Langzeitastronauten bei Laune halten und zum täglichen Kampf gegen den Mus­kel­rück­gang motivieren. Das zu­min­dest plant das CoR-Lab, For­schungs­in­sti­tu­tes für Kog­ni­tion und Ro­bo­tik, in Zu­sam­men­ar­beit mit dem DLR, dem deut­schen Zen­trum für Luft- und Raum­fahrt.

Das Projekt umfasst sowohl die Analyse von Techniken menschlicher Mo­ti­va­tions­trai­ner als auch die Über­tra­gung der Er­geb­nis­se auf den Ro­bo­ter. Die Uni­ver­si­tät Bie­le­feld hat mit dem CoR-Lab und dem CITEC, dem Exzellenzcluster für kognitive Interaktionstechnologie, die notwendige Expertise, sowohl die Interaktion zwischen Motivationstrainer und -schüler zu verstehen, als auch dies in Technik umzusetzen. Zumindest in dem Rahmen, in dem man dies heutzutage schon mit Roboter machen kann. Zum Einsatz kommen werden dabei wahrscheinlich sowohl der Nao als auch FloBi, ein emotionaler Roboterkopf aus Bielefeld.

Flobi, Roboterkopf mit ausdrucksstarker Mimik

Das Projekt läuft über drei jahre und endet in einem Live-Versuch, in dem mehrere Personen unter medizinischer Aufsicht isoliert werden und über mehrere Wochen unter den Augen der Wissenschaftler vom Nao bespaßt werden und dabei auf ihre Stimmungslage und Trainingserfolge untersucht werden.

Disclaimer: Das CoR-Lab ist mein aktueller Arbeitgeber.

Interview mit einem Roboter

Amy Harmon, Reporterin der New York Times, hat einen Artikel über den Roboter Bina48 geschrieben, einen sprechenden Roboterkopf. Hinter dem Kopf steckt eine künstliche Intelligenz, wie es heißt, und der Roboter soll sich mit seinem Gegenüber in der Art seiner Vorlage Bina Rothblatt, einer lebendigen Person, unterhalten. Was die Reporterin Amy Harmon unter dem vielversprechenden Titel Making Friends With a Robot Named Bina48 („Freundschaft schließen mit einem Roboter namens Bina48“) zeigt, ist für denjenigen, der ein natürliche Kommunikation erwartet, etwas ernüchternd. So auch für die Reporterin selbst, wie in der Aufzeichnung des Interviews erkennbar ist:

Interview mit Bina48 (englisch)

Der Roboter fokussiert seine Gesprächspartnerin nicht, versteht Fragen falsch oder gar nicht, usw. …

Eine natürliche Gesprächssituation zu erzeugen, ist für einen Roboter (bzw. deren Erschaffer) eine unglaublich schwierige Aufgabe. Der Mensch kommuniziert eben in einem Gespräch nicht nur über Sprache, sondern gleichzeitig über viele weitere Kanäle: Gestik, Mimik, Betonung, … entsprechend erwarten wir Menschen in einem Gespräch, auf sämtlichen dieser Kanäle von unserem Gegenüber plausible Signale zu empfangen. Ein Roboter, der mit uns spricht, aber über keine Mimik verfügt, wird niemals natürlich, menschlich wirken. Ein Roboter, der die Betonung nicht variiert, wird niemals Emotionen transportieren oder beim Gegenüber erzeugen können wie es mein Mensch vermag.

Und so sieht man die Schwierigkeiten der Reporterin, mit dem Roboter ein Gespräch zu führen. Schwierigkeiten, die nichtmal inhaltlicher Natur sind. Selbst wenn der Roboter die Frage versteht und eine einigermaßen plausible Antwort erzeugen kann: Wie er dabei wirr umhersieht, immer einen Moment zu lange mit dem Antworten wartet und mangels ausgeprägter Mimik nicht zu erkennen gibt, ob er gerade nachdenkt oder einfach die Frage nicht verstanden hat … all das verwirrt die Reporterin und sorgt mehrfach für ein stockendes Gespräch und gegenseitiges Unterbrechen.

Die Leistungen der Truppe um David Hanson von Hanson Robotics sollten bei alledem aber nicht unterschätzt werden. Der Chatbot Bina48 ist nicht schlecht … die Aufgabe – natürliche, menschliche Kommunikation – ist nur einfach eine unglaublich schwierige. Hier ist man in der Robotik noch ganz am Anfang der Entwicklung (das allerdings schon seit Jahrzehnten) und hat noch zahlreiche ungelöste Fragen vor sich.

Insofern ist Bina48 und dieses Interview einfach als ein weiterer Baustein in dieser Entwicklung zu verstehen und als weiterer Quell neuer Erkenntnisse. Für den Zuschauer macht dieses Interview anschaulich, wie sehr Roboter – bei allen Erfolgen in letzter Zeit – versagen, wenn man sie ins Feld lässt, in die sogenannte unstrukturierte Umgebung. Das ist unsere natürliche Umgebung, die nicht den künstlichen, vereinfachten Laborbedingung entspricht. In diesem Fall eine Reporterin, die einfach nur ein normales Gespräch führen möchte.

Der Original-Artikel in der New York Times mit Amy Harmons ganzem Erfahrungsbericht findet sich hier: Making Friends With a Robot Named Bina48 (englisch)