Inklusive "Ähms" und "Ums": Google arbeitet am perfekt "menschlich sprechenden" Computer

Inklusive "Ähms" und "Ums": Google arbeitet am perfekt "menschlich sprechenden" Computer
Scott Huffman, Google Assistant Vice President of Engineering, spricht während einer Pressekonferenz auf der CES 2018 in Las Vegas.
Ein Computer, der am Telefon nicht von einem Menschen zu unterscheiden ist, zeigt besonders eindrucksvoll Googles Stärke bei künstlicher Intelligenz. Lernende Maschinen sollen aber auch Fotos bearbeiten, E-Mails formulieren - und Kindern Manieren beibringen.

Das Gespräch klang wie ein ganz gewöhnlicher Anruf in einem Restaurant. "Hi, ähm, ich möchte einen Tisch für Mittwoch, den 7. reservieren." Doch: Da rief kein Mensch in dem Lokal an, sondern der Google Assistant, die sprechende Software des Internet-Konzerns. Es folgte, wie so oft in solchen Fällen, ein Missverständnis. "Für sieben Personen?", fragte die Mitarbeiterin zurück. "Ummm, für vier Personen", korrigierte das Programm.

Roboterwagen von Google-Schwesterfirma Waymo in Unfall verwickelt (Archivbild)

Die Demonstration zum Auftakt der Entwicklerkonferenz Google I/O war eine Premiere für die Menschheit: Eine Maschine, die nicht nur makellos eine Unterhaltung führen kann, sondern mit ihrer vom Computer generierten Stimme von einem Menschen nicht zu unterscheiden ist. Die Pausen und "ähms" und "ums" ließen den Assistant sogar noch menschlicher klingen als selbst die erfundenen Computer-Assistenten in Filmen.

Denn die Google-Software imitierte perfekt die Art, wie wir sprechen. "Uhum", quittierte der Assistant lässig in einem zweiten Anruf, als die Mitarbeiterin eines Friseursalons um eine Sekunde Geduld bat, während sie ins den Terminkalender schaut. Wenn schon etwas die Software vom Menschen unterschied, dann höchstens die Geduld, mit der sie sich auch durch ein nicht glatt laufendes Gespräch arbeitete.

Die Laute wie "Hmmm" sollen dem Gesprächspartner auf natürliche Weise zeigen, dass man noch kurz überlege, schrieben die Entwickler in einem Blogeintrag zur Vorstellung des Programms. Umfragen bestätigten, dass dies Gespräche natürlicher wirken lasse.

An dieser Technologie mit dem Namen Google Duplex arbeite Google bereits seit Jahren, sagte Google-Chef Sundar Pichai. Man wolle sie aber "richtig hinbekommen", bevor sie für die Nutzer verfügbar sein werde, schränkte er ein. Einen konkreten Starttermin gab es daher nicht, auch wenn öffentliche Tests im Sommer beginnen sollen. Aber die Konsequenzen sind klar: Wir werden es in absehbarer Zukunft mit Maschinen zu tun haben, die am Telefon nicht von Menschen zu unterscheiden sind.

Damit kündigen sich neue Fragen an. Sollten Computer verpflichtet werden, sich als solche zu erkennen zu geben? Was bedeutet das für Medien wie das Radio? Und wenn irgendwann an beiden Enden der Telefonleitung solche Computer-Assistenten aufeinandertreffen, sollten sie einfach die Sprache ablegen und die Daten non-verbal austauschen?

Pichai betont, am Ende müsse die Gesellschaft zu einem Einvernehmen kommen, wann und wie solche Software eingesetzt werden dürfe. Google jedenfalls versuche, mit Bedacht vorzugehen und sehr gezielt passende Einsatzfelder herauszusuchen, die das Leben einfacher machen, ohne für Konflikte zu sorgen. Zum Start kann Duplex wie in den vorgespielten Beispielen Termine beim Friseur machen, Tische in Restaurants reservieren und Öffnungszeiten erfragen. Die Fähigkeit des Systems, eine Unterhaltung aufrechtzuerhalten, sei eng auf die Bereiche beschränkt, in denen es trainiert wurde, betonten die Entwickler. "Es kann keine allgemeine Unterhaltung führen."

Bei Google Duplex kommen in einem Service Spracherkennung, Sprachausgabe und maschinelles Lernen zusammen. Es war das aufsehenerregendste Beispiel für den Einsatz künstlicher Intelligenz bei Google, die ansonsten auch automatisch Fotos bearbeitet, Sätze in E-Mails vorschlägt oder durch ein smartes App-Management die Laufzeit von Smartphone-Batterien verlängert.

Google-Chef Pichai ging in seinem Auftritt zugleich nicht auf das Klima des allgemeinen Misstrauens gegenüber Technologie-Riesen ein, das einen Höhepunkt im Facebook-Datenskandal fand. Seine Eröffnungs-Keynote der Google I/O war von einer heutzutage ungewöhnlichen, nahezu fröhlichen Technik-Begeisterung geprägt. Datenschutz war kein prominentes Thema - schließlich laufen die ganzen Funktionen auch nicht ohne den Zugriff auf Nutzerinformationen. Zugleich versicherte Pichai, dass Google bei künstlicher Intelligenz vorsichtig und verantwortungsvoll vorgehen werde. Doch das hat man schon öfter gehört.

Japanische Stadt nominierte Roboter für Wahl zum Bürgermeister – KI-Kandidat kommt auf Platz drei

Einen ungewöhnlichen neuen Ton brachte in die jährliche I/O-Konferenz aber die Debatte um eine Abhängigkeit von Technik wie vor allem Smartphones. Google verschrieb sich dem "digitalen Wohlbefinden". Sprich: Nutzer sollen auch mal abschalten - und Google möchte ihnen dabei helfen. So wird man Zeitlimits für die tägliche Nutzung einzelner Apps festlegen können. Und das Smartphone auf dem Tisch mit dem Display nach unten zu drehen, kann den "Nicht-Stören"-Modus aktivieren, zum Beispiel wenn man beim Abendessen mit der Familie sitzt und nicht ständig durch ein brummendes Handy gestört werden möchte.

In einer weiteren Reaktion auf jüngste öffentliche Debatten lässt Google seinen Assistenten auch Kindern Manieren beibringen. Bei Eltern geht nämlich die Sorge um, dass ihre Sprösslinge sich einen rüden Umgangston angewöhnen, weil die digitalen Helfer wie Googles Assistant, Amazons Alexa oder Apples Siri sich beliebig herumkommandieren lassen. Die Google-Software wird nun die Kinder loben, wenn sie höflich "bitte" sagen. 

Mehr zum Thema Künstliche Intelligenz:

(rt deutsch/dpa)

Diese Webseite verwendet Cookies. Klicken Sie hier, um mehr zu erfahren

Cookies zulassen