„Wissen aus dem Nichts“: Neue Künstliche Intelligenz macht sich selbst unschlagbar im Go-Spiel

„Wissen aus dem Nichts“: Neue Künstliche Intelligenz macht sich selbst unschlagbar im Go-Spiel
Schon die Vorgängerversion von Alpha Go Zero, Alpha Go, brachte Meisterspieler zur Verzweiflung. So wie hier den Chinesen Ke Jie.
Der Supercomputer AlphaGo sorgte im Jahr 2015 für Furore, als er menschliche Topspieler schlug. Sein Nachfolger ist nun sogar noch stärker: Er besiegte AlphaGo in 100 Spielen 100 Mal. Der Clou dabei: Die Künstliche Intelligenz (KI bzw. AI) brachte sich alles selbst bei.

Ohne menschliches Zutun – ein neues selbstlernendes Computerprogramm machte sich selbst binnen Tagen bei dem chinesischen Brettspiel Go unschlagbar. AlphaGo Zero besiegte seinen Vorläufer AlphaGo, der bereits die stärksten menschlichen Go-Spieler geschlagen hatte, in 100 Spielen 100 Mal. Während das ältere Modell AlphaGo noch monatelang mit Spielzügen menschlicher Go-Meister trainiert worden war und etwa 30 Millionen Spiele absolviert hatte, benötigte AlphaGo Zero drei Tage und knapp 5 Millionen Spiele, um besser zu werden als sein Vorgänger.

Die Software sei "nicht länger durch die Grenzen menschlichen Wissens beschränkt", betonen David Silver und Demis Hassabis von der Google-Entwicklerfirma Deepmind, die den Supercomputer im Fachblatt "Nature" vorstellen.

AlphaGo Zero ist jetzt die stärkste Version unseres Programms und zeigt, welchen Fortschritt wir auch mit weniger Rechenleistung und ohne die Nutzung menschlicher Daten erreichen können," so Hassabis.

Das Team um Silver und Hassabis verzichtete darauf, der Software die Taktiken menschlicher Go-Spieler anzutrainieren. AlphaGo Zero erhielt lediglich das Regelwerk und musste pro Zug zwei Dinge berechnen: Welche nächsten Züge sind möglich, und wie groß ist die Wahrscheinlichkeit, mit diesen Zügen am Ende zu gewinnen?

Die Entwickler gaben dem System auch keine Lernstrategie vor, es werden lediglich erfolgreiche Wege "belohnt" und andere Optionen "bestraft". Bei den Spielen gegen sich selbst konnte AlphaGo Zero Spielzüge ausprobieren und sich verbessern. Dabei war die Lernkurve zwar nicht so steil wie beim Vorgänger, der noch von menschlichen Spielern gelernt hatte, dafür wuchs sie aber höher.

Zudem kommt das neue Programm mit kleinerer Rechenkapazität aus: Der Vorläufer benötigt zwei neuronale Netze, AlphaGo Zero nur eins. Während dem Vorläufer 48 sogenannte Tensorprozessoren (Tensor Processing Units; TPUs) zur Verfügung standen, kommt AlphaGo Zero mit vier Prozessoren zu besseren Leistungen.

Das Team beobachtete, dass AlphaGo Zero anders an das Spiel Go herangeht als ein Mensch. Zwar tauchten die meisten klassischen Go-Spielzüge früher oder später in den Spielen der Software gegen sich selbst auf, aber in anderen Lernphasen als beim Menschen. So zeigte AlphaGo Zero die Strategie "Shicho", die Menschen häufig als Anfänger spielen, erst nach längerem Training. Am Ende bevorzugte die Software Spielzüge, die selbst den stärksten Go-Meistern bisher unbekannt waren.

In einem "Nature"-Kommentar spricht Satinder Singh von der University of Michigan in Ann Arbor von "einem der größten Fortschritte in Bezug auf Anwendungen für das Gebiet des bestärkenden Lernens". Dass der Computer menschliche Fähigkeiten in den Schatten stelle, sei aber kein Anlass zur Sorge:

Dies ist nicht der Anfang vom Ende, da AlphaGo Zero wie jede andere erfolgreiche Künstliche Intelligenz bis jetzt extrem begrenzt ist, was es weiß und was es im Vergleich zu Menschen und sogar Tieren tun kann.

Auch in Deutschland ist man beeindruckt:

Wieder einmal ist den Kollegen bei Deepmind ein echter und großartiger Coup gelungen, denn sie konnten zeigen, dass ein intelligentes Go-Programm, das gegen sich selbst spielt, lernt, noch besser zu werden, als wenn es aus Spielen von Menschen lernt,

sagt Klaus-Robert Müller von der Technischen Universität Berlin.

Das klingt, als ob man Wissen aus dem Nichts schöpfen könnte, sozusagen ein Münchhausen-Trick der Künstlichen Intelligenz.

Doch andere Forscher relativieren den Begriff "übermenschlich": "Zwar spielt dieses System besser Go als jeder Mensch, aber diese Fähigkeit ist nur ein minimaler Aspekt aller menschlichen Fähigkeiten", sagt Philipp Slussalek vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken.

Die menschlichen Fähigkeiten sind offensichtlich dramatisch viel breiter, allgemeiner und flexibler als es jeder Computer auf absehbare Zeit sein wird.

Entwickler Hassabis betont den Nutzen der Neuerung: Die Software solle helfen "bei der Lösung aller möglichen Probleme der realen Welt, wie Proteinfaltung oder dem Entwurf neuer Materialien". Dass die neuen Erkenntnisse über Go hinausreichen, glaubt auch Slussalek: "Mit entsprechenden Simulationen von anderen Umgebungen sollte man auch sinnvolles Verhalten und gute Strategien für andere, wichtigere Anwendungsbereiche erlernen können." Das gelte etwa für die Sicherheit autonomer Fahrzeuge.

Elon Musk ist ein Unternehmer und Investor. Er hat sowohl die Staatsangehörigkeit seines Geburtslandes Südafrika als auch die von Kanada und den USA. Er ist bekannt durch seine Teilhabe an der Gründung  von PayPal sowie dem privaten Raumfahrtunternehmen SpaceX und dem Elektroautohersteller Tesla.

AlphaGo Zero ist nicht das einzige Projekt von Google, das für Schlagzeilen sorgt. Im Mai stellte der Internetriese sein Machine-Learning-Projekt AutoML vor. Die KI soll den Mangel an hochqualifizierten Fachkräften im KI-Programming ausgleichen und neue KI-Systeme erschaffen und verbessern. Dabei führt das System tausende Simulationen durch, um die Teile eines Codes zu finden, die verbessert werden können, verbessert diese dann und fährt mit diesem Prozess fort.

Jetzt hat es ein AutoML-System geschafft, die menschlichen Entwickler zu übertreffen, wie Wired berichtet. Eine durch AutoML erzeugte KI stellte einen Rekord von 82 Prozent Genauigkeit bei der Kategorisierung von Bildern anhand des Inhaltes auf. Bei der Aufgabe, die Lage verschiedener Objekte in einem Bild zu markieren, erreichte die KI eine Quote von 43 Prozent – im Vergleich schaffte das beste von Menschen entwickelte System nur 39 Prozent.

Damit liefert Googles AutoML-Projekt bedeutende Ergebnisse, denn selbst bei Google verfügen nur wenige Mitarbeiter über die Fähigkeiten, derartige KI-Systeme der nächsten Generation zu entwickeln. Solche Prozesse zu automatisieren, werde die Branche nachhaltig verändern. „Heutzutage werden sie noch von Machine-Learning-Experten handgefertigt und es gibt weltweit nur wenige Tausend Wissenschaftler, die das können”, zitiert Wired den Google-CEO Sundar Pichai. „Wir wollen es hunderttausenden von Entwicklern ermöglichen.”