Alpha Go vs. Lee Sedol

Go Brett

Bereits im Oktober letzten Jahres hat das Computer-Go-Programm AlphaGo, entwickelt von der Google-Tochter DeepMind den europäischen Go-Profi und amtierenden Europameister Fan Hui 5:0 geschlagen. Die Ergebnisse dieses Matches wurden Ende Januar bekannt als DeepMind seine Resultate und Vorgehensweise in einem Nature-Artikel veröffentlichte.

Das asiatische Brettspiel Go galt aufgrund seiner hohen Komplexität als das letzte Strategiespiel in dem Menschen noch deutlich besser sind als Maschinen. Bis vor kurzem erreichte noch kein Go-Programm Profi-Niveau und die nötigen Leistungssteigerungen wurden erst in Jahrzehnten erwartet.Go-Tisch

AlphaGo nutzt nun eine geschickte, asynchron arbeitende Kombination aus mehreren tiefen neuronalen Netzen mit einem Monte-Carlo-Suchbaum. Eine schöne Zusammenfassung mit erklärenden Grafiken findet man bei Heise. Die neuronalen Netze wurden einerseits zur Auswahl von Zügen (Wie würde ein sehr guter menschlicher Spieler seinen nächsten Stein setzen?) und andererseits zur Bewertung von Stellungen (Wie wahrscheinlich ist ein Sieg mit diesem Zug?) eingesetzt. Ersteres lernt der Algorithmus anhand hunderttausender Profi-Partien, Letzteres durch damit simulierte Partien gegen sich selbst.

Ein Monte-Carlo-Suchbaum muss nun sehr schnell arbeiten, um ausgehend von der aktuellen Stellung möglichst viele Partien mehr oder weniger zufällig zu Ende zu simulieren, denn nur durch eine hohe Anzahl simulierter Partien kann eine statistisch signifikante Aussage über die Siegwahrscheinlichkeit getroffen werden. Auf der anderen Seite ist eine Auswertung der tiefen neuronalen Netze sehr rechenaufwändig. Deshalb werden die beteiligten Prozesse asynchron abgearbeitet sowie insbesondere die Netzauswertungen auf vielen CPUs und GPUs parallel berechnet.

Aktuell läuft nun ein ebenfalls auf 5 Partien ausgelegter Wettstreit zwischen der inzwischen von den DeepMind-Spezialisten noch weiterentwickelten Software und Lee Sedol, einem der besten Go-Spieler der Welt. AlphaGo liegt momentan 2:0 in Führung und wir sind gespannt auf die weiteren Ergebnisse. Die restlichen Partien (12., 13. und 15. März) können live auf dem DeepMind Youtube – Kanal verfolgt werden.

Beitragsbild Quelle: Wikipedia, CC BY-SA 3.0

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.