Alphago

Definition - Was bedeutet AlphaGo?

AlphaGo ist eine schmale KI, ein Computerprogramm, das von Google DeepMind entwickelt wurde, um Go zu spielen, ein chinesisches Strategie-Brettspiel für zwei schachähnliche Spieler. AlphaGo ist das allererste KI-Programm, das im Oktober 2 einen professionellen menschlichen Spieler, den 2015-Dan-Spieler Fan Hui, auf einem Full-Size-Board ohne Handicaps schlagen konnte. Im März 9 schlug es einen der bestplatzierten menschlichen Spieler der Welt, 2016-dan Lee Sedol, und gewann vier von fünf Spielen.

Technische.me erklärt AlphaGo

Das AlphaGo-Projekt wurde 2014 als Testumgebung gestartet, um zu sehen, wie gut der neuronale Netzwerkalgorithmus von Google DeepMind, der Deep Learning nutzt, bei Go mithalten kann. Der Algorithmus für AlphaGo ist eine Kombination aus Baumsuch- und maschinellen Lerntechniken und wird durch umfangreiche Schulungen mit Menschen und anderen Computerspielern verstärkt. Es verwendet die Monte-Carlo-Baumsuche und wird von einem Richtlinien- und Wertnetzwerk geleitet, das mithilfe tiefer neuronaler Netzwerktechnologien implementiert wird. Das Richtliniennetzwerk ist geschult und hilft der KI, den nächsten Zug vorherzusagen, der am wahrscheinlichsten gewinnt, während das Wertnetzwerk darauf trainiert ist, den Suchbaum einzugrenzen und den Wert dieser Positionen zu bestimmen, wobei die Gewinner in jeder Position geschätzt werden, anstatt ganz nach unten zu suchen bis zum Ende des Spiels.

AlphaGo wurde zuerst mit historischen Spielzügen von menschlichen Spielern gespeist, wobei eine Datenbank mit rund 30 Millionen Zügen verwendet wurde, um menschliche Spiele nachzuahmen. Sobald die KI einen Grad an Kompetenz erreicht hatte, wurde sie weiter trainiert, indem sie gegen Instanzen von sich selbst spielte und das verstärkte Lernen nutzte, um sich zu verbessern und mehr zu lernen.

Im Oktober 2015 spielte und besiegte eine verteilte Computerversion von AlphaGo Fan Hui, einen 2-Dan-Go-Europameister. Dies war das erste Mal, dass ein Computerprogramm einen professionellen Spieler bei Go besiegte. Fan Hui half dann Monate nach seiner Niederlage als Berater für das DeepMind-Team. Im März 2016 trat AlphaGo gegen Lee Sedol an, einen der bestplatzierten Spieler der Welt, der das Top-Level von 9-Dan erreicht hatte. Dies war ein großer Durchbruch in der KI-Forschung, da vier Spiele gegen Lees gewonnen wurden, da der von DeepMind verwendete Algorithmus für tiefes Lernen und neuronale Netze für jeden anderen Zweck verwendet werden kann, da er nicht wirklich für das Spielen von Go programmiert war, sondern vielmehr gelehrt wurde wie man Go spielt. Dies eröffnet der KI-Forschung eine völlig neue Welt.