Bestärkungslernen (rl)

Definition - Was bedeutet Reinforcement Learning (RL)?

Reinforcement Learning im Kontext der künstlichen Intelligenz ist eine Art dynamischer Programmierung, bei der Algorithmen mithilfe eines Belohnungs- und Bestrafungssystems trainiert werden.

Ein Verstärkungslernalgorithmus oder Agent lernt durch Interaktion mit seiner Umgebung. Der Agent erhält Belohnungen durch korrekte Ausführung und Strafen für fehlerhafte Ausführung. Der Agent lernt ohne Intervention von einem Menschen, indem er seine Belohnung maximiert und seine Strafe minimiert.

Technische.me erklärt Reinforcement Learning (RL)

Reinforcement Learning ist ein Ansatz zum maschinellen Lernen, der von der Verhaltenspsychologie inspiriert ist. Es ist ähnlich, wie ein Kind lernt, eine neue Aufgabe auszuführen. Reinforcement Learning steht im Gegensatz zu anderen Ansätzen des maschinellen Lernens darin, dass dem Algorithmus nicht explizit gesagt wird, wie eine Aufgabe auszuführen ist, sondern dass das Problem selbstständig gelöst wird.

Als Agent, der ein selbstfahrendes Auto oder ein Schachprogramm sein kann, interagiert er mit seiner Umgebung und erhält je nach Leistung einen Belohnungsstatus, z. B. sicher zum Ziel fahren oder ein Spiel gewinnen. Umgekehrt erhält der Agent eine Strafe für fehlerhafte Leistungen, z. B. wenn er von der Straße abfährt oder schachmatt gesetzt wird.

Der Agent trifft im Laufe der Zeit Entscheidungen, um seine Belohnung zu maximieren und seine Strafe durch dynamische Programmierung zu minimieren. Der Vorteil dieses Ansatzes für künstliche Intelligenz besteht darin, dass ein KI-Programm lernen kann, ohne dass ein Programmierer festlegt, wie ein Agent die Aufgabe ausführen soll.