besteht die möglichkeit, dass du den code davon freigibst? würd mich interessieren, wie du die lernfähige ki implementiert hast
Ich hatte angedacht, ein Tutorial über RL zu schreiben und gleichzeitig dazu den TTT Code zu veröffentlichen.. Weiß aber noch nicht ob ich dazu die Zeit finde. Ich denke der Code alleine wäre schwer wiederzuverwenden, wenn man die Theorie dahinter nicht verstanden hat.
Wenn ich das Spiel beginne, gewinne ich immer, da die KI immer gleich auf meinen Zug spielt.
Wenn die KI startet wird es meist unentschieden.
Allgemein verhält sich die KI relativ statisch, da ich für gleiche Züge immer die gleiche Antwort bekomme. (Wobei es bei TicTac Toe nun auch nicht ganz so viele sinnvolle Lösungen gibt.)
Das liegt daran, dass die KI derzeit immer den Folgezustand wählt, der die höchste Bewertung hat. Ich könnte es vielleicht so umbauen, dass sie immer einen zufälligen Zustand mit positiv erwartetem Feedback nimmt, dann wäre etwas mehr Abwechslung im Spiel.
Ärgert mich ziemlich, dass trotz allem immer noch nicht alle Zustände korrekt bewertet werden, so dass die KI falsche Züge macht... Vielleicht schau ich nachher nochmal ob ich einen noch besseren Trainingslauf hinbekomme..