RL Suite: ИИ для игр
Набор RL-агентов (MCTS, DQN, PPO) для игр Breakout, Шашки и Block Game.
Задача и Решение
Глубокое погружение в Reinforcement Learning. Реализовал и обучил агентов для трех различных сред, решая задачи разной сложности. Для шашек (Checkers) написал кастомное окружение Gymnasium с нуля, закодировав сложную логику мульти-взятий и дам. Обучение проводил через DQN с выходным слоем на 4096 действий, используя ELO-рейтинги для оценки прогресса модели против самой себя.
В проекте Breakout применил CNN (Convolutional Neural Networks) для обработки “сырых” пикселей экрана, внедрив технику Frame Stacking для понимания динамики движения мяча. Для логической игры Block Game реализовал алгоритм Monte Carlo Tree Search (MCTS), который симулирует исходы ходов, позволяя ИИ планировать стратегию без нейросетей.