APPLICATION OF REINFORCEMENT LEARNING TO DEVELOP AN AI MODEL FOR GAME “TOGYZ QUMALAQ”
Ключевые слова:
Togyz qumalaq, Reinforcement Learning, Q-learning, Deep Q-Network (DQN), MiniMax, Algorithms, Game AI, Agent performanceАннотация
Логические игры часто требуют от игроков решения различных головоломок и стратегических задач. Благодаря активному внедрению искусственного интеллекта в таких играх появилась возможность использовать модели глубокого обучения, что привело к значительному прорыву в решении других смежных задач в этой области. В этой статье представлено исследование по разработке и обучению двух алгоритмов обучения с подкреплением: Q-learning и Deep Q-Network (DQN) для игры Тогыз кумалак. Обе модели были обучены и оценены в игре против MiniMax, которую также реализовали авторы данного исследования. Эксперименты проводились с глубиной рекурсии MiniMax 2, 3 и 4 соответственно. В статье представлены параметры обучения моделей на основе Q-learning и DQN, которые достигли наилучших результатов. Для каждой из моделей представлены графики вознаграждений и эпизодов обучения. В документ также включена архитектура DQN, которая продемонстрировала многообещающие результаты. Результаты показывают, что DQN добилась значительных успехов в решении этой задачи, продемонстрировав заметную производительность. Сравнительный анализ также показал, что, в отличие от DQN, Q-обучение требует для обучения более значительных вычислительных ресурсов и ресурсов памяти.