ДОСТИЖЕНИЯ В ОБЛАСТИ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ ВОПРОСОВ: ОБЗОР МЕТОДОВ, НАБОРОВ ДАННЫХ И ОЦЕНОК АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ ВОПРОСОВ
Ключевые слова:
Автоматическая генерация вопросов, обработка естественного языка, подходы на основе правил, нейронные сетиВыпуск
Раздел
Аннотация
Автоматическая генерация вопросов (AQG) - стремительно развивающаяся область искусственного интеллекта (AI) и обработки естественного языка (NLP), ориентированная на автоматическое создание вопросов из различных источников, таких как текстовые материалы, базы данных и семантические представления. В данном обзоре рассматривается широкий спектр подходов к AQG, от традиционных методов, основанных на правилах, до продвинутых нейросетевых моделей, включая архитектуры на основе «последовательность-последовательность», трансформеров и графов, а также гибридные методы, сочетающие лингвистические правила с методами машинного обучения. Хотя системы, основанные на правилах, обеспечивают ясность и контроль, они часто не справляются со сложными языковыми структурами, в то время как нейронные модели, особенно использующие трансформеры, такие как T5 и BART, изменили AQG, обеспечив сквозное обучение и генерирование более контекстуально значимых вопросов. Гибридные модели призваны сбалансировать сильные стороны обоих подходов, повышая гибкость и адаптивность. В обзоре также рассматриваются методы оценки, включая автоматизированные метрики, такие как BLEU, ROUGE и METEOR, а также человеческие оценки. Несмотря на заметный прогресс, остаются проблемы, связанные с достижением естественной беглости вопросов, семантической точности и созданием высококачественных дистракторов для вопросов с несколькими вариантами ответов. Перспективные направления исследований включают модели обучения на протяжении всего существования, мультимодальную генерацию вопросов, объединяющую текст с изображениями или кодом, и более надежные системы оценки. В обзоре представлены наработки для исследователей и практиков, подчеркивающие потенциал AQG для улучшения образовательных инструментов, разговорных агентов и информационно-поисковых систем.