РАСПОЗНАВАНИЕ ФОНЕМ (ГЛАСНЫХ ЗВУКОВ) С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ
Опубликован:
22-12-2025Раздел:
Информационно-коммуникационные технологииЯзык статьи:
КазахскийКлючевые слова:
phoneme, machine learning, vowel recognition, MFCC, ANN, CNN, RNN, speech recognition.Аннотация
В настоящее время системы автоматического распознавания речи (ASR) приобретают особую актуальность благодаря развитию искусственного интеллекта и машинного обучения. Актуальность исследования определяется недостаточным развитием систем распознавания фонем казахского языка, особенно гласных звуков, и нехваткой цифровых языковых ресурсов. Цель исследования – разработка модели машинного обучения для высокоточного распознавания гласных звуков казахского языка. Для этого проведены предварительная обработка речевых сигналов, извлечение признаков с помощью MFCC и сравнение алгоритмов Random Forest, SVM и ANN. В результате модель ANN показала наибольшую точность. Полученные результаты позволяют повысить качество систем распознавания речи на казахском языке и могут быть применены в области голосовой биометрии и звуковых интерфейсов.
Лицензия
Copyright (c) 2025 Вестник ВКТУ

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Наиболее читаемые статьи этого автора (авторов)
- Dina Oralbekova, Оркен Мамырбаев, Аягоз Имансакипова, Алия Жунусова, Куралай Мухсина, Нурбапа Мекебаев, СРАВНИТЕЛЬНОЕ ИССЛЕДОВАНИЕ МОДЕЛЕЙ LSTM И BERT ДЛЯ ЗАДАЧ МУЛЬТИКЛАССИФИКАЦИИ С ИСПОЛЬЗОВАНИЕМ НАБОРА ДАННЫХ NER , Вестник ВКТУ: № 2 (2025): "Вестник ВКТУ им.Д.Серикбаева"