СОЗДАНИЕ СЛОВАРЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ КЛАССИФИКАТОРА ТЕКСТОВ, СОДЕРЖАЩИХ ОПАСНЫЙ КОНТЕНТ В КИБЕРПРОСТРАНСТВЕ КАЗАХСТАНА
Опубликован:
30-09-2023Раздел:
Инженерия и инженерное делоЯзык статьи:
РусскийКлючевые слова:
обработка естественного языка, сентимент-анализ, машинное обучение, частота терминов, классификация текстаАннотация
Данная работа является частью исследования создания информационной системы для поиска опасного контента в киберпространстве Казахстана. Целью исследования является создания словаря ключевых слов для работы классификатора текстов, содержащих опасный контент, на примере задачи выявления наличия суицидального риска в текстах предсмертных записок и групп смертников. Для казахского языка не существует такой базы данных. В результате этого исследования был создан экспериментальный корпус и список ключевых слов на казахском языке. Ключевые слова были добавлены в базу данных с различными морфологическими формами.
Лицензия
Copyright (c) 2023 Вестник ВКТУ
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Наиболее читаемые статьи этого автора (авторов)
- Kuanysh Nursakitov, ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОПРЕДЕЛЕНИЯ КИБЕРБУЛЛИНГА , Вестник ВКТУ: Том 1 № 4 (2023): CITech