ҚАЗАҚСТАН КИБЕРЕКІСТІГІНДЕГІ ҚАУІПТІ МАЗМҰНЫ БАР МӘТІНДЕР ЖІКТІТІРУШІСІНЕ АРНАЛҒАН ТҮЙІН СӨЗДЕР СӨЗДІГІН ҚҰРУ
Жарияланды:
2023-09-30Бөлім:
Сәулет және құрылысМақала тілі:
Орыс тіліКілт сөздер:
табиғи тілді өңдеу, сентимент талдау, машиналық оқыту, термин жиілігі, мәтінді жіктеуАңдатпа
Бұл жұмыс Қазақстанның киберкеңістігінде қауіпті контентті іздеудің ақпараттық жүйесін құру жөніндегі зерттеудің бір бөлігі болып табылады. Зерттеудің мақсаты суицидтік жазбалар мен суицидтік топтар мәтіндерінде суицидтік тәуекелдің болуын анықтау мәселесін мысалға ала отырып, қауіпті мазмұны бар мәтіндер классификаторының жұмысы үшін түйінді сөздер сөздігін жасау болып табылады. Қазақ тіліне арналған мұндай деректер базасы жоқ. Осы зерттеулердің нәтижесінде эксперименттік корпус пен қазақ тіліндегі түйінді сөздер тізімі жасалды. Түйінді сөздер әртүрлі морфологиялық формалармен дерекқорға қосылды.
Лицензия
Авторлық құқық (c) 2023 ШҚТУ Хабаршысы
Бұл жұмыс Creative Commons атрибуты бойынша лицензияланған. 4.0 Халықаралық лицензия.
Most read articles by the same author(s)
- Kuanysh Nursakitov, КИБЕРБУЛЛИНГТІ АҢЫҚТАЙТЫҢ НЕЙРОНДЫҚ ЖЕЛІЛЕРДІ ҚОЛДАНУ , ШҚТУ Хабаршысы: Нөмір 1 № 4 (2023): CITech