Creating a model of semantic analysis of extremist texts in the Kazakh language

Ш.Ж.  Мусиралиева; М.А. Болатбек; А.Н. Жумаханова; Г. Байспай; Ж.  Медетбек

doi:10.26577/JMMCS2024121111

Авторлар

Ш.Ж. Мусиралиева Әл-Фараби атындағы Қазақ ұлттық университетi, Қазақстан, Алматы қ. https://orcid.org/0000-0001-5794-3649
М.А. Болатбек Әл-Фараби атындағы Қазақ ұлттық университетi, Қазақстан, Алматы қ. https://orcid.org/0000-0002-2153-180X
А.Н. Жумаханова Әл-Фараби атындағы Қазақ ұлттық университетi, Қазақстан, Алматы қ. https://orcid.org/0009-0008-0210-4037
Г. Байспай Әл-Фараби атындағы Қазақ ұлттық университетi, Қазақстан, Алматы қ. https://orcid.org/0000-0003-4292-2938
Ж. Медетбек Әл-Фараби атындағы Қазақ ұлттық университетi, Қазақстан, Алматы қ. https://orcid.org/0000-0001-7536-5889

DOI:

https://doi.org/10.26577/JMMCS2024121111

286 198

Кілттік сөздер:

интернет экстремизмі, машиналық оқыту, терең оқыту, әлеуметтік желілер, нейрондық желілер.

Аннотация

Қазіргі уақытта әлеуметтік желілерде қазақ тіліндегі мәтіндер мен көзқарастарды зерттеу үшін семантикалық талдауды қолдануға көп көңіл бөлінуде, оның басты мақсаты күдікті немесе экстремистік сипаттағы мазмұнды анықтау болып табылады. Бұл зерттеу мақаласы мәтіндік деректердегі экстремистік мазмұнды анықтау саласында машиналық оқыту мен терең оқыту әдістерін қолдануды зерттейді.

Зерттеу бірнеше маңызды факторларды ескереді, соның ішінде функцияларды өңдеу сатысында артық іріктеу және жеткіліксіз таңдау, экстремистік және бейтарап субъектілер арасындағы нәзік саралау және теңгерімсіз жіктеу мәселелерін шешу. Бұл пайымдаулар мәтінді жіктеу үшін күрделі терең оқыту моделін әзірлеумен аяқталады. Зерттеу мәтіндік материалдардағы экстремистік мазмұнды анықтау үшін әртүрлі машиналық оқыту үлгілерін пайдалануды қамтиды. Бұдан басқа, деректердің теңгерімсіздігі мәселелерін шешу үшін артық іріктеу және жеткіліксіз таңдау әдістерін ескере отырып, осы тапсырмаға ең тиімді тәсілді анықтау үшін машиналық оқыту әдістемелерінің кешенді салыстырмалы талдауы жүргізіледі.

Зерттеу жұмыстары екі негізгі қосалқы міндетке бөлінген: мәтіндегі экстремистік мазмұнды анықтауға мамандандырылған машиналық оқыту моделін әзірлеу және қазақ тілінің бірегей сипаттамалары мен қолжетімді деректер жиынтығын ескере отырып, терең оқыту моделін құру.

Зерттеу сонымен қатар, діни экстремизмді жіктеу үшін пайдаланылатын машиналық оқыту алгоритмдерінің ауқымынан алынған нәтижелерді салыстырмалы бағалаумен аяқталатын, әрқайсысында ерекше белгілердің комбинациясын пайдалана отырып, мүмкіндіктерді өңдеудің қыр-сырын зерттейді. Зерттелген әдістерге шешім ағаштары, кездейсоқ ормандар, тірек векторлық машиналар, k-ең жақын көршілер, логистикалық регрессия және аңғал Бейс кіреді.

Бұл зерттеу діни экстремизмге қатысты мәтіндерді өңдеу бойынша тәжірибелік нұсқаулар ұсына отырып, мәтінді өңдеу, жасанды интеллект және машиналық оқыту салаларына елеулі үлес қосады. Оның үстіне бұл қазақ тілінде жазылған экстремистік мәтіндерге семантикалық талдау жүргізудің заманауи маңыздылығын көрсетеді.

Библиографиялық сілтемелер

Bolatbek M.A., Mussiraliyeva Sh.Zh. Identification of extremist texts using machine learning methods // Bulletin of KazUTZU. – 2018. No. 6 (130). - P. 300-304.

Yntykbai B.N., Mussiraliyeva Sh.Zh., Bolatbek M.A. Analysis of security and confidentiality in social networks using machine learning methods // Materials of the International Scientific Conference of Students and Young Students "Farabi World". - Almaty: Kazakh University, 2021. - P.119.

Chesnokov V.O. The application of the algorithm of selection of communities in information warfare in social networks // Questions of cyber security. – 2017. – No. 1 (19). - C. 37-44.

Ripeanu, K. Beznosov, and E. Santos-Neto. Thwarting fake OSN accounts by predicting their victims // Proceedings of the 8th ACM Workshop on Artificial Intelligence and Security. - 2015. - P.81-89.

Basu A. Social network analysis: A methodology for studying terrorism // Social Networking, ser. Intelligent Systems Reference Library. - 2014. - Vol. 65. P. 215–242.

Freeman, M. The Sources of Terrorist Financing: Theory and Typology // Studies in Conflict & Terrorism -2011. - No. 34. P. 461-475. doi:10.1080/1057610X.2011.571193.

Ahmad S., Asghar M.Z., Alotaibi F.M., Awan I. Detection and classification of social media-based extremist affiliations using sentiment analysis techniques // Human- centric Computing and Information Sciences. – 2019. –Vol.9, №24. – Р. 1 – 23. Q1

Mayur G., Swati A., Ketan K., Ajith A. Multi-ideology Multi-class Extremism Classification using Deep Learning Techniques. // IEEE Access. –2022. Q1

M. Asif, A. Ishtiaq, H. Ahmad, H. Aljuaid, and J. Shah. Sentiment analysis of extremism in social media from textual information. // Telematics Informat. – 2020. vol. 48, Art. no. 101345,. Q1

J. Klausen, C. E. Marks, and T. Zaman. Finding extremists in online social networks. // European Journal of Operational Research. – 2018. vol. 66, no. 4, pp. 957–976. Q1

Taha K., Yoo PD. Shortlisting the influential members of criminal organizations and identifying their important communication channels // IEEE Transactions on Information Forensics and Security. - 2019. - Vol. 14. No. 8. P. 1988-1999.

Devyatkin D.A., Smirnov I.V., Ananyeva M.I., Kobozeva M.V., Chepovskiy A.M., Solovyev F.N. Exploring linguistic features for extremist texts detection (on the material of Russian-speaking illegal texts) // 2017 IEEE International Conference on Intelligence and Security Informatics (ISI). - 2017. - P.188-190.

Bissaliyev M.S., Nyussupov A.T., Mussiraliyeva Sh.Zh. Enterprise Security Assessment Framework for Cryptocurrency Mining Based on Monero // Vestnik KazNU Series "Mathematics, Mechanics, Informatics". - 2018. - No. 2(98). - P. 67-76.

Nouh M., Nurse J. Identifying Key Players in Online Activist Groups on Facebook Social Network // IEEE Computer Society. - 2015. - P. 969-978.

Қазақ тiлiндегi экстремистiк мәтiндердi семантикалық талдау моделiн құру

Авторлар

DOI:

Кілттік сөздер:

Аннотация

Библиографиялық сілтемелер

Жүктелулер

Как цитировать

Шығарылым

Бөлім

Тіл

Ақпарат

Жылдам сілтемелер