Машиналық оқыту алгоритмдер негiзiнде кiпiрлердi автоматты түрде классификациялау

Авторлар

  • K. Ch. Koybagarov Институт информационных и вычислительных технологий image/svg+xml
  • M. Ye. Mansurova Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml

Кілт сөздер:

тондық классификациялау, машиналық оқыту, тiреу векторлар машинасы, логистикалық регрессия, аңғалдық Байес классификаторы

Аңдатпа

Қазiргi таңда әртүрлi сұрақтар бойынша Интернет қолданушыларының пiкiрiне сүйенсек автоматты талдау есебiне үлкен қызығушылық танылып жатыр. Талдау пiкiрiнiң негiзгi мәселесiнiң бiрi болып тон бойынша тексттердiң классификациясы болып табылады. Жұмыста коллекциялар мысалында машиналық оқыту әдiстерiн қолдану арқылы класқа тондық классификациялау есебiнiң түрлi әдiстерi берiлген. Осы жұмыста қойылған негiзгi есептер, векторлы моделдiң аясында тексттi ұсыну түрлi тәсiлдердi салыстыру болып табылады, бiрнеше машиналық оқыту тәсiлдерiн қолдану, статистикалық және лингвистикалық белгiлерiнiң түрлi бiрiгуi және алынған нәтижелердiң талдауы. Тондық классификация моделiн құру үшiн келесiдей статистикалық және лингвистикалық белгiлерiнiң келесiдей жиыны анықталған: сөз векторларының құрылуы, N-gramm есебi, эмитикондар есебi, сұрақ белгiсi мен тыныс белгiлерiнiң есептелуi, сөйлеу бөлiгiнiң есебi, ұзақ қайталанатын дауысты дыбысты бiр дауысты дыбысқа алмастыру, терiстеулердiң есебi, жауап беру ұзындығының есебi. Машиналық оқытудыө келесi әдiстерiн қолдану арқылы тәжiрибе жүргiзiлдi: тiреу векторлар машинасы, логистикалық регрессия және аңғалдық Байес классификаторы. Тәжiрибе әртүрлi векторлық сөздер моделiнiң нұсқаларымен, n-граммалар және мәтiндi сипаттаудың белгiлерiмен жүргiзiлдi. Тәжiрибе нәтижесi тондық классификация үшiн ең тиiмдi сипаттамаларды таңдау бойынша ұсыныс жасауға мүмкiндiк бередi.

Жарияланды

2017-11-20