Download PDFOpen PDF in browserMorfologik Teg Va N-Grammlar Vositasida Soxta Yangiliklarni TasniflashEasyChair Preprint 1105011 pages•Date: October 9, 2023AbstractBugungi kunda ijtimoiy tarmoqlardagi soxta yangiliklarni samarali aniqlash usullarini o‘rganish juda muhim va dolzarb vazifa hisoblanadi. Ushbu usullar ko‘plab tadqiqot sohalarida, jumladan morfologik tahlilda o‘rganiladi. Ba’zi NLP tadqiqotchilarning ta’kidlashicha, oddiy kontent bilan bog‘liq n-gramlar va POS teglash orqali soxta yangiliklarni tasniflash uchun etarli emas. Biroq, ular so‘nggi o‘n yillikda bu bayonotlarni eksperimental ravishda tasdiqlashi mumkin bo‘lgan hech qanday empirik tadqiqot natijalarini olmaganlar. Ushbu qarama-qarshilikni hisobga olgan holda, maqolaning asosiy maqsadi soxta va haqiqiy yangiliklarni to‘g‘ri tasniflash uchun n-gramlar va POS teglashdan umumiy foydalanish imkoniyatlarini eksperimental baholashdan iborat. Korpus matnlarini POS teglarning n-grammlari aniqlandi va keyinchalik tahlil qilindi. Soxta yangiliklarni aniqlashning dastlabki ishlov berish bosqichida n-grammlarning turli guruhlariga POS teglash asoslangan uchta usul taklif qilindi va qo‘llanildi. Shu maqsadda n-gramm o‘lchami birinchi bo‘lib tekshirildi. Aniqlangan n-grammlar asosida yetarli darajada umumlashtirish uchun qaror daraxtlarining eng mos chuqurligi aniqlandi. Nihoyat, tavsiya etilgan usullarga asoslangan modellarning ishlash ko‘rsatkichlari standartlashtirilgan TF-IDF qiymatlari bilan taqqoslandi. Aniqlik (precision), recall va f1-score kabi modelning samaradorlik ko‘rsatkichlari bir necha marta tekshiridi. Shunigdek, TF-IDF usulini POS teglash yordamida yaxshilash mumkinmi degan savol batafsil o‘rganildi. Tadqiqot natijalari shuni ko‘rsatdiki, yangi taklif qilingan metod an’anaviy TF-IDF texnikasi bilan solishtirilganda aniqroq ko‘rsatkichlarni qayd etdi. Xulosa sifatida morfologik tahlilning asosiy TF-IDF metodini yaxshilashi mumkinligini aytish mumkin. Keyphrases: NLP, POS tegging, morphological analysis
|