CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی نظرکاوی جملات فارسی با تکنیک های N-grams

عنوان مقاله: بررسی نظرکاوی جملات فارسی با تکنیک های N-grams
شناسه ملی مقاله: STCONF04_149
منتشر شده در چهارمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران در سال 1400
مشخصات نویسندگان مقاله:

عماد نعمتی - دانشجوی ارشد مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب
پریسا دانشجو - استادیار گروه مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب

خلاصه مقاله:
در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربران مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی NLP ، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این پژوهش با استفاده از نظرات فارسی تلفن همراه سایت دیجی کالا در تکنیک های مختلف N-grams و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک و جنگل تصادفی و همچنین استفاده این الگوریتم ها در تکنیک های مختلف N-grams در هفت برند مختلف تلفن همراه از جمله Huawei ، LG ، Samsung ، Sony ، HTC ، Nokia و Apple و به منظور دستیابی به عملکرد آنها براساس پارامترهایی مانند صحت، بازیابی و دقت مورد بررسی قرار داده ایم. در نتیجه در همه روش های N-grams به جز روش سه واژه ای دقت و صحت و بازیابی به دست آمده توسط الگوریتم جنگل تصادفی بین ۸۸ تا ۹۱ درصد و همچنین دقت به دست آمده توسطالگوریتم جنگل تصادفی با میانگین ۹۹ درصد و الگوریتم کاهش گرادیان تصادفی با میانگین ۹۸ درصد در تمام برندهای مختلف عملکرد بهتری نسبت به الگوریتم های دیگر دارند.

کلمات کلیدی:
شبکه اجتماعی، الگوریتم هوشمند، N-grams ، دیجی کالا، تلفن همراه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1292785/