ارائه چهارچوبی به منظور استخراج جایگاه برند بر مبنای متن کاوی داده های ایجاد شدهبه و سیله کاربران در شبکه اجتماعی اینستاگرام

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 187

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCNIEE07_073

تاریخ نمایه سازی: 30 دی 1401

چکیده مقاله:

تن کاوی به عنوان یکی از بخش های مهم داده کاوی آنالیز و تجزیه و تحلیل متون مبتنی بر تکنیک های زبانشناسی، یادگیری ماشین و آمار می باشد. فرآیند خلاصه نویسی متون به شکل خودکار جهت کاهش حجم متون استفاده می شود. با توجه به رشد اطالعات و افزایش داده ها خلاصه سازی متون به شکل خودکار بسیار کاربردی و مهم است. در روش خلاصه نویسی متون به محتوای اطلاعات نباید آسیب وارد شود. فرآیند خلاصه نویسی متون فرآیندی سخت و دشوار است. یکی از چالش ها و مشکلات کارهای پیشین آسیب رساندن به محتوای اطلاعات می باشد. در روش پیشنهادی هیچ آسیبی به محتوای اطلاعات وارد نمی گردد. هدف اولیه الگوریتم پیشنهادی فرآیند ساختن یک ماتریس مجزا برای هر سند است که از کلمات تشکیل شده است. به ماتریس ساخته شده در این فرآیند، ماتریس کلمه سند گفته میشود. قبل از انجام فرآیند ساخت ماتریس کلمه سند ابتدا باید مراحلی از جمله شکست سند به جملات تشکیل دهنده ی آن، حذف ایست واژه ها و ریشه یابی کلمات اشاره نمود. روش پیشنهادی ضمن انجام فرآیند خلاصه سازی متون با استفاده از روش روش TF/IDF متون مورد بررسی را با در نظر گرفتن دو فاکتور دقت بازیابیمتون و زمان خلاصه خواهد نمود. تجزیه و تحلیل بر روی مجموعه داده های دیجی کالا نشان می دهد که تعداد ۳۸۰ نمونه را می توان در مدت زمان ۲۴۳ ثانیه و با دقت ۷۶ درصد فرآیند خلاصه نویسی و بازیابی را بر روی آن ارائه نمود. مقایسه روش پیشنهادی با سایر روشهای مطرح شده پردازش متن مانند ICO، Naive Bayes و SVM نشان میدهد که با توجه به زمان دریافتی، دقت مناسب و قابل قبولی از روش پیشنهادی میتوان انتظار داشت. روش پیشنهادی از نظر دقت نسبت به Naïve Bayes، ۱۱ درصد و نسبت به SVM، ۴ درصد بهبود را نشان می دهد.

کلیدواژه ها:

خلاصه سازی خودکار متون ، الگوریتم TF/IDF ، متن کاوی

نویسندگان

یاسمن خرم پور

گروه فناوری اطلاعات ، موسسه آموزش عالی علوم و فناوری سپاهان، اصفهان، ایران

مهدی حمیدخانی

استادیار گروه برق، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران

سیدمحمدرضا میراحمدی

استادیار گروه مدیریت، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران