شناسایی عناوین محتوای متنی منتشرشده در شبکه اجتماعی توئیتر

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 74

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-6-2_002

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

با رشد روز افزون شبکه های اجتماعی، میل به تحلیل محتوای منتشرشده برای مقاصد گوناگون افزایش یافته است. یک دسته از عمده فعالیت هایی که در این حوزه انجام می شود شناسایی و دسته بندی محتواهای تولیدشده است. این موضوع به معنی گروه بندی مطالب منتشرشده در دسته هایی با موضوعات مشابه و ارائه برچسب های پیشنهادی برای هر دسته می باشد. در این مقاله، الگوریتم جدیدی برای دسته بندی محتوای متنی شبکه اجتماعی توئیتر ارائه شده است. در این الگوریتم ابتدا هر متن، پیش پردازش شده و سپس یک گراف ارتباطات جدید مبتنی بر محتوای متن های منتشرشده ساخته می شود. این گراف وزن دار و بی جهت است و روی آن با استفاده از دو روش بدون ناظر، تشکل های مختلف شناسایی می شوند. برای ارزیابی، داده های متنی ارسال شده از شهر واشینگتن در یک بازه زمانی، با API جمع آوری و الگوریتم های ارائه شده روی آن اعمال شده است. برای بررسی دقت، نتایج حاصل با دو الگوریتم کلاسیک K-means و LDA بر اساس معیار اطلاعات متقابل نرمال شده، مقایسه شده است که نشان دهنده دقت مناسب الگوریتم پیشنهادی است.

نویسندگان

فاطمه بهاری فرد

پژوهشکده علوم کامپیوتر، پژوهشگاه دانشهای بنیادی )IPM)

وحید معتقد

پژوهشکده علوم کامپیوتر، پژوهشگاه دانشهای بنیادی )IPM)