CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاربست الگوریتم تخصیص دیریکله پنهان با تنظیم بهینه پارامترها دراستخراج کلمات خبر محور از میکروبلاگ ها

عنوان مقاله: کاربست الگوریتم تخصیص دیریکله پنهان با تنظیم بهینه پارامترها دراستخراج کلمات خبر محور از میکروبلاگ ها
شناسه ملی مقاله: FNCEITPNU02_018
منتشر شده در دومین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور در سال 1394
مشخصات نویسندگان مقاله:

حسین پورحیدر توچاهی - دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار دانشگاه آزاد اسلامی واحد رشت
فاطمه احمدی آبکناری - استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور رشت
رضا ابراهیمی آتانی - استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشکده ی فنی دانشگاه گیلان

خلاصه مقاله:
میکروبلاگ در مقایسه با اسناد خوش ساختار مانند صفحات وب، مقالات خبری و بلاگها یک نوع کاملا متفاوت از متن است که کوتاه و نویزی بوده و این خصوصیات, جمع آوری اطلاعات زمینهای و آماری را برای شناسایی موضوعات مورد نظر سختتر میکند. این پژوهش جنبههای زیر را برای شناسایی اخبار از میکروبلاگها پوشش میدهد: ابتدا خصوصیات متفاوت مانند محتویات، زمینه و فعالیتهای توییتر، از میکروبلاگ بررسی شده و سپس یک مدل تشخیص موضوع با استفاده از تکنیکهای کاوش داده و الگوریتم تخصیص دریکله پنهان ایجاد شده است. در این پژوهش، مدل-سازی کاوش و استخراج متن های کوتاه و شناسایی موضوعات خبری در میکروبلاگ ها بررسی و نحوه کاربست الگوریتم تخصیص دیریلکه پنهان و تنظیم پارامترهای آن با پیاده سازی مدل معرفی شد و در زبان R نشان داده شده است.

کلمات کلیدی:
استخراج موضوع، تخصیص دیریکله پنهان، متنکاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/458659/