دسته بندی افزایشی کلان داده های اخبار وب با مدل سازی و سلسله مراتب موضوع

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 533

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DESCONF01_182

تاریخ نمایه سازی: 5 آبان 1397

چکیده مقاله:

رسانه های آنلاین یکی از کانال های مهم کاربران اینترنت برای دسترسی به اخبار است. وب سایت هایخبری روزانه انبوهی از مقالات خبری را منتشر می کنند. هر روز حجم عظیمی از اخبار آنلاین تولید وبه روزرسانی می شود. پردازش و تحلیل این حجم عظیم داده ها یک چالش مهم است. این چالش باید بااستفاده از تکنیک های کلان داده ها که حجم عظیمی از داده ها را ظرف مدت زمان کوتاهی پردازشمی کنند مرتفع شود. همچنین، از آنجا که ما به سمت انفجار اطلاعات رسانه های اجتماعی می رویم،تکنیک هایی مانند متن کاوی یا تجزیه و تحلیل شبکه های اجتماعی باید جدی گرفته شود.این مقاله برروی یکی از رایج ترین کارهای رورزمره یعنی خواندن اخبار وب، تمرکز می کند. وب سایت هایخبری هزاران مقاله تولید می کنند که بازه وسیعی از موضوعات و دسته بندی ها را شامل می شود. اینمساله می تواند بعنوان یک مساله کلان داده درنظر گرفته شود. برای استخراج اطلاعات مفید، اینمقاله های خبری باید توسط تکنیک های کلان داده ها پردازش شوند. در این زمینه، یک رویکرد برای گروهبندی حجم عظیمی از مقالات خبری مختلف در دسته ها و موضوعات مختلف بر اساس محتوای آنهاارایه دادیم. چون این گروه بندی ها توسط مقالات جدید به روزرسانی می شوند، رویکرد پیشنهادی مامبتنی بر یک مدلسازی موضوعی و با استفاده از یک الگوریتم یادگیری افزایشی و سلسله مراتبی موضوعاست. روش پیشنهادی می تواند مدل توصیف کننده یک دسته را بر اساس تغییرات محتوای مقالاتمتناظر در زمان بلادرنگ به روزرسانی کند. این رویکرد با موفقیت با استفاده از اخبار آنلاین مورد ارزیابیقرار گرفته است.

نویسندگان

سینا دامی

استادیار گروه کامپیوتر، دانشکده فنی و مهندسی، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

لیلا کاشی ها

دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران