ارایه یک روش ترکیبی مبتنی بر تکنیک های فراابتکاری و تخصیص پنهان دیریکله جهت بهبود خوشه بندی اسناد
محل انتشار: دومین کنفرانس ملی کامپیوتر و فناوری اطلاعات
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 457
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEITS02_039
تاریخ نمایه سازی: 30 دی 1397
چکیده مقاله:
امروز حجم عظیم اسناد در ادارات، سازمانها، شرکت های بزرگ و سایر سیستم های زیربط باعث ایجاد یک چالش عظیم در مدیریت این نوع داده ها شده است. تحلیل محتویات داده و گروه بندی آنها در شاخه های مرتبط نیز از جمله چالش های بسیاری از موتورهای جستجوگر، ژورنال ها و غیره است. تا کنون نیز روشهای مختلفی ارایه شده است که علارغم کارایی که دارند؛ اما همچنان با دقت کافی و مطلوبی نتوانسته اند به خوشه بندی اسناد بپردازند. بر این اساس، در این مقاله با بکارگیری تلفیقی از روشهای آماری تخصیص پنهان دیریکله و الگوریتم هوش مصنوعی زنبور عسل اقدام به خوشه بندی اسناد نموده ایم. مراحل روش پیشنهادی در این مقاله عبارتند از: 1) دریافت منبع داده و اعمال پیش پردازش بر روی آن 2) اعمال الگوریتم آماری دیریکله به منظور استخراج موضوعات از متن اسناد 3) اعمال الگوریتم زنبور عسل جهت خوشه بندی اسناد بر اساس موضوع. با شبیه سازی مشاهده گردید که میزان کیفیت فراخوانی و دقت خوشه بندی اسناد با روش پیشنهادی در مقایسه با سایر روش ها مثل الگوریتم های K-Means, GA, IBKCLUST و غیره بهبود داشته است.
کلیدواژه ها: