بهبود الگوریتم فازی C-Means با الگوریتم ژنتیک برای انتخاب ویژگیها در دسته بندی اسناد متنی
محل انتشار: مجله علوم رایانشی، دوره: 4، شماره: 1
سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 60
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_CSJI-4-1_006
تاریخ نمایه سازی: 14 بهمن 1402
چکیده مقاله:
افزایش روزافزون مستندات الکترونیکی در وب، لزوم دسته بندی آنان در دسته های مختلف را نشان می دهد. با توجه به حجم و دامنه وسیع اسناد متنی که به طور قابل توجهی از طریق محیط های برخط و سایر منابع قابل دسترسی میباشند، در صورت عدم دسته بندی مناسب، عمل بازیابی و پردازش اسناد متنی دسته بندی نشده با مشکلات زیادی مواجه می گردد. این نیاز منجر به ایجاد روش های نوین برای دسته بندی اطلاعات شده است. دسته بندی، تخصیص اسناد متنی یا ویژگی ها به یک یا چندین دسته است، به طوری که اسناد متنی با توجه به موضوعات یا میزان مشابهت ویژگیها میتوانند دسته بندی گردند. در ارائه روش های دستهبندی، استخراج و انتخاب ویژگی های کلیدی اسناد متنی از اهمیت بالایی برخودار میباشد. در این مقاله روشی براساس بهبود الگوریتم فازی C-Means با الگوریتم ژنتیک برای انتخاب ویژگی ها در دستهبندی اسناد متنی ارائه شده است که در روش پیشنهادی انتخاب ویژگی های کلیدی متون از طریق الگوریتم فازی C-Means انجام میشود و این ویژگیها به الگوریتم ژنتیک جهت بهبود در دستهبندی ارسال میگردند. روش پیشنهادی بر روی سه مجموعهدادهی مختلف Reuters۲۱۵۷۸, WEBKB, CADE ۱۲ و بر اساس معیارهای ارزیابی مختلفی مورد آزمایش و ارزیابی قرار گرفته است. مقایسهی نتایج روش پیشنهادی با سایر روش های مطرح در دستهبندی متون نشان میدهد که روش پیشنهادی عملکرد بهینهای را در دستهبندی اسناد متنی دارد.
کلیدواژه ها:
نویسندگان
ندا محمودی جاریحان
مربی، گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
فرهاد سلیمانیان قره چپق
استادیار، گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران