انتخاب خصیصه به روش ترکیبی فیلتری - روکشی در دسته بندی متون
محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1381
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,855
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI08_072
تاریخ نمایه سازی: 18 بهمن 1386
چکیده مقاله:
در دستهبندی متون، بطور معمول از کلمات متن بعنوان خصیصههای آن متن استفاده میشود . در نتیجه روشهای دستهبندی متون با تعداد زیادی خصیصه مواجه می باشند . به منظور کاهش تعداد خصیصهها و انتخاب خصیصههای مرتبط، از روشهای متعددی استفاده شده است . این مقاله روشی جهت بهبود انتخاب خصیصهها در دستهبندی متون پیشنهاد می کند و نیز به ارزیابی مقایسهای روش پیشنهادی با روشهای موجود انتخاب خصیصه می پردازد . تمرکز این مقاله روی حذف حریصانه خصیصههاست و سعی دارد با حفظ دقت دستهبند، تا حد ممکن خصیصهها را کاهش دهد . به طور کلی روشهای انتخاب خصیصه با توجه به وابستگی و یا عدم وابستگیشان به دستهبندها به دو گروه مختلف روشهای فیلتری و روشهای روکشی تقسیم می شوند . در این مقاله، ترکیبی از یک روش فیلتری و یک روش روکشی پیشنهاد شده که ابتدا با استفاده از روش فیلتری Relief-F تعدادی از خصیصهها با هزینه محاسباتی کمی انتخاب میشوند و سپس از خصیصههای انتخاب شده با استفاده از روش روکشی SFS یا SBS به صورت دقیقتری با کمک دستهبند متون، خصیصههای نامرتبط حذف می شوند . روش انتخاب خصیصه پیشنهادی با روشهای انتخاب خصیصه موجود، روی مجموعه دادههای مختلف آزمون و با یکدیگرمقایسه شدهاند . روش پیشنهادی با داشتن هزینه محاسباتی بیشتری نسبت به روشهای فیلتری، کارائی بهتری نسبت به این روشها از خود نشان میدهد . علاوه بر آن، با استفاده از این روش به همراه دستهبند SVM Light روی مجموعه دادههای رویتر، %٩٤ خصیصهها ضمن بهبود دقت دسته بندی، از فضای خصیصههای اولیه حذف شدهاند . ضم ن - اً روش Relief-F بعنوان یک روش حذف خصیصه فیلتری در ناحیه غیر متون، نتایج بسیار خوبی در حذف
خصیصههای متنی از خود نشان می دهد
کلیدواژه ها:
نویسندگان
سعید جلیلی
دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر
مهدی بیطرفان
دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :