CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش جدید وزن دهی ویژگی مبتنی بر اطلاعات کلاس :TFCRF در حوزه طبقه بندی مستندات

عنوان مقاله: روش جدید وزن دهی ویژگی مبتنی بر اطلاعات کلاس :TFCRF در حوزه طبقه بندی مستندات
شناسه ملی مقاله: ACCSI12_265
منتشر شده در دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1385
مشخصات نویسندگان مقاله:

مینا ملکی - دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپی
احمد عبدالله زاده بارفروش - دانشیار دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری ار

خلاصه مقاله:
وزن دهی ویژگی به عنوان یکی از تکنیک های پیش پردازش در حوزه طبقه بندی مستندات ، نقش بسیار مهمی در دستیابی به شاخص بندی با کیفیت بالا و در نتیجه دستیابی به طبقه بندی کننده خوب مستندات ایفا می کند. در این مقاله یک روش جدید برای وزن دهی ویژگی به نامTFCRF خاص حوزه طبقه بندی مسستندات ارائه می شود که در آن برای وزن دهی ویژگی ها علاوه بر توجه به چگونگی توزیع آنها در مستندات مختلف و مستن د ات کل م جموعه به چگونگی توزیع آنها در طبقات مختلف نیز توجه شده اس ت . نتایج شبیه سازی نشان دهنده بهبود قابل توجهی در کارایی الگوریتم طبقه بندی کنندهSVM با بکارگیری روش وزن دهی ویژگی ارائه شده جدیدTFCRF در مقایسه با سایر رو ش های متداول وزن دهی ویژگی پیاد ه سازی شده نظیر روش های مبتنی ب ر ،TF روش های مبتنی بر،IDF روش های ترکیبی TFIDF و روش های خاص طبقه بندی بر روی مجموعه مستندات inex می باشد.

کلمات کلیدی:
وزن دهی ویژگی، طبقه بندی مستندات، الگوریتم SVM ، انتخاب ویژگی، بازیابی مستندات، متن کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/44651/