CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی کارایی روش‌های ترکیبی در کلاس بندی داده های متنی

عنوان مقاله: بررسی کارایی روش‌های ترکیبی در کلاس بندی داده های متنی
شناسه ملی مقاله: DOROUDIT01_084
منتشر شده در همایش منطقه ای علوم کامپیوتر، مهندسی کامپیوتر و فناوری اطلاعات در سال 1391
مشخصات نویسندگان مقاله:

محمد حسین نجات - دانشجوی کارشناسی ارشد نرم افزار - دانشگاه آزاد اسلامی واحد زنجان
واهه آغازاریان - استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی
علیرضا هدایتی - استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی

خلاصه مقاله:
روزانه با اضافه شدن حجم زیادی از داده‌های متنی دیجیتال نیاز به آنالیز این نوع داده‌ها یکی از مسائلی است که توجه محققان را به خود جلب کرد ده است. متن کاویفرایندی است که با بررسی متون ، به کسب دانش از داده‌های متنی می‌پردازد . یکی از کاربردهای متن کاوی طبقه‌بندی خودکار متن می‌باشد. بدین معنا که به صورت خودکار تأیید می‌شود چگونگی متنی جدید ورودی به چه کلاس تعلق دارد .در این تحقیق کارایی روش‌های ترکیبی شناخته‌شده داده کاوی از قبیل رأی‌گیری، بهینه‌سازی، جمع‌آوری خودکار و ترکیب چند کلاس بندی به صورت ترکیبی را مورد بررسی قرار می‌دهیم سپس روش‌های ترکیبی مختلف را نیز بر روی مجموعه داده استاندارد 21578 Reuters به کمک نرم‌افزار WEKA مورد آزمایش قرار می‌دهیم. برای این کار پارامترهای مختلف کارایی که نسبت نظیر دقت، مقیاس پذیری به هزینه زمانی را مورد بررسی قرار داده‌ایم.

کلمات کلیدی:
متن کاوی، روش‌های ترکیبی کلاس بندی، مقیاس پذیری، دقت کلاس بندی، هزینه زمانی ساخته مدل

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/173509/