Feature selection based on hybridization of Information gain and graph clustering for text classification
محل انتشار: دهمین کنفرانس فناوری اطلاعات و دانشIKT2019
سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 652
متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIKT10_053
تاریخ نمایه سازی: 5 بهمن 1398
چکیده مقاله:
Text datasets usually have a lot of features. Therefore, theirs classification cost is too much and feature selection in this context is of vital importance. In this paper, a novel feature selection method based on information gain and FAST algorithm is proposed. In the proposed method, at first, the features with higher information gain are selected. Then, the FAST algorithm on the selected features is applied. Experiments are carried out to compare our algorithm with several feature selection techniques. The new approach is tested on three text datasets. The results confirm that the proposed method produces smaller feature subset in shorter time. The evaluation of a K-nearest neighborhood classifier on validation data show that, the novel algorithm gives higher classification accuracy.
نویسندگان
Shadi Rahimi
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Alireza Abdollahpouri
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Fatemeh Zamani
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Parham Moradi
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran