Filter-Based Feature Selection Using Information Theory and Binary Cuckoo Optimisation Algorithm

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 128

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JITM-14-5_011

تاریخ نمایه سازی: 25 بهمن 1400

چکیده مقاله:

Dimensionality reduction is among the data mining process that is used to reduce the noise and complexity of features in various datasets. Feature selection (FS) is one of the most commonly used dimensionalities that reduces the unwanted features from the datasets. FS can be either wrapper or filter. Wrappers select subsets of the feature with better classification performance but are computationally expensive. On the other hand, filters are computationally fast but lack feature interaction among selected subsets of features which in turn affect the classification performance of the chosen subsets of features. This study proposes two concepts of information theory mutual information (MI). As well as entropy (E). Both were used together with binary cuckoo optimization algorithm BCOA (BCOA-MI and BCOA-EI). The target is to improve classification performance (reduce the error rate and computational complexity) on eight datasets with varying degrees of complexity. A support vector machine classifier was used to measure and computes the error rates of each of the datasets for both BCOA-MI and BCOA-E. The analysis of the results showed that BCOA-E selects a fewer number of features and performed better in terms of error rate. In contrast, BCOA-MI is computationally faster but chooses a larger number of features. Comparison with other methods found in the literature shows that the proposed BCOA-MI and BCOA-E performed better in terms of accuracy, the number of selected features, and execution time in most of the datasets.

نویسندگان

Usman

chool of Computer Sciences, University Sains Malaysia ۱۱۸۰۰ Pulau Pinang, Malaysia; Department of Computer Sciences, Federal College of Education (Technical) Gombe, Nigeria

Yusof

Assistant Professor, School of Computer Sciences, University Sains Malaysia ۱۱۸۰۰ Pulau Pinang, Malaysia.

Sabudin

School of Computer Sciences, University Sains Malaysia ۱۱۸۰۰ Pulau Pinang, Malaysia.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Arora, S., & Anand, P. (۲۰۱۹). Binary butterfly optimization approaches ...
  • Battiti, R.: Using mutual information for selecting features in supervised ...
  • De Rezende, L. F. M., Lopes, M. R., Rey-López, J. ...
  • Estévez, P. A., Tesmer, M., Perez, C. A., & Zurada, ...
  • Fahad, L. G., Tahir, S. F., Shahzad, W., Hassan, M., ...
  • Frank, A., & Asuncion, A. (۲۰۱۰). UCI Machine Learning Repository ...
  • Freeman, C., Kulić, D., & Basir, O. (۲۰۱۵). An evaluation ...
  • Gonzalez-Lopez, J., Ventura, S., & Cano, A. (۲۰۲۰). Distributed multi-label ...
  • Goswami, S., Chakraborty, S., Guha, P., Tarafdar, A., & Kedia, ...
  • Guha, R., Ghosh, K. K., Bhowmik, S., & Sarkar, R. ...
  • Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., ...
  • Hancer, E., Xue, B., & Zhang, M. (۲۰۱۸). Differential evolution ...
  • Hancer, E., Xue, B., Zhang, M., Karaboga, D., & Akay, ...
  • Hart, E., Sim, K., Gardiner, B., & Kamimura, K. (۲۰۱۷, ...
  • Hichem, H., Elkamel, M., Rafik, M., Mesaaoud, M. T., & ...
  • Huda, R. K., & Banka, H. (۲۰۲۰). A group evaluation ...
  • Jain, R., Sawhney, R., & Mathur, P. (۲۰۱۸, March). Feature ...
  • Lall, S., Sinha, D., Ghosh, A., Sengupta, D., & Bandyopadhyay, ...
  • Li, J., Cheng, K., Wang, S., Morstatter, F., Trevino, R. ...
  • Lim, H., & Kim, D. W. (۲۰۲۰). MFC: Initialization method ...
  • Liu, W., & Wang, J. (۲۰۱۹, May). A brief survey ...
  • Ma, J., & Gao, X. (۲۰۲۰). A filter-based feature construction ...
  • Mafarja, M. M., & Mirjalili, S. (۲۰۱۷). Hybrid whale optimization ...
  • Mahmoudi, S., Rajabioun, R., & Lotfi, S. (۲۰۱۳). Binary cuckoo ...
  • Mlakar, U., Fister, I., & Brest, J. (۲۰۱۷, June). Hybrid ...
  • Moghadasian, M., & Hosseini, S. P. (۲۰۱۴). Binary cuckoo optimization ...
  • Moslehi, F., & Haeri, A. (۲۰۲۰). A novel hybrid wrapper–filter ...
  • Muharram, M., & Smith, G. D. (۲۰۰۵). Evolutionary constructive induction. ...
  • Nogueira, S., Sechidis, K., & Brown, G. (۲۰۱۷). On the ...
  • Otero, F. E., Silva, M. M., Freitas, A. A., & ...
  • Peng, H., Long, F., & Ding, C. (۲۰۰۵). Feature selection ...
  • Rahman, M. A., Khanam, F., Ahmad, M., & Uddin, M. ...
  • Rajabioun, R. (۲۰۱۱). Cuckoo optimization algorithm. Applied soft computing, ۱۱(۸), ...
  • Russell, S., & Norvig, P. (۲۰۰۲). Artificial intelligence: a modern ...
  • Samy, A., Hosny, K. M., & Zaied, A. N. H. ...
  • Shi, E., Sun, L., Xu, J., & Zhang, S. (۲۰۲۰). ...
  • Sun, L., Yin, T., Ding, W., Qian, Y., & Xu, ...
  • Tahir, M., Tubaishat, A., Al-Obeidat, F., Shah, B., Halim, Z., ...
  • Tavana, M., Shahdi-Pashaki, S., Teymourian, E., Santos-Arteaga, F. J., & ...
  • Tran, B., Xue, B., & Zhang, M. (۲۰۱۶). Genetic programming ...
  • Tran, B., Zhang, M., & Xue, B. (۲۰۱۶, December). Multiple ...
  • Tsanas, A., Little, M. A., & McSharry, P. E. (۲۰۱۰). ...
  • Usman, A. M., Abdullah, A. U., Adamu, A., & Ahmed, ...
  • Usman, A. M., Yusof, U. K., & Naim, S. (۲۰۱۸). ...
  • Usman, A. M., Yusof, U. K., & Naim, S. (۲۰۲۰). ...
  • Usman, A. M., Yusof, U. K., Naim, S., Musa, N., ...
  • Xue, B., Zhang, M., Browne, W. N., & Yao, X. ...
  • نمایش کامل مراجع