استخراج کلمات کلیدی بصورت مستقل از زبان

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 762

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC03_102

تاریخ نمایه سازی: 6 اردیبهشت 1396

چکیده مقاله:

بحث اطلاعات، بازیابی و مدیریت آن از منظر اقتصادی، اجتماعی، سیاسی و امنیتی اهمیت بسیار زیادی برای کشورهایمختلف و کمپانی های بزرگ حوزه اطلاعات و فن آوری اطلاعات دارند. اولین گام در این حوزه، شناسایی و استخراج کلمات کلیدی از متون می باشد. یکی از چالش های عمده بر سر راه این امر، وجود زبان های بسیار متنوع برای اطلاعات متنی و وابستگی روش های موجود استخراج کلمات کلیدی به نوع زبان و ساختار کلامی آن زبان خاص می باشد. لذا هدف این پژوهش، طراحی الگوریتمی مستقل از زبان به منظور استخراج کلمات کلیدی می باشد. از این رو با تمرکز روی خاصیت تکرار کلمات کلیدی در هر متن و نسبت تکرار آن در سایر متون و با کمک از الگوریتم TF_IDF این امر انجام شده است و در نهایت میانگین بیشترین تکرار به عنوان کلمه کلیدی انتخاب می گردد. عملکرد الگوریتم پیشنهادی نیز توسط معیار نرخ دقت تشخیص مورد ارزیابی قرار گرفته است. اگرچه کارهای مشابه در این زمینه به صورت مستقل از زبان وجود نداشته ولی مقایسه عملکرد با کارهای نزدیک در حوزه استخراج کلمات کلیدی وابسته به زبان، حکایت از عملکرد قابل قبول الگوریتم پیشنهادی را دارد. لازم به ذکر است که این الگوریتم با الگوریتم مبتنیبر گراف که فقط برای زبان انگلیسی پیاده سازی شده مقایسه گردیده است، که نرخ دقت کلی الگوریتم پیشنهادی83.34 درصد بوده است.

نویسندگان

بهاره هاشم زاده

مربی گروه کامپیوتر و فناوری اطلاعات، دانشگاه تربت حیدریه

علی ماروسی

استادیار گروه کامپیوتر و فناوری اطلاعات، دانشگاه تربت حیدریه

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Abilhoa, W. D., & de Castro, L. N. (2014). A ...
  • Ali, C. B., Wang, R., & Haddad, H. (2015). A ...
  • Balagopalan, A., Ba lasu bramanian, L. L., Ba lasu bramanian, ...
  • Beliga, S., Mestrovic, A., & Martincic-I psic, S. (2015). An ...
  • Bellachia, A., & Al-Dhelaan, M. (2012). Ne-rank: A novel graph-based ...
  • Boudin, F., & Morin, E. (2013). Keyphrase Extraction for N-best ...
  • Cambria, E., & White, _ (2014). Jumping NLP curves: a ...
  • Caragea, C., Bulgarov, F. A., Godea, A., & Gollapalli, . ...
  • Ferrara, E., De Meo, P., Fiumara, G., & Baumgartner, R. ...
  • Gupta, A., Dixit, A., & Sharma, A. (2014). A novel ...
  • Habibi, M., & Popescu-Belis, A. (2015). Keyword extraction and clustering ...
  • Haggag, M. H. (2013). Keyword Extraction using Semantic Analysis. International ...
  • Hashemi, H. B., & Shakery, A. (2014). Mining a Persia ...
  • Jain, V., & Prasad, S. (2014). Ontology based information retrieval ...
  • Jiang, J. (2012). Information extraction from text Mining text data ...
  • Kim, S. N., Medelyan, O., Kan, M.-Y., & Baldwin, T. ...
  • Lee, L. H., Isa, D., Choo, W. O., & Chue, ...
  • Luo, Z., Tang, J., & Wang, T. (2013). Improving keyphrase ...
  • Nabhan, A. R., & Shaalan, K. (2016). Keyword Identification Using ...
  • Onan, A., Korukoglu, S., & Bulut, H. (2016). Ensemble of ...
  • Rousseau, F., & Vazirgiannis, M. (2015). Main core retention on ...
  • Savic, M., Rakic, G., Budimac, Z., & Ivanovic, M. (2014). ...
  • Sheeba, J., & Viveka nandan, K. (2012). Improved Unsupervised Framework ...
  • Shrawankar, U., & Wankhede, K. (2016). Construction of News Headline ...
  • Siddiqi, S., & Sharan, A. (2015). Keyword and keyphrase extraction ...
  • Ghahremani, P., Zhang, X., et al. (2014). A , Trmal, ...
  • Wang, R., Liu, W., & Mcdonald, C. (2014). How preprocessing ...
  • Xie, F., Wu, X., & Zhu, X. (2014). Docu ment-specific ...
  • V. L., & Cramer, N. O. (2012). Rapid automatic , ...
  • نمایش کامل مراجع