خوشهبندی اسناد با استفاده از پیوستگی مبتنی بر دانش

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 379

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IKMC07_487

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

خوشهبندی، تکنیک دادهکاوی قدرتمند در کشف موضوع از اسناد متنی است. در این زمینه الگوریتمهای خانوادهk-means به دلیل سادگی و سرعت بالا در خوشهبندی دادههای حجیم کاربرد فراوانی دارند. در این الگوریتمهامعیار شباهتcosineتنها شباهت میان زوج اسناد را اندازهگیری میکند که درمواقعی که خوشهها به خوبی تفکیک نشده باشند عملکرد مناسبی ندارد. درمقابل، مفاهیم همسایگی و پیوستگی با در نظرگرفتن اطلاعات سراسری در محاسبه میزان نزدیکی دو سند و اعمال آن در انتخاب مراکز خوشههای اولیه و در محاسبه میزان مشابهت میان اسناد، عملکرد بسیار بهتری دارند. چنانچه میزان شباهت دو سند از حد آستانهای بیشتر باشد آن دو سند همسایهاند و تعداد همسایههای مشترک میانشان، میزان پیوستگی آنها را نشان میدهد. در این مدل روابط معنایی میان کلمات نادیده گرفته شده و تنها اسنادی با واژگان مشابه به یکدیگر مرتبط میشوند. در این مقاله از آنتولوژی وردنت جهت ایجاد مدل جدید مبتنی بر دانش در نمایش اسناد بهره بردیم که در آن از روابط معنایی میان کلمات، جهت وزنگذاری مجدد فرکانس آنها در مدل فضای برداری اسناد استفاده نمودیم و سپس مفاهیم همسایگی و پیوستگی را بر روی مدل حاصل اعمال کردیم. نتایج حاصل از اعمال روش پیشنهادی بر روی مجموعه دادههای واقعی، حاکی از عملکرد مناسبتر آن نسبت به روشهای پیشین میباشد.

نویسندگان

ملیحه دانش

مربی گروه مهندسی کامپیوتر، دانشگاه علم و فناوری مازندران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Retrieval, second ed". Buttersworth, London. Informationه Van Rijsbergen, C. J. ...
  • Guha, S., Rastogi, R., Shim, K. (2000). "ROCK: a robust ...
  • Jain, A. K., Dubes, R. C. (1988). "Algorithms for Clustering ...
  • Kolodner J. (1993). :Case-based reasoning". Morgan Kaufmann, Menlo Park. ...
  • Li, Y. Luo, C., Chung, S. M. (2008). "Text clustering ...
  • Luo C., Li Y., Chung S.M. (2009). "Text document clustering ...
  • Miller, G. (1995).، WordNet: A lexical database for English". Commun ...
  • Zhao G. (1996). "Analogical translator: exp erience-guided transfer in machine ...
  • نمایش کامل مراجع