یک مدل بیشینه بی نظمی جهت رفع ابهام معنایی کلمات فارسی به کمک ویژگی های مدل سازی موضوع

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,322

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC16_074

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

دراین مقاله مدلی برای رفع ابهام از کلمات مبهم و دارای معانی متعدد فارسی براساس روش دسته بندی بیشینه بی نظمی و استخراج ویژگیهای جدید پیشنهاد شده است برای ایجاد این مدل از دو دسته ویژگی استفاده شده است دسته اول ویژگیها کلمات و نشانه هایی است که همراه کلمه مبهم بکاربرده شده اند و دسته دوم ویژگیها با بکاربردن روشهای مدلسازی موضوع بدست می آید یک مدل موضوعی مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است درمقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله LDA برای این منظور استفاده کرده ایم رفع ابهام از هرکلمه مبهم بعنوان یک مساله دسته بندی جداگانه درنظر گرفته می شود نتایج آزمایشات برایچهارکلمه مبهم پرتکرار در زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علائم استخراج شد دقت حدود 97.67% را نشان میدهد که بیانگر موثربودن این روش در یافتن معنی مناسب کلمات مبهم است.

نویسندگان

بابک مسعودی

گروه هوش مصنوعی،دانشگاه آزاد اسلامی،مشهد

سعید راحتی

گروه برق،دانشگاه آزاد اسلامی،مشهد

اعظم استاجی

گروه زبان شناسی،دانشگاه فردوسی مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A. Ratnaparkhi, "MAXIMUN ENTROPY MODELS FOR NATURAL LANGUA GE AMBIGUITگ ...
  • دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، 17 تا 19 ...
  • D. Yarowsky, "Hierarchical Decision Lists for Word Sense Di sambiguation ...
  • . J. Veenstra, et al., "Memory-B ased Word Sense Di ...
  • R. Florian, et al., "Combining Classifiers for word sense di ...
  • Evaluation of Systems for the Semantic Analysis of Text (Senseval-3), ...
  • conference on Advances in Natural Language Processing, Gothenburg, Sweden, 2008. ...
  • Information Management, 2009. ICDIM 200, Fourth International Conference _ 2009, ...
  • _ M. Blei, et al., 'Latent dirichlet allocation, " .J. ...
  • J. B. Graber, "Linguistic Extensions of Topic Models, " Doctor ...
  • T. Hofmann, "Probabilistic latent semantic indexing, " presented at the ...
  • A. L. Berger, et al., "A maximum entropy approach to ...
  • M. Steyvers and T. Griffits, "Matlab Topic Modeling Toolbox ", ...
  • A. K. McCallum, "MALLET: A Machine Learning for Language Toolkit, ...
  • Tilburg University and CNTS Research G _ p, University of ...
  • _ Dirichlet Allocation _ Maximum Entropy ...
  • نمایش کامل مراجع