CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی موجودیت های نام دار در متون فارسی

عنوان مقاله: شناسایی موجودیت های نام دار در متون فارسی
شناسه ملی مقاله: CSICC15_105
منتشر شده در پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران در سال 1388
مشخصات نویسندگان مقاله:

پونه سادات مرتضوی - آزمایشگاه تحقیقاتی پردازش زبان طبیعی، دانشکده مهندسی برق و کامپیوتر
مهرنوش شمس فرد - آزمایشگاه تحقیقاتی پردازش زبان طبیعی، دانشکده مهندسی برق و کامپیوتر

خلاصه مقاله:
شناسایی موجودیتهای نامدار در پردازش زبان طبیعی به عملیاتی گفته میشود که در طی آن کلیه ی اسامی خاص موجود در متن و متعلق به مقوله های معنایی مختلف،شناسایی و استخراج میگردند.در این مقاله به معرفی سیستمی توسعه یافته به منظورتشخیص اسامی نامدار و دستهبندی آنها در زبان فارسی پرداخته میشود. این سیستم با بکارگیری ساختار واژوی اسامی خاص و نیز الگوهای متنی ممکن برای اسمهای خاص متعلق به یک دسته، سعی در شناسایی موجودیتهای نامدار میکند.علاوه بر آن، با بکارگیری برچسب نحوی و معنایی برای هر کلمه و توجه به سایر رخدادهای آن در متن، عملیات رفع ابهام برای بهبود شناسایی را انجام می دهد.

کلمات کلیدی:
شناسایی موجودیتهای نامدار، پردازش زبان طبیعی، مقوله بندی موجودیتهای نامدار، برچسب معنایی، الگوشناسایی، ریخت شناسی موجودیت های نامدار

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/79038/