CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر روش ها و پژوهش های دسته بندی خودکار متون فارسی

عنوان مقاله: مروری بر روش ها و پژوهش های دسته بندی خودکار متون فارسی
شناسه ملی مقاله: JR_CSJI-4-2_003
منتشر شده در در سال 1398
مشخصات نویسندگان مقاله:

هادی ویسی - استادیار دانشکده علوم و فنون نوین، دانشگاه تهران
پویان پارسافرد - کارشناسی ارشد پردیس بین المللی، دانشگاه تهران

خلاصه مقاله:
دسته بندی اسناد متنی یا تشخیص عنوان به فرآیند شناسایی خودکار موضوع یک سند متنی (مانند هنری، ورزشی، سیاسی، `علمی و ...) گفته می شود که در کاربردهای مختلف پردازش زبان طبیعی مانند بازیابی اطلاعات و تحلیل متون مورد استفاده است. یک سامانه دسته بندی کننده خودکار متون، مشابه اغلب سامانه های بازشناسی الگو، از دو گام مهم استخراج ویژگی و دسته بندی تشکیل شده است. در این مقاله، مروری بر روش های رایج برای استخراج ویژگی و دسته بندی در این سامانه ها صورت گرفته و پژوهش هایی که در این حوزه برای زبان فارسی انجام شده است، مرور شده اند. همچنین، تحلیلی از نقاط قوت و ضعف روش های موجود و مقایسه کارهای صورت گرفته با همدیگر ارائه شده است.

کلمات کلیدی:
دسته بندی متون فارسی, پردازش زبان طبیعی, مرور روش ها, استخراج ویژگی و دسته بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1901020/