مروری بر روش ها و پژوهش های دسته بندی خودکار متون فارسی

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 42

فایل این مقاله در 22 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-4-2_003

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

دسته بندی اسناد متنی یا تشخیص عنوان به فرآیند شناسایی خودکار موضوع یک سند متنی (مانند هنری، ورزشی، سیاسی، `علمی و ...) گفته می شود که در کاربردهای مختلف پردازش زبان طبیعی مانند بازیابی اطلاعات و تحلیل متون مورد استفاده است. یک سامانه دسته بندی کننده خودکار متون، مشابه اغلب سامانه های بازشناسی الگو، از دو گام مهم استخراج ویژگی و دسته بندی تشکیل شده است. در این مقاله، مروری بر روش های رایج برای استخراج ویژگی و دسته بندی در این سامانه ها صورت گرفته و پژوهش هایی که در این حوزه برای زبان فارسی انجام شده است، مرور شده اند. همچنین، تحلیلی از نقاط قوت و ضعف روش های موجود و مقایسه کارهای صورت گرفته با همدیگر ارائه شده است.

کلیدواژه ها:

دسته بندی متون فارسی ، پردازش زبان طبیعی ، مرور روش ها ، استخراج ویژگی و دسته بندی

نویسندگان

هادی ویسی

استادیار دانشکده علوم و فنون نوین، دانشگاه تهران

پویان پارسافرد

کارشناسی ارشد پردیس بین المللی، دانشگاه تهران