مروری بر روش ها و پژوهش های دسته بندی خودکار متون فارسی

هادی ویسی; پویان پارسافرد

مروری بر روش ها و پژوهش های دسته بندی خودکار متون فارسی

محل انتشار: مجله علوم رایانشی، دوره: 4، شماره: 2

سال انتشار: 1398

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 42

فایل این مقاله در 22 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1901020

شناسه ملی سند علمی:

JR_CSJI-4-2_003

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

دسته بندی اسناد متنی یا تشخیص عنوان به فرآیند شناسایی خودکار موضوع یک سند متنی (مانند هنری، ورزشی، سیاسی، `علمی و ...) گفته می شود که در کاربردهای مختلف پردازش زبان طبیعی مانند بازیابی اطلاعات و تحلیل متون مورد استفاده است. یک سامانه دسته بندی کننده خودکار متون، مشابه اغلب سامانه های بازشناسی الگو، از دو گام مهم استخراج ویژگی و دسته بندی تشکیل شده است. در این مقاله، مروری بر روش های رایج برای استخراج ویژگی و دسته بندی در این سامانه ها صورت گرفته و پژوهش هایی که در این حوزه برای زبان فارسی انجام شده است، مرور شده اند. همچنین، تحلیلی از نقاط قوت و ضعف روش های موجود و مقایسه کارهای صورت گرفته با همدیگر ارائه شده است.

کلیدواژه ها:

دسته بندی متون فارسی ، پردازش زبان طبیعی ، مرور روش ها ، استخراج ویژگی و دسته بندی

نویسندگان

هادی ویسی

استادیار دانشکده علوم و فنون نوین، دانشگاه تهران

پویان پارسافرد

کارشناسی ارشد پردیس بین المللی، دانشگاه تهران