طبقه بندی متون فارسی مبتنی بر شبکه های عصبی عمیق

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 69

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SCJKA-11-1_009

تاریخ نمایه سازی: 26 فروردین 1402

چکیده مقاله:

امروزه با توجه به رشد روزافزون حجم اسناد الکترونیکی، طبقه بندی متون بر اساس روش های مختلفی در میان محققین بازیابی اطلاعات و متون عمومیت یافته است. با توجه به اهمیت موضوع و کارهایی که در این زمینه در زبان های مختلف دنیا انجام گرفته است، نیاز به طبقه بندی متون فارسی به خوبی احساس می شود. به طور کلی روش های طبقه بندی متون را می توان به روش های سنتی (مبتنی بر انتخاب ویژگی و یادگیری ماشین) و روش های مبتنی بر یادگیری عمیق تقسیم بندی کرد. روش های مبتنی بر یادگیری عمیق به دلیل توانایی اشتراک وزن به طور قابل توجهی سبب کاهش تعداد متغیرهای آزاد آموزش پذیر شبکه و در نتیجه افزایش تعمیم پذیری شده است و نتایج بهتری به نسبت سایر روش ها می دهد. در زبان فارسی روش های مبتنی بر یادگیری عمیق بسیار اندکی برای طبقه بندی متون ارائه شده است. در این مقاله دو مدل شبکه عصبی عمیق شامل شبکه عصبی پیچشی ParsCNN و شبکه عصبی با حافظه بلند کوتاه- مدت دوسویه سلسه مراتبی با لایه توجه ParsBiLSTM برای طبقه بندی متون فارسی تشریح شده است. کارایی سیستم های مبتنی بر شبکه عصبی عمیق بر روی مجموعه داده همشهری بررسی شده و از نظر سه معیار ارزیابی دقت، فراخوانی و مقیاس-F مورد مطالعه قرار گرفته است. نتایج آزمایش ها نشان می دهد که روش ParsCNN میزان دقت ۶۹/۰، فراخوانی ۷/۰ و مقیاس-F ۶۹/۰؛ همچنین روش ParsBiLSTM میزان دقت ۷۲/۰، فراخوانی ۷۳/۰ و مقیاس-F ۷۲/۰ دارند که نشان دهنده کارایی بالاتر این روش ها نسبت به روش های طبقه بندی متون فارسی مورد مطالعه است.

نویسندگان

محمدرضا فیضی درخشی

دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

زینب متقی نیا

دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

میثم عسگری چناقلو

دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران