بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی با استفاده از فرهنگ لغت موقعیت زیرکلمات
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 196
فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF08_158
تاریخ نمایه سازی: 25 بهمن 1400
چکیده مقاله:
خلاصه
در این مقاله به ارائه روشی جدید برای بازشناسی برون خط زیرکلمات فارسی چاپی، براساس ترکیب ویژگی های موجک، سراسری و محلی، با استفاده از الگوریتم ماشین بردارپشتیبان (SVM) می پردازیم. در روش پیشنهادی، پس از انجام پیش پردازش برروی تصاویر زیرکلمات در ۴ سایز و ۴ فونت، مرحله استخراج ویژگی با استفاده از ترکیب ویژگی های موجک، سراسری و محلی صورت گرفته است. در بخش طبقه بندی یک فرهنگ لغت از موقعیت احتمالی زیرکلمات در کلمات پایگاه داده تشکیل داده سپس و از الگوریتم SVM چند کلاسه با درنظر گرفتن موقعیت زیرکلمه در کلمه ورودی، استفاده می کنیم. پایگاه داده مورد استفاده در این مقاله، شامل تعداد ۵۸۴۲۱ زیرکلمه فارسی در چهار اندازه و چهار فونت مختلف است که میانگین نرخ بازشناسی الگوریتم پیشنهادی ۹۸.۷۵% بدست آمد. نتایج پیاده سازی نشان می دهد که ترکیب ویژگی ها با هم، در کنار استفاده از طبقه بند قدرتمند SVM با درنظر گرفتن فرهنگ لغت موقعیت زیرکلمات، باعث افزایش دقت و قابلیت اطمینان در روش بازشناسی گردیده است.
کلیدواژه ها:
کلمات کلیدی: بازشناسی زیرکلمات فارسی ، استخراج ویژگی ، فرهنگ لغت موقعیت زیرکلمات ، ویژگی های موجک ، ویژگی های سراسری و محلی ، الگوریتم ماشین بردار پشتیبان.
نویسندگان
سارا خسروی
عضو هیات علمی گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه پیام نور، تهران، ایران.