CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی با استفاده از فرهنگ لغت موقعیت زیرکلمات

عنوان مقاله: بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی با استفاده از فرهنگ لغت موقعیت زیرکلمات
شناسه ملی مقاله: COMCONF08_158
منتشر شده در هشتمین کنگره ملی تازه های مهندسی برق و کامپیوتر ایران در سال 1400
مشخصات نویسندگان مقاله:

سارا خسروی - عضو هیات علمی گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه پیام نور، تهران، ایران.

خلاصه مقاله:
خلاصه در این مقاله به ارائه روشی جدید برای بازشناسی برون خط زیرکلمات فارسی چاپی، براساس ترکیب ویژگی های موجک، سراسری و محلی، با استفاده از الگوریتم ماشین بردارپشتیبان (SVM) می پردازیم. در روش پیشنهادی، پس از انجام پیش پردازش برروی تصاویر زیرکلمات در ۴ سایز و ۴ فونت، مرحله استخراج ویژگی با استفاده از ترکیب ویژگی های موجک، سراسری و محلی صورت گرفته است. در بخش طبقه بندی یک فرهنگ لغت از موقعیت احتمالی زیرکلمات در کلمات پایگاه داده تشکیل داده سپس و از الگوریتم SVM چند کلاسه با درنظر گرفتن موقعیت زیرکلمه در کلمه ورودی، استفاده می کنیم. پایگاه داده مورد استفاده در این مقاله، شامل تعداد ۵۸۴۲۱ زیرکلمه فارسی در چهار اندازه و چهار فونت مختلف است که میانگین نرخ بازشناسی الگوریتم پیشنهادی ۹۸.۷۵% بدست آمد. نتایج پیاده سازی نشان می دهد که ترکیب ویژگی ها با هم، در کنار استفاده از طبقه بند قدرتمند SVM با درنظر گرفتن فرهنگ لغت موقعیت زیرکلمات، باعث افزایش دقت و قابلیت اطمینان در روش بازشناسی گردیده است.

کلمات کلیدی:
کلمات کلیدی: بازشناسی زیرکلمات فارسی، استخراج ویژگی، فرهنگ لغت موقعیت زیرکلمات، ویژگی های موجک، ویژگی های سراسری و محلی، الگوریتم ماشین بردار پشتیبان.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1398990/