تولید خودکار متن فارسی با استفاده مدل های مبتنی بر قاعده و تعبیه واژگان

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 271

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_PADSA-9-4_004

تاریخ نمایه سازی: 17 فروردین 1401

چکیده مقاله:

تولید زبان طبیعی از پردازش زبان طبیعی حاصل میشود. زبان طبیعی از یک سیستم ارائه ماشینی مانند پایگاه دانش تولید میشود. سیستمهای NLG از مدتها پیش وجود داشته اما فناوری آن به صورت ابزار تجاری اخیرا به صورت گسترده به وجود آمده است. در NLG، سیستم نیاز به تصمیمگیری در مورد چگونگی قرار دادن یک مفهوم در کلمات دارد. توانایی ایجاد متن معنی دار نقش کلیدی در بسیاری از کاربردهای پردازش زبان طبیعی مانند ترجمه ماشین، گفتار و تبدیل عکس به متن دارد. هدف این پروژه ارائه روشی برای تولید متن با استفاده از روش های هوش مصنوعی و با ساختار درست و آغازی برای تولید متن فارسی است. به عبارت دیگر در این مقاله روشی ارائه شده که قادر به تولید متن طولانی متنوع علاوه بر حفظ معنا و ساختار در زبان فارسی می­باشد. جهت پیشبرد تولید متن سعی شده از ترکیب روش­های یادگیری ماشین با مدل­های احتمالاتی، استفاده شود. در مدل پیشنهادی از مدل­های احتمالاتی برای استخراج قوانین و از Word۲vec برای برداری­سازی متن استفاده شده و سپس در فاز تولید از ترکیب این دو و فاصله کسینوسی استفاده می­شود. نتایج نشان دهنده ارائه مدلی بوده که متن تولیدی آن دارای ساختار، مفهوم و تنوع مناسب می­باشد. همچنین این مدل از نظر انسانی و پیچیدگی نیز بهینه می باشد.

کلیدواژه ها:

نویسندگان

امید حاجی پور

هوش مصنوعی، کامپیوتر، صنعتی امیرکبیر، تهران، ایران

سعیده سادات سدیدپور

دانشگاه صنعتی مالک اشتر، تهران، ایران