CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

نویسه گردانی اسامی افراد با استفاده ازویژگیهای محتوای وب فارسی

عنوان مقاله: نویسه گردانی اسامی افراد با استفاده ازویژگیهای محتوای وب فارسی
شناسه ملی مقاله: CECIT01_284
منتشر شده در کنگره ملی مهندسی برق، کامپیوتر و فناوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

زهره حق اللهی - دانشگاه یزد
علی محمد زارع بیدکی - دانشگاه یزد
مهدی حاجی مرادی - شرکت مهندسی پویش داده نوین

خلاصه مقاله:
یکی ازمسائل اساسی درپردازش زبان طبیعی نویسه گردانی کلمات می باشد این مقوله نقش بسیار مهمی درکارایی ترجمه ماشینی و بازیابی اطلاعات بین زبانی ایفا می کند ازآنجا که 30درصد پرس وجوهای کاربران دارای اسامی افراد می باشد نویسه گردانی درست این اسامی میتواند تاثیربسزایی درنتایج حاصل ازموتورجستجو داشته باشند دراین مقاله الگوریتمی به منظور نویسه گردانی اسامی افراد اززبان فارسی به انگلیسی ارایه شده است این الگوریتم دارای دو مرحله می باشددرمرحله اول با انالیز مجموعه بزرگی ازصفحات وب تمامی کلمات آن استخراج شده و براساس حروف آنها درکلاسهای مناسب طبقه بندی میشوند سپس بادرنظر گرفتن همسایگی بین این کلمات گراف بزرگی تشکیل میگردد درمرحله بعد نیز ازطریق گراف به دست آمده نویسه گردانی انجام میگیرد نتایج نشان داد صفحات وب تاثیربسزایی دربهبود نویسه گردانی داشته اند.

کلمات کلیدی:
نویسه گردانی، ترجمه ماشینی، بازیابی اطلاعات بین زبانی، گراف

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/210876/