CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارایه یک الگوریتم کارامد جهت تعیین جنسیت نویسنده درزبان فارسی بااستفاده ازروشهای هوشمند

عنوان مقاله: ارایه یک الگوریتم کارامد جهت تعیین جنسیت نویسنده درزبان فارسی بااستفاده ازروشهای هوشمند
شناسه ملی مقاله: ECIE03_016
منتشر شده در سومین کنفرانس سراسری مهندسی برق، کامپیوتر و فناوری اطلاعات در سال 1396
مشخصات نویسندگان مقاله:

مهرداد کشاورزی
عباس کوچاری
آراش شریفی

خلاصه مقاله:
امروزه گسترش فضای مجازی و متعاقب آن فعالیت بیشتر افراد و رفع اکثر نیازهای روزمره خود از این فضا به حد قابل توجهی گسترش یافته است. این موضوع در حالیست که اکثر کاربران این فضا میتوانند با مخفی نگهداشتن شخصیت حقیقی خود اقدام به فعالیت نمایند. راهکارهای شناسایی جنسیت افراد از روی متنهای منتشر شده در فضای مجازی عمدتا بر اساس معیارهای زبانشناسی است. استفاده از این راهکار علاوه بر تعیین هویت افراد می تواند در بازاریابی برخط نیز بسیار موثر باشد چراکه بر اساس آن میتوان روحیات افراد را بر اساس جنسیت شناخت و تبلیغات هدفمندی در این رابطه انجام داد. در این مقاله با توجه به ساختار و نگارش زبان فارسی که دارای ویژگیهای بسیاری است توانستیم الگوریتم کارآمدی که بر اساس روشهای یادگیری ماشین بنا نهاده شده است را ارایه دهیم. در این الگوریتم با استفاده از الگوریتم ژنتیک ویژگی برتر متون را استخراج نمودیم و با استفاده از دستهبند درختCART آنها را جهت تعیین هویت با استفاده از یک برنامهنویسی ژنتیک مورد بررسی قرار دادیم که نتایج حاکی از صحت شناسایی تا 84 % را در بر دارد

کلمات کلیدی:
تعیین جنسیت نویسنده، الگوریتم ژنتیک، درخت تصمیمگیر، شبکه عصبی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/691177/