CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)

عنوان مقاله: شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)
شناسه ملی مقاله: ICCONF03_036
منتشر شده در سومین کنفرانس ملی نوآوری و تحقیق در مهندسی برق و مهندسی کامپیوتر و مکانیک ایران در سال 1396
مشخصات نویسندگان مقاله:

سینا دامی - استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران
محمد استرابی - دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

خلاصه مقاله:
شناسایی هرزنامه ها یک کار مهم است که طی آن پیامک های هرز شناسایی و پالایش می شوند. تعداد زیادی پیامک هر روز ارسال می شود و برای یک کاربر به خاطر سپردن و ارتباط دادن پیامک های جدید با پیامک هایی که قبلا دریافت شده اند، بسیار دشوار است. در این مقاله، مساله شناسایی هرزنامه های پیامکی مورد بررسی قرار گرفته است و برای این منظور یک روش مبتنی بر انتخاب ویژگی با طبقه بندی ماشین یادگیری شدید (ELM) ارایه شده است. پس از انجام پیش پردازش های متنی کار در دو مرحله انجام شده است. در مرحله اول، ویژگی های بارز و بااهمیت با استفاده از یک روش مدل سازی موضوعی مبتنی بر LDA انتخاب می شوند. سپس، در مرحله دوم، روش طبقه بندی ELM برای دسته بندی پیامک ها به دو دسته، یعنی پیامک هرز و پیامک غیر هرز استفاده می شود. برای تجزیه و تحلیل، پارامترهای عملکرد مانند دقت، بازخوانی و سنجش F نیز ارزیابی می شوند. نتایج تجربی نشان می دهند که روش پیشنهادی در هر دو حالت مجموعه کامل ویژگی و حالت انتخاب ویژگی (LDA) بهتر از روش پایه عمل می کند.

کلمات کلیدی:
طبقه یندی پیامک، شناسایی هرزنامه، مدل سازی موضوعی، LDA، ماشین یادگیری شدید (ELM)

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/741133/