CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر مدل های دادهای متفاوت در مواجهه با شناسایی داده های پرت

عنوان مقاله: مروری بر مدل های دادهای متفاوت در مواجهه با شناسایی داده های پرت
شناسه ملی مقاله: ELECONFK04_021
منتشر شده در چهارمین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند و نخستین کنفرانس ملی مهندسی پزشکی در سال 1396
مشخصات نویسندگان مقاله:

مریم صمیمیت - دانشجوی کارشناسی ارشد کامپیوتر، دانشگاه آزاد اسلامی واحد نراق،
مهدی اسماعیلی - عضو هییت علمی دانشگاه آزاد اسلامی واحد کاشان،

خلاصه مقاله:
شناسایی داده های پرت فرآیندی است برای یافتن اشیایی که رفتار آنها بسیار متفاوت تر از انتظار است. چنین اشیایی داده های پرت یا آنومالیها نامیده میشوند. تشخیص داده های پرت علاوه بر شناسایی کلاهبرداریها، در بسیاری از کاربردها نظیر پزشکی، امنیت، آشکارسازی خرابی های صنعتی، پردازش تصویر، نظارت شبکه های حسگر/ویدیویی و آشکارسازی مزاحمت استفاده میشود. داده های پرت از این نظر مورد توجه قرار گرفته اند که شک داریم توسط مکانیزمی مشابه آنچه که مابقی داده ها تولید شدهاند آنها نیز تولید شده باشند. از اینرو در شناسایی داده های پرت این موضوع مهم است که مشخص کنیم چرا داده های پرت تشخیص داده شده با مکانیزم های دیگری تولید شده اند. اغلب برای پاسخ به این پرسش فرضیات متعددی برای مابقی داده ها در نظر گرفته میشود و مهمترین آن مدل داده هایی است که مجموعه ما از آن پیروی میکند. در این مقاله مدلهای متفاوتی برای داده ها بیان میشود و طبیعی است که بر اساس مدل مزبور و همچنین پارامترهای آن، داده های پرت از میان دادهای نرمال تشخیص داده میشوند.

کلمات کلیدی:
خوشه بندی، داده پرت، داده کاوی، دسته بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/768159/