CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش ویرایش جانه ی هم زمان بیزی برای داده های چند متغیره ی رسته ای ناایمن

عنوان مقاله: روش ویرایش جانه ی هم زمان بیزی برای داده های چند متغیره ی رسته ای ناایمن
شناسه ملی مقاله: ISSSC02_014
منتشر شده در دومین کنفرانس ملی دانشجویی آمار در سال 1398
مشخصات نویسندگان مقاله:

محدثه سوادکوهی - دانشجوی کارشناسی ارشد آمار ریاضی دانشگاه شهید بهشتی تهران
احسان بهرامی سامانی - دانشیار آمار دانشگاه شهید بهشتی تهران

خلاصه مقاله:
یکی از روش های مهم مورد استفاده در علم داده ها، تمیز کردن داده ها است که در مرحله ی پردازش و تحلیل داده ها، جای می گیرد. یکی از مسائلی که پیرامون داده های رسته ای وجود دارد، مسأله ی وجود داده های نادرست و ناامن و ویرایش و جانه ی آن ها است. برای جانه ی این داده ها در این مقاله از مدلی تحت عنوان EI-DPM استفاده شده است. در روش آورده شده، مدل تصادفی زوجی برای اندازه گیری خطا با استفاده از یک فرایند آمیخته ی دیریکله از توزیع چند جمله ای بر روی داده های رسته ای در نظر گرفته می شود. برای تشریح سودمندی روش مطرح شده در این مقاله یک مطالعه ی شبیه سازی صورت گرفته و این مدل با الگوریتم F-H (فلگی و هالت، 1976) مقایسه شده است.

کلمات کلیدی:
روش ویرایش ـ جانه ی، فرآیند دبیریکله، مقادیر نادرست، داده های ناامن، مدل های سلسله مراتبی بیزی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1138035/