CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا

عنوان مقاله: حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا
شناسه ملی مقاله: ICIORS10_274
منتشر شده در دهمین کنفرانس بین المللی انجمن تحقیق در عملیات ایران در سال 1396
مشخصات نویسندگان مقاله:

محمد کاظمی - گروه آمار دانشگاه صنعتی شاهرود
داود شاهسونی - گروه آمار دانشگاه صنعتی شاهرود
محمد آرشی - گروه آمار دانشگاه صنعتی شاهرود

خلاصه مقاله:
پیش بینی متغیر پاسخ به کمک چندین متغیر توضیحی همواره مورد توجه محققین است. هدف ساختن مدلی است که متغیر پاسخ را به متغیرهای توضیحی مرتبط کند. وقتی تعداد متغیرهای توضیحی مدل زیاد باشد، تفسیر مدل مشکل تر و هزینه محاسبات افزایش می یابد. لذا، شناسایی متغیرهای توضیحی موثر بر پاسخ بسیار مهم است. در داده های با بعد بالا مانند داده های پزشکی و ژنتیکی که تعداد متغیرهای مهم زیاد است، انتخاب این متغیرها معمولا با استفاده از یک روش بهینه سازی درجه دوم مانند مینیمم کردن مجموع مربعات خطا تحت یک شرط محدودکننده انجام می شود. با استفاده از روش لاگرانژ، میتوان این مسیله را به صورت یک تابع هدف جریمه شده در نظر گرفت. حل این مسیله مینمم سازی مستلزم استفاده از روش های بهینه سازی است. در این مقاله، فرض می کنیم رابطه بین متغیرهای توضیحی و متغیر پاسخ به صورت جمعی ناپارامتری است و برای انتخاب متغیرهای مهم، توابع جریمه مختلف را در نظر می گیریم. حل این مسیله بهینه سازی به وسیله الگوریتم مختصات نزولی گروهی انجام می شود. در پایان، عملکرد این الگوریتم را تحت انواع توابع جریمه، برای متغیرهای گروهی، با یک مثال شبیه سازی بررسی می کنیم.

کلمات کلیدی:
الگوریتم مختصات نزولی، انتخاب متغیرهای مهم، بهینه سازی، داده های با بعد بالا

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/767008/