استفاده از معیار شباهت و فاصله در بهینه سازی درخت تصمیم

سمیرا اسدزاده; یاسمن علی اکبرپور; الهام پروین نیا

استفاده از معیار شباهت و فاصله در بهینه سازی درخت تصمیم

محل انتشار: اولین کنفرانس ملی آنالیز داده ها

سال انتشار: 1402

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 233

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1669289

شناسه ملی سند علمی:

CDASCI01_024

تاریخ نمایه سازی: 11 خرداد 1402

چکیده مقاله:

الگوریتم درخت تصمیم به دلیل دقت بالا، هزینه محاسباتی کم و قابلیت تفسیر بالا به طور گسترده در داده کاوی و یادگیری ماشین استفاده شده است. با این حال، زمانی که با داده ها یپوسته سروکار داریم، الگوریتم درخت تصمیم کلاسیک باید با استراتژی گسسته سازی، ویژگی های پیوسته را با ویژگی های گسسته جایگزین کند. گسسته سازی ممکن است باعث از بین رفتن ساختار اطلاعات شود که بر عملکرد طبقه بندی تاثیر می گذارد. در این مقاله، یک شباهت همسایگی جدید تعریف شده. که با ترکیب شباهت با منطق هندسی و شباهت با منطق جبری، چهار نوع جدید از شبا هت ها ی همسایگی پیشنهاد شده. و یک الگوریتم درخت تصمیم جدید پیشنهاد شده، که در آن درجه وابستگی ویژگی به عنوان اندازه گیری پارتیشن استفاده شده. نتایج تجربی بر روی ۷ مجموعه داده انتخاب شده از مخزن یادگیری ماشین UCI نشان می دهد که الگوریتم پیشنهاد شده موثر است. میانگین دقت الگوریتم پبشنهادی بیش از ٪۹۰ است که ٪۱۰بیشتر از الگوریتم ها ی درخت تصمیم گیری کلاسیک است و تعداد گره ها ی برگ کمی افزایش می یابد.

کلیدواژه ها:

بهینه سازی ، درخت تصمیم ، شباهت ، همسایگی

نویسندگان

سمیرا اسدزاده

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران

یاسمن علی اکبرپور

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران

الهام پروین نیا

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران