no-img
ام ای پدیا

دانلود سمینار داده های نامتوازن


ام ای پدیا

ادامه مطلب

DOC
دانلود سمینار داده های نامتوازن
doc
اسفند ۲۵, ۱۳۹۵
هر صفحه 94 تومان
تعداد صفحات: 16 صفحه
۱,۵۰۰ تومان
۱,۵۰۰ تومان – خرید

دانلود سمینار داده های نامتوازن


دانلود سمینار داده های نامتوازن

فرمت قابل ویرایش ورد word

  تعداد صفحات: ۱۶ صفحه

 خلاصه ای از فایل

نمونه­ برداری آگاهانه

در نگاه اول به ­نظر می­رسد که عملکرد هر دو روش زیرنمونه­ برداری و بیش­ نمونه­ برداری، یکسان است اما هریک از این دو روش، مشکلاتی را ایجاد می­کند. در زیرنمونه­ برداری، با حذف تعدادی از نمونه ­های رده­ی اکثریت، ممکن است رده ­بند برخی از مفاهیم مهم مربوط به رده­ی اکثریت را از دست بدهد. در بیش­ نمونه­ برداری، به ­دلیل تکرار برخی از نمونه­ های رده­ی اکثریت، مشکل بیش­ برازش اتفاق می­افتد [۵۲] یعنی علی­رغم صحت بالای رده ­بند در مجموعه­ی آموزش، کارایی رده­بند روی داده­های آزمون، مناسب نخواهد بود.

روش نمونه ­برداری آگاهانه، برای غلبه بر این مشکلات ارائه شده است. الگوریتم­های EasyEnsemble و BalanceCascade، نمونه ­هایی از این روش هستند [۵۳, ۵۴]. هدف این دو الگوریتم، غلبه بر مشکل از دست رفتن اطلاعات هنگام استفاده از روش زیرنمونه ­برداری است. الگوریتم EasyEnsemble، چندین مجموعه شامل نمونه­هایی از رده­ی اکثریت را که به­ صورت تصادفی انتخاب شده­ اند، تولید می­کند سپس هریک از این مجموعه­ ها را با رده­ی اقلیت ترکیب کرده و چندین رده­بند تولید می­کند. سرانجام این رده­بندها با هم ترکیب شده و مدل نهایی را تشکیل می­دهند. الگوریتم BalanceCascade نیز مشابه EasyEnsemble است با این تفاوت که پس از تولید هر رده­بند، نمونه ­هایی که توسط آن رده­بند درست تشخیص داده شده­اند، از مجموعه داده­ی آموزش حذف می­شوند. در این بخش به توضیح کامل درباره­ی این الگوریتم­ها می­پردازیم.

روش انتخاب یک­طرفه[۱]، یکی دیگر از روش­های زیرنمونه ­برداری آگاهانه است [۵۵]. این روش، به­ جای حذف تصادفی نمونه­ ها از رده­ی اکثریت، تنها نمونه­ های اضافی یا نویزدار را از رده­ی اکثریت حذف می­کند.

 فهرست

داده ­های نامتوازن

۳-۱٫ مقدمه

۳-۲٫ روش­های یادگیری در داده­های نامتوازن

۳-۲-۱٫ نمونه­ برداری

۳-۲-۱-۱٫ بیش ­نمونه ­برداری تصادفی

۳-۲-۱-۲٫ زیرنمونه ­برداری تصادفی

۳-۲-۱-۳٫ نمونه ­برداری آگاهانه

۳-۲-۱-۳-۱٫ EasyEnsemble

۳-۲-۱-۳-۲٫ ModifiedBagging

۳-۲-۱-۴٫ ترکیب نمونه ­برداری و تولید داده

۳-۲-۲٫ روش­های حساس به هزینه

۳-۳٫ معیارهای ارزیابی رده ­بند در داده ­های نامتوازن

۳-۴٫ معیارهای ارزیابی رده ­بند در داده­ های نامتوازن و چند رده ­ای

۳-۴-۱٫ میانگین­ گیری میکرو

۳-۴-۲٫ میانگین­ گیری ماکرو

 



دیدگاه ها


پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *