به کوشش بی ریل
دقت یک ماتریس ارزیابی اصلی برای اکثر مشکلات یادگیری ماشین است. این نشان می دهد که مدل شما چقدر در شناسایی روابط و الگوهای بین متغیرها خوب است. این تعداد نقاط دادهای است که بهدرستی پیشبینی شدهاند از تمام نقاط داده و محاسبه دقت دادههای آموزشی و اعتبارسنجی روش خوبی است. اگر دقت هر دو مجموعه به یکدیگر نزدیک باشد، آنگاه مدل تمایل به عملکرد بهتر در دنیای واقعی دارد.
مواردی وجود دارد که دقت مدل شما در دادههای آموزشی زیاد است (افزایش برازش) اما در دادههای آزمایشی کم است یا در دادههای آموزشی کم است اما در دادههای تست بالا است (زیاد برازش)، مدلی که از هر یک از این دو شرایط رنج میبرد، تمایل به عملکرد بد دارد. در دنیای واقعی
Meta Learners به مقابله با موقعیتهای عدم تناسب و اضافه کردن کمک میکند و مدلی با عملکرد بهتر ارائه میکند که نتایج دقیقی را روی دادههای آزمایش ارائه میدهد. فراآموزان بر اصل فرا یادگیری مبتنی هستند.
فرا یادگیری به یک تکنیک یادگیری اشاره دارد که در آن یک الگوریتم از خروجی الگوریتم های دیگر یاد می گیرد. مدلها با استفاده از فرآیند فرایادگیری به نام فراگیرندگان ایجاد میشوند. این مدلها معمولاً پیشبینی سایر مدلهای پایه را ترکیب میکنند تا مدلی با عملکرد بهتر و با دقت بالا هم در مجموعه آموزشی و هم در مجموعه آزمایشی تولید کنند. در یادگیری ماشینی، سادهترین روش برای ایجاد فراگیرنده، استفاده از پشتهبندی است.
Stacking یکی دیگر از اعضای خانواده الگوریتم های یادگیری گروهی است که از خروجی سایر فراگیران گروه یاد می گیرد. چندین مدل رگرسیون یا طبقهبندی را میگیرد و از پیشبینیهای آنها به عنوان ورودی الگوریتم فرا یادگیرنده برای تولید یک پیشبینی نهایی استفاده میکند.
Sklearn بستههای زیادی را ارائه میکند که میتوان از آنها برای انباشتگی استفاده کرد، اما در این مقاله، ما بر روی StackingClassifier تمرکز میکنیم.
from sklearn.ensemble import StackingClassifier
ما می توانیم دو نوع انباشتگی را انجام دهیم.
2. انباشته چند لایه
می توانید ببینید با افزایش تعداد لایه ها، پیچیدگی مدل نیز افزایش می یابد، بنابراین بهتر است از Cross Validation در حین آموزش استفاده کنید. اعتبارسنجی متقاطع یک روش نمونهگیری مجدد است که برای ارزیابی مدلهای یادگیری ماشین بر روی مقدار محدودی داده استفاده میشود.
آیا می دانید با اجرای استراتژی MLOps چند ساعت مهندسی را می توان ذخیره کرد؟ ما انجام می دهیم. امروز بیشتر بیاموزید
بیایید یک مدل یادگیری ماشینی برای طبقه بندی گونه های گل زنبق بسازیم. مجموعه داده مشکل با کتابخانه Scikit Learn از پیش نصب شده است. ما با استفاده از درخت تصمیم یک مدل پایه ایجاد می کنیم و امتیاز را محاسبه می کنیم.
حالا ما یک امتیاز پایه داریم، بیایید ببینیم با ساختن یک متا طبقه بندی کننده چقدر می توانیم آن را بهبود دهیم.
ما قرار است از KNN، Decision Tree، Support Vector Machine و Random Forest به عنوان یادگیرنده پایه و رگرسیون لجستیک به عنوان Meta Learner استفاده کنیم.
همانطور که از هر دو قطعه کد بالا مشاهده می کنید Meta Classifier با یک حاشیه خوب از طبقه بندی کننده درخت تصمیم پایه بهتر است.
کسانی که دانش کمتری از روشهای گروهی دارند ممکن است احساس کنند که چیدمان روی هم شبیه کیسهبندی است. خوب، اینطور است، اما چند تفاوت کلیدی وجود دارد که چیدمان را با کیسهکشی متفاوت میکند.
Bagging از تجمع بوت استرپ برای ترکیب یادگیرندگان همگن سروال برای ساخت یک مدل مجموعه استفاده می کند، زیرا به دلیل تجمع بوت استرپ، تفسیر اینکه کدام ویژگی برای آموزش انتخاب می شود دشوار است و این احتمال وجود دارد که برخی از ویژگی های مفید بخشی از فرآیند آموزش نباشند. . در حالی که، در Stacking، هر یادگیرنده ضعیف در کل نمونه آموزش می بیند، بنابراین از دست دادن ویژگی ها در انباشته کردن تقریباً به هیچ یک نزدیک نمی شود.
روشهای بستهبندی برای دادههایی که بایاس بالایی دارند مناسب نیستند، در حالی که روشهای Stacking را میتوان در آن سناریو استفاده کرد. روشهای کیسهبندی نمیتوانند مدلی را که از کار افتاده است درمان کنند، در حالی که روشهای Stacking به راحتی میتوانند دقت مدل را درمان کرده و افزایش دهند.
1. Stacking ensemble algorithm for improving the biases2. Combining Stacking With Bagging To Improve A Learning Algorithm3. Is Combining Classifiers with Stacking Better than Selecting the Best One?
Meta Learners بسیار قدرتمند هستند. آنها به راحتی می توانند از هر یک از مدل های اصلی یادگیری ماشین شما بهتر عمل کنند اگر به درستی با مجموعه پارامترهای صحیح ساخته شوند.
یادداشت ویراستار: تپش قلب یک نشریه آنلاین و جامعه مبتنی بر مشارکت است که به ارائه منابع آموزشی برتر برای متخصصان علوم داده، یادگیری ماشین و یادگیری عمیق اختصاص دارد. ما متعهد به حمایت و الهام بخشیدن به توسعه دهندگان و مهندسان از تمام جنبه های زندگی هستیم.
Heartbeat که از نظر تحریری مستقل است توسط حمایت مالی و منتشر شده توسط دنباله دار، یک پلت فرم MLOps که به دانشمندان داده و تیم های ML امکان می دهد آزمایش های خود را ردیابی، مقایسه، توضیح و بهینه سازی کنند. ما به مشارکت کنندگان خود پول می دهیم و تبلیغات نمی فروشیم.
اگر مایل به مشارکت هستید، به ما سر بزنید برای مشارکت کنندگان تماس بگیرید. همچنین می توانید برای دریافت خبرنامه های هفتگی ما ثبت نام کنید (هفته نامه یادگیری عمیق و خبرنامه ستاره دنباله دار)، به ما بپیوندید در سستیو Comet را دنبال کنید توییتر و لینکدین برای منابع، رویدادها و بسیاری موارد دیگر که به شما کمک می کند مدل های ML بهتری را سریعتر بسازید.