توضیحات
ج- اگر از هريک از سه ويژگی نمونه ها به تنهايی برای تخمین بهترين توابع توزيع نرمال درون کلاسی در مجموعه آموزش و سپس برای Classification -ِ نمونه های آزمون بهره گیريم، خطای حاصل را با خطای قسمت ب مقايسه کردیم.
مساله دو: مبتنی بر روش KNN از روی نمونه های آموزش، Classification -ِ نمونه های آزمون را انجام داده و به ازای K های گوناگون (مقدارهايی برابر 1 ، 3 ، 5 و 7 ) خطای Classification -ِ نمونه های مجموعه آزمون را تعیین و تحلیل کردیم.
مساله سه: به کمک SVM (در MATLAB ) از روی نمونه های آموزش، Classification -ِ نمونه های آزمون را انجام داده و به ازای اندازه پارامترهای گوناگون، خطای Classification -ِ نمونه های مجموعه آزمون را تعیین و تحلیل کردیم.
در این پروژه هدف استفاده از داده های مربوط به دو کلاس مختلف برای آموزش و تست کلاسبندهای مختلف است. کلاسبندها شامل موارد زیر است:
- گوسین با توزیع دوگانه
- K همسایه نزدیک با مقادیر مختلف همسایه ها
- ماشین بردار پشتیبان با توابع هسته مختلف
داده های ورودی هر کلاس به صورت تصادفی به هم ریخته شده و به دو قسمت مساوی تقسیم شده و یک قسمت برای آموزش و دیگری برای تست استفاده میشود.
نمودار scatter کل داده ها و داده های آموزشی نیز رسم میشوند.
مساله اول:
در این بخش با استفاده از متلب بهترین توزیع دوگانه گوسین تطبیق شده به مقادیر داده آموزشی محاسبه شده و سپس از آن برای تست گروه داده دیگری تحت همین نام استفاده میشود. این کار در متلب به صورت ترکیب گوسین با درصدهای مختلف انجام میشود که تحت عنوان GMM است.
در پایان این بخش مقدار خطا و مقدار نمونه هایی که در هر کلاس به اشتباه کلاسبندی شده اند محاسبه میشود.
همچنین پارامترهای توزیع گوسین تخمین زده شده با داده های آموزشی نیز بیان میشوند.
نمودار سه بعدی scatter نمونه ها
نتایج مساله اول:
میزان خطا برابر با 0.0909 بدست می آید.
مشخص است که به دلیل تعداد داده های بیشتر در گروه اول است. همچنین هر داده شامل سه شاخص است که متناظر با توزیع گوسین سه بعدی است که واریانس آن به صورت کواریانس سه در سه در می آید.
تعداد نمونه های میس کلاس شده گروه اول 2 و گروه دوم 185 نمونه است.
- فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.