توضیحات
خوشه بندی داده های بیماری قلبی با نرم افزار RapidMiner
دیتاست شامل ویژگیهایی از جمله، عددی و نوعی است و از نوع دستهبندی محسوب میشود. تعداد نمونههای موجود 303 نمونه است که شامل 75 ویژگی است که missing value نیز دارد. این دیتاست در سال 1988 جمعآوری شده است. شکل زیر اطلاعات کلی ذکر شده را نمایش میدهد.
طبق مقالات ارائه شده در بحث کلاسبندی که از این دیتاست استفاده کردهاند، فقط از 14 ویژگی مهمتر از 75 ویژگی موجود استفاده کردهاند. ما نیز از همین 14 ویژگی بهره بردهایم.
14 ویژگی مورد نظر شامل موارد زیر است:
شماره ویژگی | نام ویژگی | نوع ویژگی | توضیحات |
1 | age | سن | سن فرد |
2 | sex | جنسیت | جنسیت فرد شامل زن و مرد به صورت عددی باینری |
3 | cp | نوع درد سینه | 4 نوع از دردهای سینه مثل، درد معمولی، بی علامت، آتی پیک، غیر آنژینی |
4 | trestbps | فشارخون | بر حسب میلیمتر جیوه |
5 | chol | میزان کلسترول | میزان کلسترول بر حسب میلیگرم در یکدهم لیتر |
6 | fbs | قند خون | به صورت صفر و یک به شرط کوچکتر یا بزرگتر از 120 میلیگرم در یکدهم لیتر |
7 | restecg | نوار قلب | شامل سه نوع نوار قلب معمولی، غیرعادی، مخاطره در بطن چپ |
8 | thalach | حداکثر ضربان قلب | بیشترین ضربان قلب ثبت شده به صورت عددی |
9 | exang | آنژین صدری ناشی از ورزش | به صورت عددی باینری در صورت داشتن یا نداشتن ویژگی ذکر شده |
10 | oldpeak | تنزل نقاط S, T حاصل از نوار قلب | به صورت عددی و تنزل نقاط ST را نشان میدهد |
11 | slope | شیب نقاط S, T حاصل از نوار قلب | نوع شیب به صورت، شیب صعودی، نزولی و ثابت |
12 | ca | تعداد عروق متورم | یک متغیر عددی |
13 | thal | نوع تالاسمی | شامل سه نوع، معمولی، نقص ثابت و نقض برگشتپذیر |
14 | class | نوع بیماری قلبی | شامل عددهای 0 تا 4 که عدد صفر نشان دهنده نداشتن مشکل قلبی و 1 تا 4 مربوط به انواع دیگر مشکلات قلبی |
نمودار زیر، مربوط به نقاط ST ذکر شده از نوار قلب است.
در این پروژه 4 روش دستهبندی متفاوت را انتخاب کردهایم. هر کدام دارای ویژگیها و معایب خاص خود هستند که باعث میشود برای هر مسئله، بر حسب نیاز، یک روش دستهبندی خاص را استفاده کنیم. همانگونه که ملاحظه شد روش شبکه عصبی بهترین دقت را داشت هر چند این روش از لحاظ زمان یادگیری بیشترین زمان را لازم داشت. این در حالی است که سایر روشها بسیار سریعتر انجام میشوند.
شماره آزمایش | نام روش دستهبندی | دقت دستهبندی (درصد) |
1 | درخت تصمیم | 46.2 |
2 | بیز ساده | 53.89 |
3 | پرسپترون چندلایه | 55.47 |
4 | ماشین بردار پشتیبان | 54.8 |
ازنکات بسیار جالبتر دقت بهتر روش بیز ساده نسبت به درخت تصمیم و نزدیکی تقریبی آن با روش ماشین بردار پشتیبان است که نشان میدهد که روش بیز ساده در عین سادگی ، چقدر کارایی بالایی دارد
نمودار میلهای زیر، دقت روشهای مورد استفاده را در یک قاب نشان میدهد. مشخص است که روش پرسپترون دقت بالاتری دارد و درخت تصمیم پایین ترین دقت. از طرف بیز ساده با سادگی موجود، دقت مناسبی نسبت به سایر روشهایی مثل SVM و KNN دارد.
خوشه بندی داده های بیماری قلبی با نرم افزار RapidMiner توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
سفارش پروژه مشابه
درصورتیکه این پروژه دقیقا مطابق خواسته شما نمی باشد، با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.