توضیحات
خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka
دیتاست شامل ویژگیهایی از جمله، عددی و نوعی است و از نوع دستهبندی محسوب میشود. تعداد نمونههای موجود 303 نمونه است که شامل 75 ویژگی است که missing value نیز دارد. این دیتاست در سال 1988 جمعآوری شده است. شکل زیر اطلاعات کلی ذکر شده را نمایش میدهد.
طبق مقالات ارائه شده در بحث کلاسبندی که از این دیتاست استفاده کردهاند، فقط از 14 ویژگی مهمتر از 75 ویژگی موجود استفاده کردهاند. ما نیز از همین 14 ویژگی بهره بردهایم.
14 ویژگی مورد نظر شامل موارد زیر است:
شماره ویژگی | نام ویژگی | نوع ویژگی | توضیحات |
1 | age | سن | سن فرد |
2 | sex | جنسیت | جنسیت فرد شامل زن و مرد به صورت عددی باینری |
3 | cp | نوع درد سینه | 4 نوع از دردهای سینه مثل، درد معمولی، بی علامت، آتی پیک، غیر آنژینی |
4 | trestbps | فشارخون | بر حسب میلیمتر جیوه |
5 | chol | میزان کلسترول | میزان کلسترول بر حسب میلیگرم در یکدهم لیتر |
6 | fbs | قند خون | به صورت صفر و یک به شرط کوچکتر یا بزرگتر از 120 میلیگرم در یکدهم لیتر |
7 | restecg | نوار قلب | شامل سه نوع نوار قلب معمولی، غیرعادی، مخاطره در بطن چپ |
8 | thalach | حداکثر ضربان قلب | بیشترین ضربان قلب ثبت شده به صورت عددی |
9 | exang | آنژین صدری ناشی از ورزش | به صورت عددی باینری در صورت داشتن یا نداشتن ویژگی ذکر شده |
10 | oldpeak | تنزل نقاط S, T حاصل از نوار قلب | به صورت عددی و تنزل نقاط ST را نشان میدهد |
11 | slope | شیب نقاط S, T حاصل از نوار قلب | نوع شیب به صورت، شیب صعودی، نزولی و ثابت |
12 | ca | تعداد عروق متورم | یک متغیر عددی |
13 | thal | نوع تالاسمی | شامل سه نوع، معمولی، نقص ثابت و نقض برگشتپذیر |
14 | class | نوع بیماری قلبی | شامل عددهای 0 تا 4 که عدد صفر نشان دهنده نداشتن مشکل قلبی و 1 تا 4 مربوط به انواع دیگر مشکلات قلبی |
نمودار زیر، مربوط به نقاط ST ذکر شده از نوار قلب است.
در این پروژه 5 روش دستهبندی متفاوت را انتخاب کردهایم. هر کدام دارای ویژگیها و معایب خاص خود هستند که باعث میشود برای هر مسئله، بر حسب نیاز، یک روش دستهبندی خاص را استفاده کنیم. همانگونه که ملاحظه شد روش شبکه عصبی یا همان پرسپترون چندلایه بهترین دقت را داشت هر چند این روش از لحاظ زمان یادگیری بیشترین زمان را لازم داشت. این در حالی است که سایر روشها بسیار سریعتر انجام میشوند.
شماره آزمایش | نام روش دستهبندی | دقت دستهبندی (درصد) | زمان آموزش (ثانیه) |
1 | درخت تصمیم | 52 | 0.04 |
2 | بیز ساده | 55 | 0 |
3 | پرسپترون چندلایه | 60 | 0.43 |
4 | ماشین بردار پشتیبان | 57.75 | 0.03 |
5 | نزدیکترین همسایگی | 57.42 | 0 |
نمودار میلهای زیر، دقت روشهای مورد استفاده را در یک قاب نشان میدهد. مشخص است که روش پرسپترون دقت بالاتری دارد و درخت تصمیم پایین ترین دقت. از طرف بیز ساده با سادگی موجود، دقت مناسبی نسبت به سایر روشهایی مثل SVM و KNN دارد.
نمودار میلهای زیر، زمان آموزش روشهای مورد استفاده را در یک قاب نشان میدهد. با اینکه دقت روش پرسپترون مناسب بود، ولی زمان اجرای آن نسبت به سایر روشهای موجود بسیار بالاتر است. روشهای SVM و بیز ساده، زمان اجرایی نزدیک به صفر دارند که در نوع خود جالب توجه است. زیرا در این روشها، عملیات ریاضی بسیار کمتری نسبت به سایر روشها انجام میشود مخصوصا در روش بیز ساده.
خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
سفارش پروژه مشابه
درصورتیکه این پروژه دقیقا مطابق خواسته شما نمی باشد، با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.