توضیحات
پروژه خوشه بندی سخت افزار کامپیوتر توسط الگوریتم K-means و DBSCAN با نرمافزار وکا
فهرست
- اجرا و بارگزاری دادگان در نرمافزار 2
- انتخاب دادگان.. 2
- آمادهسازی دادگان.. 4
- ارگذاری دادگان در نرمافزار وکا 6
- اجرای الگوریتمهای خوشه بندی.. 8
- الگوریتم اول : Kmeans. 9
- پیادهسازی و اجرا در وکا 10
- نتایج 11
- نتیجه گیری.. 14
- الگوریتم دوم : DBSCAN… 15
- پیادهسازی و اجرا در وکا 16
- نتایج 16
- نتیجه گیری.. 19
- الگوریتم اول : Kmeans. 9
- نتیجهگیری کلی.. 20
1. اجرا و بارگزاری دادگان در نرمافزار
دادگان مورد نظر در فایل machine (1).data قرار دارند. توضیحات مربوط به هر متغیر نیز در machine.names گذاشته شده است. با استفاده از فایل دوم میتوانیم فایل اول را که در فرمت .data هست را به فرمت وکا تبدیل کنیم و به نرم افزار وکا بدهیم.
این دیتاست شامل ویژگیهایی از جمله، عددی و رشته ای است. تعداد نمونههای موجود 209 نمونه است که شامل 10 ویژگی است که missing value ندارند.
این دیتاست دارای 8 ویژگی اصلی است و یک ویژگی هدف (برچسب ویژگی ها) و همچنین یک ویژگی مربوط به تخمین مقدار رگرسیون خطی. مقادیر آماری این 8 ویژگی اصلی به شرح زیر است
Summary Statistics:
Min Max Mean SD PRP Correlation
MCYT: 17 1500 203.8 260.3 -0.3071
MMIN: 64 32000 2868.0 3878.7 0.7949
MMAX: 64 64000 11796.1 11726.6 0.8630
CACH: 0 256 25.2 40.6 0.6626
CHMIN: 0 52 4.7 6.8 0.6089
CHMAX: 0 176 18.2 26.0 0.6052
PRP: 6 1150 105.6 160.8 1.0000
ERP: 15 1238 99.3 154.8 0.9665
در شکل زیر اطلاعات کامل تری از این دیتاست مشاهده میشود که این دیتاست هم در سایت UCI وجود دارد و هم در پوشه Data در محل نصب نرم افزار وکا.
قسمتی از دیتاست به صورت زیر است.
Data Set Characteristics: |
Multivariate |
Number of Instances: |
209 |
Area: |
Computer |
Attribute Characteristics: |
Integer |
Number of Attributes: |
9 |
Date Donated |
1987-10-01 |
Associated Tasks: |
Regression |
Missing Values? |
No |
Number of Web Hits: |
308206 |
adviser,32/60,125,256,6000,256,16,128,198,199
amdahl,470v/7,29,8000,32000,32,8,32,269,253
amdahl,470v/7a,29,8000,32000,32,8,32,220,253
amdahl,470v/7b,29,8000,32000,32,8,32,172,253
amdahl,470v/7c,29,8000,16000,32,8,16,132,132
amdahl,470v/b,26,8000,32000,64,8,32,318,290
amdahl,580-5840,23,16000,32000,64,16,32,367,381
amdahl,580-5850,23,16000,32000,64,16,32,489,381
amdahl,580-5860,23,16000,64000,64,16,32,636,749
amdahl,580-5880,23,32000,64000,128,32,64,1144,1238
apollo,dn320,400,1000,3000,0,1,2,38,23
apollo,dn420,400,512,3500,4,1,6,40,24
برای آمادهسازی دادگان جهت بارگذاری در نرمافزار وکا، ابتدا فایل دانلود را در نرمافزار notepad++ باز کردیم تا دیتاست موجود را به فرم مناسب و به فرمت arff درآوریم؛ اما فرمت arff به چه صورت است؟
نمونهای از فایل arff را در پوشه data نرم افزار وکا هست را در زیر مشاهده میکنید (breast-cancer.arff). نیاز است که دیتای خود را به این فرمت تبدیل کنیم.
توضیح الگوریتم
در این الگورتیم در ابتدا تعدادی نقطه به صورت تصادفی به عنوان مرکز خوشه انتخاب میشوند که این تعداد برابر با تعداد خوشه هایی است که ما در نظر میگیریم. مثلا در شکل زیر سه نقطه به صورت تصادفی به عنوان مراکز خوشه انتخاب شده است.
نکات قابل ذکر:
- پروژه خوشه بندی سخت افزار کامپیوتر توسط الگوریتم K-means و DBSCAN با نرمافزار وکا توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.
- فایل های پروژه به صورت کامل به همراه فایل راهنما بلافاصله پس از خرید فایل در اختیار شما قرار خواهد گرفت.
سفارش پروژه مشابه
درصورتیکه این پروژه دقیقا مطابق خواسته شما نمی باشد، با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.