توضیحات
دسته بندی دادگان با نرم افزار وکا weka
مسئله
در این تمرین قصد داریم تا مسئله دسته بندی دادگان را مورد بررسی قرار دهیم. به همین منظور از 7 متد دسته بندی موجود در نرم افزار وکا استفاده میکنیم که به شرح زیر هستند:
- شبکه عصبی
- ماشین بردار پشتیبان
- درخت تصمیم
- درخت تصادفی
- جنگل تصادفی
- بیز ساده
- نزدیک ترین همسایگی
دادگان مورد استفاده از سایت UCI استخراج شده است به گونه ای که تعداد داده ها بیش از 3000 نمونه و نوع داده برای کاربرد دسته بندی مهیا شده باشد.
مراحل پردازشی
این دیتاست مربوط به پیش بینی سن صدف های آبالون از مشخصات فیزیکی آن است. دیتاست مورد نظر دارای 4177 نمونه است که هر نمونه دارای 8 ویژگی است. مقادیر گمشده در آن وجود ندارد و برای کاربرد دسته بندی مورد استفاده قرار میگیرد. این دیتاست دارای 28 کلاس است که در سال 1995 جمع آوری شده است.
آماده سازی داده ها
نرم افزار وکا، داده ها را به فرمت خاصی دریافت میکند. در ابتدا باید نام متغیرها و نوع مقادیر آن را مشخص کنیم. به همین منظور فایل abalone.data.txt که داده های خام در آن هست را به نام دیگری با پسوند arff تبدیل میکنیم. آنگاه با استفاده از فایل abalone.names.txt که مشخصات ویژگی های دیتاست را در اختیار ما قرار میدهد اقدام به ساخت دیتاست abalone.data.arff برای بارگذاری در وکا میکنیم. فرمت وکا برای دادگان ما به صورت زیر خواهد شد.
اولین خط نام دیتاست را مشخص میکند که میتوانیم به صورت دلخواه بدهیم. خطوط بعدی ویژگی ها را مشخص میکند که در جلوی هر ویژگی باید نام ویژگی و نوع مقادیر آن را مشخص کنیم. اولین ویژگی مقادیر گسسته برای جنسیت را دارد. و سایر ویژگی ها به صورت عدد حقیقی هستند. در پایان نیز برچسب دیتاست را مشخص میکنیم که باید برچسب تمامی کلاسها را در آن ذکر کنیم. در دیتاست ذکر شده 28 کلاس داریم. و در پایان و بعد از بخش @DATA داده را میگذاریم.
دسته بندی دادگان با نرم افزار وکا weka توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
سفارش پروژه مشابه
درصورتیکه این پروژه دقیقا مطابق خواسته شما نمی باشد، با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.