توضیحات
عنوان فارسی: استفاده از الگوریتم های K-Means و الگوریتم ژنتیک برای کاهش ابعاد با ادغام SVM برای تشخیص دیابت
عنوان انگلیسی مقاله ترجمه شده:
Application of K-Means and Genetic Algorithms for Dimension Reduction by Integrating SVM for Diabetes Diagnosis
استفاده از الگوریتم های K-Means و ژنتیکی برای کاهش ابعاد با ادغام SVM برای تشخیص دیابت
خلاصه
مقدار قابل توجهی از اطلاعات موجود در صنعت مراقبت های بهداشتی دشوار است، بنابراین معدن برای پیدا کردن الگوی ضروری و ارتباط بین ویژگی های موجود ضروری است. استخراج اطلاعات پزشکی یکی از بخش های اصلی تحقیقاتی است که الگوریتم های تکاملی و الگوریتم های خوشه ای نقش حیاتی دارند. در این تحقیق، K-Means برای حذف داده های پر سر و صدا و الگوریتم های ژنتیکی برای پیدا کردن مجموعه ای بهینه از ویژگی های با پشتیبانی از ماشین بردار[1] (SVM) به عنوان معیار برای طبقه بندی استفاده می شود. نتایج تجربی ثابت می کند که مدل پیشنهادی به دقت متوسط 98.79٪ برای کاهش داده ها از دیابت سرخ پوستان Pima از مخزن UCI دست یافته است. همچنین نشان می دهد که روش پیشنهادی در مقایسه با روش آماده سازی داده ها با استفاده از K-Means با طبقه بندی SVM ((96.71٪، همانطور که در مقاله گفته شده است.
مقدمه
استخراج دانش و الگوهای تشخیص و درمان بیماری از پایگاه داده پزشکی، برای ترویج توسعه پزشکی تله مدیسین و جامعه، بیشتر اهمیت دارد. روش ها و کاربردهای داده های پزشکی عبارتند از: شبکه عصبی مصنوعی، الگوریتم ژنتیک، سیستم فازی، مجموعه خشن[2] و دستگاه بردار پشتیبانی. یک کاربرد مهم معدن پزشکی، الگوریتم ژنتیک است. کاهش ابعاد، نقشه برداری از داده ها به یک فضای بعدی است، به طوری که واریانس غیر اطلاعات در داده ها حذف می شود، به طوری که یک زیرمجموعه که در آن داده ها زندگی می کنند شناسایی می شود. می توان آن را به عنوان مثال انتخاب و یا کاهش و تکنیک های انتخاب ویژگی تقسیم شده است. کاهش نمونه، کاهش موارد بی ربط از مجموعه داده ها برای افزایش دقت طبقه بندی است. انتخاب یک زیر مجموعه از ویژگی های مرتبط که در ساخت مدل استفاده می شود، انتخاب ویژگی است.
الگوریتم های ژنتیکی (GAs) به طور ذاتی موازی هستند. GAs فرزندان چندگانه دارند، آنها می توانند فضای راه حل را در مسیرهای مختلف در یک زمان بررسی کنند. اگر یک مسیر به پایان رسیده است، آن را از بین ببرید و کار را در مسیرهای دیگر ادامه دهید، به آنها فرصتی بیشتر برای هر راه حل یافتن راه حل بهینه بدهید. محدوده وسیعتری برای GA در آینده برای یادگیری ماشین و تکنیکهای بهینه سازی وجود دارد. خوشه بندی K-Means داده ها را به گروه هایی که اشیاء مشابه دارند پارتیشن بندی می کند. نمونه هایی که به هیچ خوشه ای (یا) خوشه ای با نقاط داده کم (یا) اجباری به جا نمی زنند، حذف می شوند. خوشه بندی زمانی که با طبقه بندی با مقدار کلاسیک به میزان قابل توجهی دقت مدل را افزایش می دهد. SVM ها مجموعه ای هستند از روش های یادگیری تحت نظارت مورد استفاده برای طبقه بندی و رگرسیون. این روش ماشین قدرتمند است که از یادگیری آماری توسعه یافته است و در زمینه طبقه بندی تصویر، بیوانفورماتیک، طبقه بندی متن، طبقه بندي دست نوشته و غیره دستاوردهای قابل توجهی را به دست آورد. چندین مطالعه اخیر گزارش شده است که SVM عموما قادر به ارائه عملکرد بالاتر از لحاظ دقت طبقه بندی نسبت به سایر الگوریتم های طبقه بندی داده ها از جمله الگوریتم های آماری، الگوریتم های مبتنی بر تصمیم گیری و روش یادگیری مبتنی بر نمونه است.
این کار تحقیقاتی، K-Means را با استفاده از خوشهبندی مبتنی بر تشخیص خروجی و با استفاده از GA برای انتخاب ویژگی SVM به عنوان طبقه بندی برای طبقه بندی مجموعه داده ها پیشنهاد می دهد. بقیه مقاله به شرح زیر است: بخش 2 بررسی ادبیات را نشان می دهد. پیشنویس های مورد استفاده در بخش 3 آمده است و به شرح زیر در بخش 4 داده می شود. مدل پیشنهادی در بخش 5 توضیح داده شده است. بخش 6 گزارش تجزیه و تحلیل تجربی و بخش نهایی با نتیجه گیری.
مروری بر مطالعات
راوی و همکاران[3] پیشنهاد دادند روش با استفاده از GAs برای پیدا کردن یک زیر مجموعه ویژگی مناسب و طبقه بندی SVM در مجموعه داده های مختلف، برای بهبود دقت طبقه بندی. رادِو و همکاران[4] از یک روش برای انتخاب زیرمجموعه های بهینه مطلوب بر اساس همبستگی با استفاده از الگوریتم GA استفاده می کند، جایی که GA به عنوان ابزار جستجوی بهینه برای انتخاب زیر مجموعه ای از ویژگی ها استفاده می شود. آیشواریا و همکاران[5] یک سیستم پشتیبانی تصمیم گیری پزشکی مبتنی بر GA برای انتخاب زیر مجموعه های ویژگی و SVM برای تشخیص دیابت پیشنهاد داد. شروتی و همکاران[6] از GA برای یافتن مجموعه ای از ویژگی های بهینه بهینه ی روش جستجوی ژنتیکی و طبقه بندی ساده ای برای تشخیص حضور یا عدم بیماری قلبی استفاده می کنند. سومیت[7] و همکاران، یک سیستم حمایت از تصمیم گیری برای طبقه بندی بیماری های قلبی را بر اساس SVM و GA با عدد صحیح برای انتخاب ویژگی های مهم تشخیص بیماری قلبی ارائه دادند. سارا بهنام عزیز[8] روش برای تشخیص بیماری های تیروئید با استفاده از شبکه های عصبی و GA را پیشنهاد کرد. GA برای یافتن ساختار شبکه بهینه با دقت طبقه بندی بالا مورد استفاده قرار گرفت. مهدی و همکاران، یک روش ترکیبی را با استفاده از ارزیابی زیر مجموعه های بسته بندی و جستجوی ژنتیکی به کار بردند. بدست آوردن اطلاعات برای پیدا کردن فضای مطلوب ویژگی استفاده شده است و بهترین روش با هزینه کمتر ثابت شده است. احمد و همکاران[9] GA بهبود یافته برای انتخاب ویژگی و شبکه چندپردایش پیش فرض را برای طبقه بندی مجموعه داده های پزشکی مورد استفاده قرار دادند. آسا و همکاران[10]، استفاده از خوشه بندی و SVM برای کاهش مجموعه داده ها در تشخیص سل است. همَنت و همکارانش[11] با استفاده از خوشه K-Means برای کاهش داده های مجموعه با الگوریتم های مختلف طبقه بندی برای پیش بینی دیابت مشارکت داشتند. یک مدل ترکیبی توسط چین یون فَن و همکاران[12] معرفی شده است، با یکپارچگی یک روش مبتنی بر مورد استفاده از داده ها و یک درخت تصمیم گیری فازی برای طبقه بندی اختلالات کبدی و مجموعه داده های سرطان پستان. نیهَت و همکاران[13] K-Means برای حذف داده های پر سر و صدا و SVM برای طبقه بندی مجموعه داده های کاهش یافته پیشنهاد دادند. یوان و همکارانش 19 یک تابع هدف را که براساس کراس ولید کردن یک خروجی است، مدل سازی کرده و پارامترهای SVM با استفاده از GA و [14]PSO (بهینه سازی تراکم ذرات) بهینه شده اند. پاتیل و همکارانش[15] پیشنهاد کردند که یک ابزار ترکیبی K-Means را دنبال کند که به دنبال آن بیهوشی ساده و SVM طبقه بندی شده است، که در آن SVM درصد دقت بالا را به دست آورد.
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش ترجمه تخصصی مقالات خود بر روی کلید زیر کلیک نمایید.
سفارش ترجمه مقاله
نقد و بررسیها
هنوز بررسیای ثبت نشده است.