توضیحات
عنوان: الگوریتم های فازی c میانگین برای داده های بسیار بزرگ
- خلاصه
- مقدمه
- الگوریتم های c میانگین فازی
- C میانگین فازی تک ورودی
- c میانگین فازی آنلاین (oFCM)
- c میانگین فازی کاهش دهنده بیت (brFCM)
- c میانگین فازی کرنل تقریبی (akFCM)
- الگوریتم های c میانگین فازی کرنل جدید برای داده های بسیار بزرگ
- C میانگین فازی کرنل بسط یافته و با نمونه های تصادفی (rsekFCM)
- c میانگین فازی کرنل تک ورودی (spkFCM)
- FCM کرنل آنلاین
- اجرا بر روی داده تصویر بزرگ
- عملکرد بر روی داده های غیرقابل بارگذاری
- بحث و نتیجه گیری
خلاصه
داده های بسیار بزرگ (VL) یا داده های بزرگ به هرگونه داده ای گفته می شود که شما نمی توانید آن را در درون حافظه خواندنی یا کاری رایانه بارگذاری نمایید. این یک تعریف هدف محسوب نمی شود، بلکه تعریفی است برای درک عملی آن چراکه مجموعه داده ها بیش از بزرگ هستند و هر کامپیوتری نمی تواند از آن داده های استفاده کند و از این نظر به این داده ها VL می گویند. خوشه بندی یکی از مهمترین وظایف اولیه در شناخت الگوها و داده کاوی های پایگاه داده های VL (شامل تصاویر VL) در بسیاری کاربری های مختلف می باشد و بنابراین الگوریتم های خوشه بندی که دارای معیارهای خوبی باشند برای داده های VL بسیار مهم و کاربردی خواهند بود. این مقاله به مقایسه اثر سه روش پیاده سازی متفاوت برای رسیدن به روش خوشه بندی برای داده های بزرگ بوسیله الگوریتم c میانگین فازی (FCM) توسعه یافته می پردازد. به طور خاص، ما به مقایسه روش هایی می پردازیم که بر اساس 1. نمونه گیری بوسیله بسط غیرتکراری، 2. روش های گام به گامی که موجب گذر پی در پی از طریق زیرمجموعه ای از داده ها شود و 3. ورژن های کرنلی شده FCM که تامین کننده تقریب هایی بر اساس نمونه گیری شامل سه الگوریتم پیشنهادی باشد. ما از هر دوی مجموعه داده های قابل بارگذاری و VL یا بسیار بزرگ برای انجام آزمایش های عددی که موجب تسهیل مقایسه ها بر اساس پیچیدگی های زمانی و مکانی، سرعت و کیفیت تقریب برای دسته بندی کردن FCM (برای داده های قابل بارگذاری) و ارزیابی انطباق بین بخش ها و صحت زمینه می شود، استفاده می نماییم. نتایج تجربی نشان می دهد که نمونه گیری تصادفی بعلاوه FCM گسترش یافته، FCM با بیت کاهش یافته، و FCM کرنل تقریبی انتخاب های خوبی برای FCM تقریبی برای داده های VL می باشد. ما بوسیله نمایش الگوریتم های VL بر روی مجموعه داده ای با 5 میلیارد شی و ارائه مجموعه ای از پیشنهادات برای استفاده از طرح های خوشه بندی FCM متفاوت، نتیجه گیری نهایی را انجام می دهیم.
مقدمه
خوشه بندی روشی است که داده ها به گروه های جداگانه ای با شباهت های ساختاری یکسان تقسیم می شود تا بتوان آنها را پردازش کرده و به نوعی آنها را مدیریت کرد. قطعا در جهان داده های بسیار سنگینی وجود دارد که باید به نوعی آنها را مدیریت کرد و راهکاری برای آنها پیدا کرد. مثلا فیس بوک به تنهایی 25 ترابایت داده را در روز تبادل می کند و باید به نوعی از روش های خوشه بندی برای مدیریت این حجم داده استفاده نمود. هوبر در سال 1996 جدولی را تهیه کرده که در آن به طبقه بندی حجم مجموعه داده ها از لحاظ بزرگی پرداخته است. که در آن داده های با حجم بیش از 1012 به عنوان داده های بسیار بزرگ یا VL شناخته می شود که قطعا در رایانه ها غیرقابل بارگذاری هستند و برای مدیریت آنها باید کارهای اساسی صورت پذیرد.
در رویکرد اصلی برای خوشه بندی داده های VL وجود دارد که شامل: خوشه بندی توزیعی که بر اساس شیوه های افزایشی (تدریجی) متنوع باشد و دیگری خوشه بندی یک نمونه یافت شده بوسیله نمونه گیری تصادفی یا پیشرونده که هر دوی این رویکردها خوشه بندی FCM داده های VL به کار می رود چرا که می تواند این دو رویکرد راههای مفیدی برای سرعت بخشیدن به انجام داده های قابل بارگذاری و تقریب داده های غیرقابل بارگذاری کند. سه نوع اصلی پارتیشن یا قسمت بندی وجود دارد که شامل قطعی، فازی و احتمالاتی می باشد. قسمت بندی فازی دارای انعطاف بیشتری در مقایسه با قطعی می باشد چرا که هر شی می تواند در بیش از یک خوشه عضویت داشته باشد. مجموعه تمامی قسمت بندی های c فازی به شرح زیر است:
هر ستون قسمت بندی فازی باید برابر 1 شود، بنابراین هر شی دارای عضویت مجموع واحد در پارتیشن می باشد . الگوریتم geFFCM یا FCM با قابلیت گسترش سریع عمومی شده روشی شناخته شده برای خوشه بندی فازی داده های VL می باشد. این الگوریتم از نمونه گیری های پیشرونده بر مبنای آماری برای تولید مجموعه داده های کاهش یافته ای که به اندازه ای بزرگ هستند تا تمام ماهیت داده ها را حفظ کنند، تشکیل شده است. البته متد نمونه گیری استفاده شده در geFCM در برخی موارد غیرموثر و غیرکارامد بوده و برای داده های VL نمی تواند به اندازه کافی کاهش را انجام دهد. بنابراین، ما geFCM را به الگوریتم FCM نمونه گیری تصادفی ساده بعلاوه بسط (rseFCM) تبدیل می کنیم. دیگر الگوریتم های اصلی شامل FCM تک ورودی spFCM و FCM آنلاین oFCM ، FCM کاهش دهنده بیت brFCM و FCM کرنل تقریبی (akFCM) می باشد. ما در اینجا به به مقایسه چهار الگوریتم اساسی برای پارتیشن کردن فازی داده های وکتور VL می پردازیم: rseFCM، spFCM، oFCM و brFCM. سپس به مقایسه چهار الگوریتم FCM کرنل (kFCM) برای محاسبه پارتیشن بندی فازی داده های VL می پردازیم: rsekFCM، akFCM، spkFCM و okFCM.
توجه:
- برای دانلود فایل پاورپوینت لطفا اقدام به خرید فرمایید.
- پس از خرید بلافاصله لینک دانلود فایل برای شما ایمیل خواهد شد.
سفارش پاورپوینت دلخواه
به منظور سفارش پاورپوینت با جزئیات دلخواه خود بر روی کلید زیر کلیک نمایید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.