توضیحات
عنوان فارسی: ارزیابی مسائل مربوط به طبقه بندی کننده داده های چند برچسبی
- چکیده
- فصل یک: مقدمه
- مقدمه
- تاریخچه موضوع
- اهمیت موضوع به لحاظ کاربردی
- مفاهیم پایه ای
- فصل دو: مرور پیشینه
- مرور پیشینه
- مسائل کلی مربوط به طبقهبندی برچسبی
- مسائل طبقهبندی تک برچسبی و چندبرچسبی
- کاربردهایی از طبقه بندی برچسبی در جهان واقعی
- انواع تکنیک یادگیری ماشین
- یادگیری طبقهبندی چندبرچسبی
- ماشین یادگیری شدید ELM
- بررسی برخی از روشهای موجودِ طبقهبندی دادههای چندبرچسبی
- ارزیابی برخی از کارهای مرتبط با تحقیق
- نتیجه گیری تحقیق
- کارهای آتی
- منابع
چکیده
با افزایش حجم دادهها نیاز به طبقهبندی و تحلیل دادهها به صورت خودکار از جایگاه ویژهای برخودار شده است. در این تحقیق به بررسی، مطالعه کارهای انجام شده در راستای طبقهبندی چندبرچسبی و ارزیابی یک طبقهبندی کننده چندبرچسبی آنلاین جدید مبتنی بر ماشین یادگیری شدید، برای جویبار دادههای بلادرنگ خواهد پرداخت. طبقهبندی چندبرچسبی، یکی از زمینههای فعال تحقیقاتی در یادگیری ماشین است که در سالهای اخیر به علت رشد سریع ابزارهای دنیا، توجه خاصی به خود جلب کرده است. برخلاف طبقهبندی کنندههای باینری و چندکلاسی مرسوم، در طبقهبندی کننده چند برچسبی هر یک از نمونههای ورودی بطور همزمان با مجموعهای از برچسبهای هدف ارتباط دارند. هیچگونه شبکه عصبی آنلاین بلادرنگ مبتنی بر طبقهبندی کننده چندبرچسبی در مقالات چاپی وجود ندارد. به دلیل کاربردی بودن طبقهبندی دادههای چندبرچسبیدر این تحقیق یک مطالعه کلی بر روی روشها و کاربردهای آن در حیطه، جویباردادهای آنلاین خواهیم داشت.
کلید واژه: طبقه بندی، چندبرچسبی، آنلاین، ماشین یادگیری شدید (ELM)، سرعت بالا.
فصل یک:
مقدمه
1- مقدمه:
1-1- تاریخچه موضوع [1]:
در دستهبندی تکبرچسبی هر نمونه با یک برچسب در ارتباط میباشد که این برچسب ویژگیهای آن نمونه را مشخص میکند. در دستهبندی چندبرچسبیهر نمونه ممکن است با چندین برچسب در ارتباط باشد و اجتماع این برچسبها ویژگیهای نمونهها را مشخص میکنند به عبارت دیگر در دستهبندی چندبرچسبی هر نمونه توسط نمونهبرداری از برچسبها مشخص میشود. در بسیاری از کاربردهای واقعی نیز دادهها، چندبرچسبی میباشند. به عنوان مثال یک فیلم سینمایی ممکن است مربوط به چندین ژانر مختلف باشد و یا یک خبر مربوط به چندین حوزه مختلف باشد. معمولا برای حل این مسائل از راهکارهای تکبرچسبی استفاده میشود که اغلب، این راهکارها باعث افزایش هزینههای نگهداری و بازیابی میشود و دارای پیچیدگی زمانی زیادی نیز هستند. با افزایش تعداد برچسبها یادگیری دادههای چندبرچسبی دچار چالش میشود زیرا با افزایش، تعداد حالتهای ممکن برای مجموعه برچسبهای متفاوت به صورت نمایی افزایش مییابد و نمیتوان از الگوریتمهای موجود در دادههای تکبرچسبی برای حل این مسائل استفاده کرد زیرا استفاده از دستهبندهای دادههای تکبرچسبی باعث پیچیدگی زمانی زیادی میشود. روشهای یادگیری چندبرچسبی سعی در کاهش این هزینهها دارند. از طرفی برخی از کاربردها همانند توابع تاثیر ژنها ذانا چندبرچسبی هستند و حتی با هزینههای بالا هم نمیتوان آنها را به مسالۀ تک برچسبی تبدیل کرد و نیاز به یادگیری چندبرچسبی برای این مسائل ضروری است. در یادگیری چندبرچسبی هدف یافتن تابع نگاشتی است که فضای ویژگی را به فضای مجموعه برچسبها نگاشت کند.
1-2- اهمیت موضوع به لحاظ کاربردی:
طبقه بندیکننده چندبرچسبی دادهها در حوزههای مختلفی از جمله حوزههای علمی، تجاری و امنیتی و غیره کاربرد دارد. در تمامی این حوزهها با توجه به حجم انبوه دادهها نیاز است دادهها را در گروههای مدنظر قرار داد و سپس به تجزیه و تحلیل آنها پرداخت.
1-3- مفاهیم پایهای:
تعریف انواع طبقهبندی برچسبی: طبقه بندی در یادگیری ماشین، شناسایی یک تابع f(x) است که هر بردار ویژگی xi را به هدف مربوطه با برچسب yi، i=1,2,..,n که n تعداد نمونههای آموزشی میباشد، متصل کند. در طبقهبندیکنندههای مرسوم در یاگیری ماشین، هر یک از نمونههای ورودی تنها به یک برچسب هدف متصل میشود، به بیان دیگر، هر نمونه ورودی دارای هدف مرتبط یکتایی است. به این نوع طبقهبندی، طبقهبندی تکبرچسبی گفته میشود. در مقابل چندین مسئله طبقهبندی در دنیای واقعی، شامل نمونه دادههایی هستند که این نمونه دادهها به زیرمجموعهای از برچسبهای هدف مرتبط میشوند. این امر موجب ظهور شاخه جدیدی از طبقهبندی یادگیری ماشین، به نام «طبقهبندی چندبرچسبی» میشود[3].
طبقهبندی دادههای چندبرچسبی[2]: طبقهبندی دادههای چندبرچسبی یک مساله یادگیری با نظارت میباشد که در آن هر نمونه میتواند همزمان با چندین کلاس یا برچسب همراه شود و این کلاسها مختص یک نمونه خاص نیز نمیباشند. در سالهای اخیر به علت رشد سریع ابزارهای دنیای واقعی، مسائل طبقهبندی برچسبی اهمیت و توجه زیادی را به خود جلب کرده است. طبقهبندی چندبرچسبی کاربردهای زیادی در دنیای واقعی دارد از جمله این کاربردها میتوان تقسیمبندی متن[3]، بیوانفورماتیک[4]، تفسیر صحنه و فیلم، ژنومیک، مولتیمدیا، عواطف، برچسبزنی نگاشت، بازاریابی، دسته بندی موسیقی و غیره را نام برد. با توجه به حضور گسترده مسائل چندبرچسبی در محدوده وسیعی از سناریوهای جهان واقعی، طبقهبندی برچسبی یک زمینه نوظهور در طبقهبندی یادگیری ماشین به شمار میرود. سه نوع دسته برای طبقه بندی چندبرچسبی وجود دارد که عبارتند از: تجزیه داده، توسعه الگوریتم و استراتژی ترکیبی. استراتژی تجزیه داده مجموعهداده چندبرچسبی را به یک یا چندزیرمجموعه تکبرچسب تقسیم میکند و سپس برای هر زیرمجموعه با استفاده از طبقهبندهای موجود، یک طبقهبند برای آنان میسازد و سپس همهی این طبقهبندها در یک طبقه بند چندبرچسبی کلی جمع میکند. عمدتا 3نوع ترفند تجزیه داده وجود دارد: یک درمقابل یک، یک درمقابل بقیه، برچسب ابر مجموعه. روش چندبرچسبی تجزیه داده برای پیادهسازی مناسب است چون تعدادی از طبقهبندها در این حوزه و نرمافزارهای رایگان آنان موجود میباشند. استراتژی توسعه الگوریتم، یک الگوریتم طبقهبندیچندکلاسهخاص را برای همه نمونههای آموزشی و همه کلاسهای یک مجموعه داده آموزشی چندبرچسبی، عمومیت میبخشد. چنین استراتژی میتواند در مسائل بهینهسازی پیچیده مورد استفاده قرار گیرد. برای مثال برنامهنویسی درجه دوبزرگ مقیاس در ماشین بردارِ پشتیبان چندبرچسبی و بهینهسازی بدون قید در شبکههای عصبی چندبرچسبی. استراتژی ترکیبی از برخی از الگوریتمهای طبقهبندی تکبرچسب با یک یا دو ترفند تجزیه داده که به صورت ضمنی یا صریح بکار رفتهاند را گسترش میدهد. به عبارت دیگر برخی از محاسن دو گروه فوق از روشهای چندبرچسبی را در یک جا جمع میکند. این استراتژی برای طراحی و پیادهسازی چندین طبقهبند چندبرچسبی مورد استفاده قرار میگیرد[2].
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.