توضیحات
تحقیق یادگیری تقویتی مبتنی بر جمعیت
چکیده:
یادگیری تقویتی به عنوان یکی از روشهای یادگیری ماشین بی نیاز به مدل، در دهه اخیر بیشتر مورد توجه محققین واقع شده است. توانایی یادگیری از طریق تعامل و بدون نیاز به راهنما، مشخصه اصلی این روش یادگیری می باشد. بسیاری از روشهای سنتی یادگیری تقویتی، فقط در محیطهای حالت و عمل گسسته و کوچک کارامد هستند.[1]
در سالهای اخیر از تکنیکهای یادگیری ماشین برای کاهش مصرف انرژی در ابر استفاده شده است. یاگیری تقویتی راه حلی را برای کاهش مصرف انرژی در ابر و حفظ کیفیت ارائه سرویس به مشتری ارائه میکند. در این مقاله از یک عامل یادگیری تقویتی برای انتخاب ماشین مجازی و انتخاب یک راه حل برای کاهش مصرف انرژی در آن ارائه شده است. استفاده از عامل یادگیری تقویتی باعث می شود تا ضمن کاهش مصرف انرژی در ابر تعداد مهاجرت از یک ماشین مجازی به ماشین دیگر نیز کاهش یابد[2].
راه حل دیگری که قبلا برای حل مسائل استفاده میشده است استفاده از تکنیک برنامه نویسی پویا بوده است. این روش برای حل مسائل دنیای واقعی و در حالت مقیاس پذیر مناسب نبود[2].
تکنیکی که در این سمینار به آن پرداخته میشود استفاده از یادگیری تقویتی برمبنای جمعیت است. ایده اصلی در این تکنیک این است که روش های جستجویی مانند برنامه نویسی پویا و یادگیری تقویتی به صورت موازی و در تعامل با یکدیگر به کار گرفته شوند[2]. نتیجه ای که از این ترکیب حاصل میشود این است که در زمان کوتاهتری نتایج بهتری ارائه میشوند[2].
در این پروژه به معرفی این روش حل مسئله و تکنیک های آن خواهیم پرداخت.
…
فهرست مطالب تحقیق یادگیری تقویتی مبتنی بر جمعیت
- فصل اول: کلیات تحقیق.. 8
- 1-1-مقدمه: 8
- 1-2-بیان مساله: 9
- 1-3-اهداف: 12
- 1-5-ساختار تحقیق: 12
- فصل دوم: تعاریف کلی و مرور پیشینه. 13
- 2-1-مقدمه: 13
- 2-2-معرفی الگوریتم های مبتنی بر جمعیت: 13
- 2-2-1-الگوریتم کلونی مورچه: 14
- 2-2-2-الگوریتم کلونی زنبور عسل: 16
- 2-2-3-الگوریتم استعماری: 19
- 2-2-4-الگوریتم کرم شب تاب: 20
- 2-2-5-الگوریتم ازدحام ذرات: 22
- 2-2-6-الگوریتم ژنتیک: 24
- فصل سوم: الگوریتم های یادگیری جمعیتی ترکیبی.. 29
- 3-1-مقدمه: 29
- 3-2-الگوریتم یادگیری افزایشی مبتنی بر جمعیت: 29
- 3-3-الگوریتم PBIL-EO GEO: 30
- 3-4-الگوریتم ژنتیک پویا: 31
- 3-5-ترکیب الگوریتم رقابت استعماری و آنتروپی فازی: 33
- 3-6-الگوریتم PSO-GA: 39
- 3-7-الگوریتم ACO-GA: 42
- فصل چهارم: کاربردهای الگوریتم های مبتنی بر جمعیت… 45
- 4-1-مقدمه: 45
- 4-2-کاربرد در شبکه حسگر بیسیم: 45
- 4-3- نتیجه گیری: 48
- 5-3-پیشنهادات: 48
منابع تحقیق یادگیری تقویتی مبتنی بر جمعیت
[1] G. Fenza and F. Orciuoli, “Building pedagogical models by formal concept analysis,” in Proceedings of the 13th International Conference on Intelligent Tutoring Systems ITS, Zagreb, Croatia, June 7-10, 2016., 2016, pp. 144–153.
[2] V. Centola and F. Orciuoli, “Itsego: An ontology for game-based intelligent tutoring systems,” vol. 1, 2016, pp. 238–245.
[3] K. Rivers and K. R. Koedinger, “Automating hint generation with solution space path construction,” in Intelligent Tutoring Systems. Springer, 2014, pp. 329–339.
[4]hitoshi imia,yasuai kurao,” Swarm Reinforcement Learning Algorithms Based on Particle Swarm Optimization”,2008,ieee
[4] R. O. A. Paiva, I. I. B. Santa Pinto, A. P. da Silva, S. Isotani, and P. Jaques, “A systematic approach for providing personalized pedagogical recommendations based on educational data mining,” in Intelligent Tutoring Systems. Springer, 2014, pp. 362–367.
[5] Daniel Paul Romero-Martí ; José Ignacio Núñez-Varela ; Carlos Soubervielle-Montalvo ; Alfredo Orozco-de-la-Paz,” Navigation and path planning using reinforcement learning for a Roomba robot”,2016,ieee
[6] K.-L. Du and M.N.S. Swamy,”ant colony optimization”,2016 springer
[7] Aleksandra Jovanovich, nicolic,” area wide traffic control a bee colony optimization approach”, 2017, elsevier
[8] Y.-M. De Hauwere, P. Vrancx, A. Nowé, “Learning multi-agent state space representations”,Proc. 9th Int. Conf. Autonom. Agents Multiagent Syst., pp. 715-722, 2010.
[9]delip komar,”application of firefly algorithm for design optimization of a shell and tube heat exchanger from economic point of view”,international journal of science 102(2016)
[10] Harish Garg,” A hybrid PSO-GA algorithm for constrained optimization problems”,mathematics and computation 274(2016).
[11] C. Arunkumar ; M. P. Sooraj ; S M. P. Ramakrishnan,” Finding expressed genes using genetic algorithm and extreme learning machines”,2017,IEEE
[12] Amiya Halder, Anuva Pradhan, Sourjya Kumar Dutta and Pritam Bhattacharya,” Tumor Extraction from MRI images using Dynamic Genetic Algorithm based Image Segmentation and Morphological Operation”,IEEE,2016
[13] Tianshi Chen, Tang Ke, Guoliang Chen, Xin Yao, “Analysis of Computational Time of Simple Estimation of Distribution Algorithms”, IEEE Trans., Evolutionary computation, vol. 14, No. 1, 2010
[14] Yang S. and Yao X., “Population Incremental Learning with Associative Memory for Dynamic Environments “, IEEE Trans. Evolutionary Computation, vol. 12, No. 5, pp. 542 561, 2008.
[15] Murat Ali Bayir, Ismail H. Toroslu, and Ahmet Cosar, Genetic Algorithm for the Multiple-Query Optimization Problem, 2007, IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS, VOL. 37, NO. 1, JANUARY 2007
[17] HarishGarg,” A hybrid PSO-GA algorithm for constrained optimization problems”, Applied Mathematics and Computation 274 (2016) 292–305
[18] Xin Gu , Jiguo Yu , Dongxiao Yu , Guanghui Wang, YuhuaLv ,” ECDC: An energy and coverage-aware distributed clusteringprotocol for wireless sensor networks, Computers and Electrical Engineering xxx (2013) xxx–xxx
توجه:
تحقیق یادگیری تقویتی مبتنی بر جمعیت شامل یک فایل ورد 50 صفحه ای می باشد.
لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.