توضیحات
عنوان فارسی:تعهد بدون پشیمانی:یادگیری آنلاین در بازیهای امنیتی Stackelberg
عنوان انگلیسی مقاله ترجمه شده:
Commitment Without Regrets: Online Learning in Stackelberg Security Games
تعهد بدون پشیمانی:یادگیری آنلاین در بازیهای امنیتی Stackelberg
چکیده
در یک بازی امنیتیStackelberg ، یک مدافع متعهد میشود که به طور تصادفی از منابع امنیتی مستقر شود، و یک مهاجم به بهترین وجه با حمله به هدفی که حداکثر کارایی او را داشته باشد مکاتبه میکند.
در حالی که الگوریتمهای محاسبه یک استراتژی بهینه برای مدافع در دنیای واقعی در نظر میگیرند، برنامههای مستقر نیاز به اطلاعات قابل توجهی در مورد مهاجمان بالقوه دارند و منجر به ناکارآمدی آنها میشود.
در این مقاله از طریق یک روش یادگیری آنلاین به حلِ این مشکل پرداخته است. این مقاله الگوریتمهای بدون پشیمانی را طراحی کرده که پشیمانی (هنگامی که با بهترین استراتژی ثابت در مقایسه با دوربین مقایسه میشود) در پارامترهای بازی چند جمله ای و در تعداد دفعات مراحل زیر خطی است.
- مقدمه
یک بازی Stackelberg شامل دو بازیکنِ رهبر و پیرو است. رهبر با ارتکاب به یک استراتژی مختلط بازی میکند. تعهد رهبر توسط پیرو مشاهده میشود، که پس از آن بهترین پاسخ را به استراتژی رهبر نمایش میدهد. هنگامی که هاینریش Freiherr فون Stackelberg مدل خود از شرکتهای رقیب در سال ۱۹۳۴ را منتشر کرد، او قطعا تصور نمیکرد که او اساس یک برنامه دنیای واقعی هیجانانگیز از تئوری بازی محاسباتی را بر عهده دارد: Stackelberg بازیهای امنیتی (SSGs). در سطح مفهومی، نقش رهبر در یک SSG معمولا توسط یک آژانس امنیتی که مامور محافظت از مکانهای زیر بنایی مهم است، ایفا میشود. از آن به عنوان مدافع یاد میشود. فضای استراتژی مدافع شامل تخصیص منابع به اهداف بالقوه است. پیرو – به عنوان مهاجم در این زمینه – به استقرار رهبر (احتمالا تصادفی)رهبر اشاره دارد و هدف را برای حمله به شیوهای انتخاب میکند که سودمندی مورد انتظار خودش را به حداکثر میرساند. الگوریتمهایی که به مدافع کمک میکنند یک استراتژی بهینه را محاسبه کنند که در حال حاضر در استفاده از آژانسهای اصلی امنیتی مانند گارد ساحلی ایالاتمتحده، خدمات هوایی فدرال و پلیس فرودگاه لسآنجلس بکار میرود. این کاربردهای جالب توجه به رشد سریع کار اختصاصیافته به درک و غلبه بر محدودیتهای مدل اولیه SSG را ایجاد کردهاند. در اینجا بر روی مدل تمرکز میکند.
- مقدمات مدل
در این مقاله با اتخاذ رویکرد اساسا متفاوت با عدم قطعیت در مورد حمله کنندگان با عدم قطعیت مواجه شدند که یک ارتباط جدید با ادبیات گسترده در مورد یادگیری آنلاین ایجاد میکند. یک بازی امنیتی Stackelberg مکرر بین یک مدافع (رهبر)و توالی حمله کنندگان (پیروان)را در نظر میگیرند. در هر مرحله از این بازی تکرار، تعامل بین مدافع و مهاجم یک بازی امنیتی Stackelberg ایجاد میکند، که در آن مدافع متعهد به تخصیص تصادفی منابع امنیتی خود برای دفاع از اهداف بالقوه میشود، و مهاجم به نوبه خود این تخصیص تصادفی را مشاهده کرده و هدف را با بهترین بازده مورد انتظار انجام میدهد. سپس مدافع و مهاجم بازده دریافت میکنند. هدف مدافع، حداکثر کردن بازده خود در یک دوره زمانی است، حتی زمانی که توالی مهاجمان ناشناس باشد. به طور دقیقتر، یک بازی امنیتی stackelberg مکرر شامل اجزای زیر است:
افق زمانی T: تعداد دورهای.
مجموعه اهداف N = {1,…,n}.
مدافع با: 1)منابع: مجموعهای از منابع R.. 2)برنامهها: مجموعهای از برنامهها. 3)تخصیص وظیفه. 4)استراتژی: یک استراتژی خالص تخصیص اعتبار منابع به زمانبندی است. 5)مجموعهای از حمله کنندهها. 6) برنامههای کاربردی: مدافع و مهاجم هر دو هنگام حمله به هدف، بازپرداخت دریافت میکنند.
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش ترجمه تخصصی مقالات خود بر روی کلید زیر کلیک نمایید.
سفارش ترجمه مقاله
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.