توضیحات
عنوان فارسی: بهبود در تشخیص شیء به وسیله کانال ℓ
عنوان انگلیسی مقاله:
Improving object recognition with the ℓ-channel
ترجمه مقاله بهبود در تشخیص شیء به وسیله کانال ℓ
چکیده
ما کانال جدیدی به نام کانال l به تصاویر متداول RGB اضافه کرده و کاربرد آن در طبقه بندی چندگانه و کارهای شناسایی پیشنهاد میکنیم. تصویر RGB-ℓ جدید، همان صحنه را با استفاده از کانال مات و رنگی، که به طور همزمان با استفاده از یک دوربین دو چشمی که با هزینهی کم، شیشه ای مات در جلو یکی از دوربین قرار داده شده است، ثبت میکند. با توجه به ویژگی پراکنده کردن نور در شیشههای مات، کانال نور مات مورد نظر مبهم و غیر دقیق است. در این مقاله ما یک بهینه سازی جدید که توسط کانال RGB هدایت شده است، به منظور اصلاح کانال ℓ ، برای حفظ لبه به دلیل درخشندگی صحنه پیشنهاد میکنیم. نتایج تجربی گسترده، اثربخشی تصاویر RGB-ℓ ما، که در آن پیشرفت های قابل توجهی در انواع مختلف از طبقهبندی چندگانه و کارهای شناسایی نشان داده است.
مقدمه
نور عاملی مهم برای شناسایی است. توانایی ما برای تشخیص اشیاء تنها متکی بر رنگ و شکل آنها نیست، بلکه روشنی آنها نیز مؤثر است. برای مثال، ما به زحمت میتوانیم یک تکه کاغذ سفید و یک لامپ با شکل و رنگ مشابه همانطور که در شکل 1 نشان داده شده است، را از هم تشخیص دهیم. سیستم بینایی انسان دارای محدوده دینامیکی بالایی (HDR) است در حالی که برای طراحی تصمیم گیری، خروجی یک دوربین خاص ممکن است اینگونه نباشد. حتی یک دوربین HDR خاص برای عکاسی در نوردهیهای مختلف در تصویربرداری HDR سنجیده شده، پردازش مانند نگاشت رنگ، نتایج شدت بالای اشباع که رندر لامپ و کاغذ دایره غیر قابل تشخیص در خروجی RGB معمولی و یا دیگر فرمت تصویر نگهخواهد داشت.
با الهام از این واقعیت که تشخیص فعلی با محدوده دینامیکی تصاویر ورودی محدود شده است، در این مقاله، ما یک استراتژی جایگزین HDR سبک که در عکاسی محدوده بندی نوردهی نیاز نباشد (و تنظیم پارامتر مرتبط و یا برنامه نویسی سیستم عامل دوربین). با قرار دادن یک شیشه های مات در مقابل یکی از لنزهای یک دوربین دو چشمی مدار بسته، به طوری که کانال نور مات، و یا کانال ℓ، به طور همزمان با کانال RGB معمولی با فرمت متداول تصویر عکاسی کند. توجه داشته باشید که اگر چه کانال ℓ مثل یک تصویر تار به نظر می رسد، ولی تا حد زیادی از لحاظ اطلاعات ذاتی متفاوت است. در مقایسه با یک تصویر روشن، با اطلاعات روشنایی اضافی، تصویر تار تنها یک تصویر RGB پردازش شده بدون اطلاعات جدید و یا بهبود یافته معرفی شده است. توجه داشته باشید که اطلاعات یک تصویر گرفته شده با نورمنتشر فراتر از یک تصویر RGB است، که در آن شناسایی می تواند به طور قابل توجهی در بسیاری از حالات، همانطور که مثالهای ما نشان خواهد داد، بهبود یابد. همانطور که در شکل 2 نشان داده شده است. تصویر تار هیچ اطلاعات جدیدی (به عنوان مثال، اطلاعات نور) فراتر از آنچه که در تصویر اصلی RGB گرفته شده وجود دارد، ارائه نمیدهد. ایده اصلی این است که شیشهی مات، که با مانع شدن عبور نور کم و عبور نور روشن از خود دید را تار میکند، مثل یم پخش کننده عمل میکند.
در عمل، در کانال مات معرفی شده و یا در عکس، روشنایی پیکسل به دلیل نور سفید قوی هنوز هم سفید بوده، در حالی که یک روشنایی پیکسل به به دلیل سفید بودن یک جسم، خاکستری میشود. از سوی دیگر، یک تصویر معمولی مات، با توجه به مات و نیمه شفاف بودن شیشه که عبور نور از طریق رسانه شیشه را پراکنده میکند (شکل 3) مبهم و کاملا تار است. باید توجه شود که فیلتر حفظ لبه معمولی، به منظور ترجیح لبه به دلیل درخشندگی صحنه، طراحی نشده است در این مقاله، ما یک روش مبتنی بر بهینه سازی جدیدی را برای بهبود تصویر ℓ، پیشنهاد میکنیم به طوری که آن است که بشود به حفظ لبه های ساختار اصلی در تصویر RGB با توجه به درخشندگی صحنه به عنوان تصویر مات مربوطه بپردازد. به عبارت دیگر، لبههایی که با کنتراست بالا به طور عمده با رنگ و یا اختلاف عمق به جای اختلاف نور ایجاد می شود، کمتر حفظ خواهند شد. عنصر کلیدی روش بهینه سازی ما در یک گرادیان ترم شمارش هدایت غیر صفر نهفته شده است که در نتیجه موجب میشود کانال ℓ به صورت ناحیهای صاف باشد، در حالی که تنها تغییر قابل توجهی با توجه به کنتراست بالا لبه های RGB به علت نور زیاد نمایش داده میشود. این استراتژی بهینه سازی به خوبی به صحنه های طبیعی اعمال میشود: روشنایی یا نور، به جز در امتداد تصویرهایی با ساختار برجسته مانند نور و مرز شیء مورد نظر، صاف است. برای مثال شکل 4 را ببینید.
ما آزمایش های گسترده بحث در مورد اثر کانال ℓ در مسائل اساسی تشخیص، مانند طبقه بندی صحنه و تشخیص شی که در آن ویژگی های جدیدی بر اساس کانال جدید ℓ، تعریف می کنیم، انجام دادهایم.
کار های مرتبط
از آنجا که ما بهینه سازی ℓ کانال موفق به گرفتن تصویر نواحی روشن را بگیرد و با عدم وجود نور آن را صاف کند، همانطور که در ادامه به صورت مختصر بحث خواهد شد حوزه های تحقیقاتی متعدد را می توان مربوط دانست.
توجه:
- برای دانلود فایل کامل ورد لطفا اقدام به خرید نمایید.
- پس از خرید بلافاصله لینک دانلود فایل برای شما ایمیل خواهد شد.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.