توضیحات
عنوان فارسی: تشخیص دقیق کلمات موجود در صفحه بدون تقسیم کاراکترها، با استفاده از شبکه عصبی بازگشتی
عنوان انگلیسی مقاله ترجمه شده:
Accurate recognition of words in scenes without character segmentation using recurrent neural networkAccurate recognition of words in scenes without character segmentation using recurrent neural network
تشخیص دقیق کلمات موجود در صفحه بدون تقسیم کاراکترها، با استفاده از شبکه عصبی بازگشتی
چکیده:
تشخیص متن در صفحه یکی از مهمترین وظایف برنامه های تصویری بر روی کامپیوترهاست. در میان تکنیک های تشخیص متن که توسعه یافته اند، تشخیص متن در صفحه در شکل عمومی و کلی هنوز بسیار باز و موضوع پژوهش چالش بر انگیزی است. یک فاکتور مهم که پیشرفت پژوهشها در این حوزه را عقب می اندازد، تشخیص کاراکترها در هنگامی که تعداد زیادی کاراکتر در صفحه مشخص می شود و نمی توان آنها را جداسازی نمود، می باشد. ما در این مقاله یک روش تشخیص متن که نیازی به شناسایی کاراکترها ندارد را ارئه می دهیم. روش ارائه شده دارای سه مزیت است : اول اینکه تصویر هر کلمه را به سیگنالهای متوالی برای تشخیص آن تبدیل میکند.دوم اینکه شبکه عصبی بازگشتی را با حافظه طولانی کوتاه مدت منطبق می کند، تکنیکی که در سالهای اخیر به طور گسترده ای برای تشخیص دست خط به کار گرفته شده است.سوم اینکه با بکارگیری متعدد شبکه عصبی بازگشتی سیستم بدون تقسیم بندی کاراکترها قادر به تشخیص متنی که دارای پیچیدگی است، می شود.آزمایشات گسترده ای بر روی مجموعه داده های زیادی شامل ICDAR و Google Strett View Text انجام شده است.آزمایشات نشان می دهند که روش ارائه شده دارای دقت خوبی در تشخیص کلمات در صفحه می باشد.
مقدمه:
تشخیص متن در صفحه یکی از حوزه های مهم تحقیقاتی در کامپیوتر است و با پژوهشهای موفق بسیاری مورد مطالعه قرار گرفته است.با توجه به توسعه سریع سنسورهای موبایل و تکنولوژی اینترنت تعداد زیادی تصاویر دیجیتالی هر روزه تولید می شوند. بخشهای متنی به عنوان یکی از مهمترین بخش های آموزنده در تصویر های نمایشی نیاز به تفسیر درستی دارند که به صورت اتوماتیک آنها را بسیار دست یافتنی تر و ارزشمند تر می سازد. مسابقات بزرگی که تحت چارچوب کنفرانس بین المللی تحلیل و تشخیص اطلاعات ICDAR در سالهای 2011 و 2013 برگزار شد نشان دهنده توسعه های اخیر این حوزه بود.یکی از بخش های این مسابقات تشخیص لغات برش خورده ای در تصویر که دارای قیود مختصری در فونت نوشتاری، روشنایی محیطی و تصویر زمینه و غیره هستند می باشد. سیستم های تشخیص بسیاری بر اساس معیار های سنجش و دقت تشخیص که اوایل در حدود 50% بوده است و در دهه اخیر به حدود 80% افزایش داشته است، گزارش شده است.
شناسای عکس نوشته ها با دو رویکرد معمولا مورد بررسی قرار گرفته است. اولی روش سنتی تشخیص کاراکتر نوری OCR است که در ابتدا پیکسلهای متنی از عکس زمینه جداسازی شده و سپس موتورهای OCR برای شناسایی کاراکترهای جداسازی شده به کار گرفته می شوند. رویکرد دیگر بر اساس ویژگی ها می باشد که ویژگی های متنوع تصویری مانند هیستوگرام گرادیان نما HOG ویا ویژگی انتقال مقیاس غیر مستقیم SIFT را استخراج می کند تا به یک مدل طبقه بندی کاراکترها به صورت چند طبقه ای دست یابد. روش سنتی OCR به موفقیت های بسیاری در سیستم های تجاری مختلف دست یافته و توسعه زیادی نیز پیدا کرده است.اگر چه بسیاری از آنها برای اسکن اطلاعات متنی که معمولا دارای کیفیت های خوبی هستند طراحی شده اند.آنها معمولا در دست یابی به نتیج قابل قبول برای عکس نوشته هایی که دارای قیود پیچیده در فونت نوشتاری، روشنایی محیطی و تصویر زمینه و غیره هستند مانند شکل 1 قسمت a و e با شکست مواجه می شوند. سیستم های بسیاری برای استخراج ناحیه واضح کاراکترها قبل از ورود به موتورهای OCR گزارش شده اند اما آنها اغلب دچار دو مشکل اساسی هستند، اول اینکه جداسازی متن موجود در عکسها به دلیل روشنایی غیر یکسان، تارشدگی و شفافیت زمینه کم مانند شکل 1 قسمت e و g مشکل است. دوم اینکه متنها در عکس معمولا دارای اعوجاج پرسپکتیوی هستند و فونت های خاصی دارند که توسط موتور های سنتی OCR به خوبی تشخیص داده نمی شوند.(شکل 1 قسمت c و h)، از این رو برای ارئه نتیجه قابل قبول به تکنیک های متفاوت بازیابی عکس نیاز است.
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش ترجمه تخصصی مقالات خود بر روی کلید زیر کلیک نمایید.
سفارش ترجمه مقاله
نقد و بررسیها
هنوز بررسیای ثبت نشده است.