توضیحات
عنوان فارسی: یک ارزیابی اتوماتیک مرتبه ای مبتنی بر HMM از دقت OCR برای یک کتابخانه دیجیتالی کتاب ها
عنوان انگلیسی مقاله:
A Hierarchical, HMM-based Automatic Evaluation of OCR Accuracy for a Digital Library of Books
چکیده
HMM مدلی است که به طور گسترده برای وظایف تنظیم و تراز در دامنه های مختلف مورد استفاده قرار میگیرد، به عنوان مثال، برای تنظیم و تراز دنباله در تشخیص صدا {16}، هم ترازی و تنظیم صدای ترکیب شده با خود صدا {12}، ترجمه ماشینی {3}، تنظیم نوشته های موازی در ترجمه ماشینی {9}، تنظیم خروجی تشخیص صدا با کپشن های ویدئو {7}.
کروق و همکارانش {11} استفاده از یک HMM خطی به عنوان ساختاری که دنباله های پروتئینی را با فرآیندی تصادفی تولید می کند. اساسا یک زنجیر مارکو مخفی با سه نوع از گره است: تطبیق، قرار دادن، حذف کردن، به طوری که همگی گذارها و هزینه های فاصله حروف، وابسته به موقعیت می باشند، یعنی توزیع های مختلف مربوط به نوع یکسانی از حالت ها یا گذارها در موقعیت های مختلف می باشند.
بر خلاف HMM های خطی کروق، HMM در هر سطح از رویکرد تنظیم مرتبه ای، موقعیت ها را به عنوان حالت ها در نظر می گیرد و احتمال تولید یک دنباله از خروجی OCR را محاسبه می کند. درواقع، حالتی برای هر موقعیت در دنباله حقیقت زمین[1] وجود دارد. این ساختار شباهت بسیار زیادی به مدل HMM ارائه شده توسط جی. روتفیلد و همکارانش دارد {15}. برای تنظیم کلمه به کلمه تصاویر اسنادی که به صورت دستی نوشته و اسکن شده اند توسط رونوشت های ASCII. این مدل مرتبه ای نبوده و برای تنظیم دنباله های بزرگ عملی نیست. در این مقاله ما درصدد تنظیم متن به متن هستیم، نه متن به تصویر. با در نظر گرفتن مسئله و تفاوت های دامنه، احتمالات گذار و احتمالات تولیدی می بایست به صورت مجزا تعریف شوند. جزئیات این تعریف در بخش 2.1 داده شده است. برای کار یکسان تنظیم دست خط، کورنفیلد از وارپینگ زمان پویا یا دینامیک (DTW) استفاده می کند {10} تا دنباله های ویژه به دست آمده از مجموعه تصاویر کلمه را با رونوشت های ASCII تنظیم نماید.، که یک روش تنظیم جهانی مبتنی بر ادیت فاصله می باشد که در آن هزینه های حذف، قرار دادن و تطبیق به صورت یکنواخت به عنوان عدم تجانس بین آیتم های نظیر از دو مجموعه زمان، تعریف شده اند. در مقایسه با الگوریتم تنظیم مبتنی بر ادیت فاصله، تنظیم مبتنی بر HMM این امکان را می دهد تا با استفاده از تمرین دنباله های تنظیم شده یا تنظیم نشده و فرمول بندی احتمالات با استفاده از توزیع های دلخواه، دانش دامنه مورد یادگیری قرار گیرد، به صورتی که هم انعطاف پذیر تر و هم قوی تر است.
[1] Ground Truth
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.