توضیحات
شبیه سازی سیستم تشخیص متن از فایل تصویری با متلب
این پروژه مربوط به درس شناسایی آماری الگو میباشد. در این پروژه میخواهیم یک سری اعداد را از فریمهای یک ویدیو تشخیص دهیم.
مراحل کار:
- خواندن فریم های ویدئو
- تنها برای یک فریم این الگوریتم اجرا می شود که فریم 600 این ویدئو می باشد
- لبه یابی canny
- عملگرهای مورفولوژی گشایش، پرکردن حفره ها morphological operator
- برچسب گذاری اشیای داخل تصویر lable object
- گذاشتن فیلتر برای جلوگیری از شناسایی قسمت هایی به عنوان بخش های عددی: نسبت طول به عرض این نواحی باید کوچکتر از 2 باشد و قسمت عرض به طول این قسمت ها باید کوچکتر از 2 باشد یعنی قسمت هایی که مستطیلی باشد رد می شوند و همچنین مساحت این نواحی باید بزرگتر از 400 باشد.
- نمایش نواحی با این ویژگی به صورت مستطیل های قرمز رنگ بر روی تصویر اصلی
- پس از این مرحله اعداد جدا می شوند ولی همانطور که قبلا توضیح داده شد، اعداد به صورت دو رقمی شناسایی می شوند زیرا مرز بین دو عدد مشخص نیست. بنابراین باید یک فیلتر دیگر بگذاریم تا اعدادی که مساحت آنها بزرگتر از 30 است به دو قسمت تقسیم شوند . اگر مساحتشان کمتر از این باشد عدد یک رقمی است. در این فیلتر اعداد پس از جدا شدن همه اعداد به سایز های 20 در 20 تغییر سایز داده میشوند. سپس باینری می شوند .و بعد عملگر های نازک سازی بر روی آنها اعمال می شود. (thin و spur) سپس ماتریس 20 در 20 به بردار 1 در 400 تبدیل می کنیم تا آماده ورود به شبکه عصبی شود. این بردارها ، بردارهای تست هستند که مربوط به اعداد داخل تصویر هستند.
- برای آموزش ، ده تصویر براتون تهیه کردم که هر یک از ده عدد را نشان می دهد این تصاویر را برای آموزش در نظر گرفته ایم. کلاس خروجی این تصاویر ، به این صورت است که برای آموزش عدد صفر، تصویر عدد صفر کلاس 1 می شود و بقیه اعداد (1 تا 9) کلاس 0و همینطور برای سایر اعداد . مثلا عدد 2 باید کلاس مربوط به عدد 2 باید 1 باشد و بقیه اعداد کلاس صفر می شوند.
- برای کلاس خروجی داده های تست که مربوط به اعداد داخل تصویر ویدئو می باشد، نیز ماتریس goal نشان داده شده است که به ترتیب اعداد شناسایی شده در تصویر را نشان می دهد. برای این اعداد نیز برای تست هر عدد آن کلاس 1 است و مابقی اعداد کلاس 0 می شود/
- شبکه عصبی پرسپترون در نظر گرفته شده است. برای هر عدد از 0 تا 9 شبکه عصبی تست شده است و دقت شناسایی آن محاسبه شده است. دقت شناسایی در متغیر accuracy_nurual قرار می گیرد. سطر اول دقت را نشان میدهد سطر دوم عدد مربوطه را نشان میدهد.
شبیه سازی سیستم تشخیص متن از فایل تصویری با متلب توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.