سیستم های تشخیص هویت (پردازش تصویر)

سیستم های تشخیص هویت (پردازش تصویر)

سیستم های تشخیص هویت (پردازش تصویر)

فهرست مطالب:

چکیده 5

مقدمه 6

سیستم های تشخیص هویت 7

تشخیص الگو 9

پردازش تصویر 9

کاربرد پردازش تصویر 10

اهداف پردازش تصویر 11

OCR فارسی 13

تاریخچه سیستم ها 13

انواع سیستم های OCR 15

بررسی مراحل مختلف تکمیل یک سیستم OCR 16

1ـ پیش پردازش 16

1ـ1ـ کاهش نویز 16

2ـ1ـ نرمالیزه کردن 17

2ـ قطعه بندی 17

3ـ استخراج ویژگی ها 18

4ـ طبقه بندی و بازشناسی 18

5ـ پس پردازش 18

ویژگی های کلی نگارش فارسی 19

شناسایی کلمات فارسی با استفاده از شبکه های عصبی مصنوعی 19

ـ روش های تقطیع 21

ـ شبکه عصبی 21

ـ سیستم پیاده سازی شده در این روش 23

ـ مراحل پیش پردازش 23

ـ استخراج ویژگی 28

ـ مرحله شناسایی 28

ـ الگوریتم جستجو 29

بازشناسی کلمات دست نویس فارسی با حروف گسسته ( با استفاده از شبکه عصبی سلسله مراتبی ) 29

ـ ساختار شبکه عصبی طراحی شده 31

ـ تهیه بانک اطلاعاتی آموزش و تست 33

بازشناسی کلمات دست نویس فارسی با استفاده از ویژگی هیستوگرام گرادیان بهبود یافته 33

مرحله پیش پردازش 33

ـ تکنیک های پیش پردازش 34

استخراج ویژگی هیستوگرام گرادیان محلی 35

شبکه عصبی RBF 37

الگوریتم ISO CLUS 37

بازشناسی برون خطی کلمات دست نویس فارسی بر مبنای فشرده سازی تصاویر 39

ـ مراحل پیش پردازش 41

ـ بررسی الگوریتم تجزیه وتحلیل تطابقی 42

ـ الگوریتم CA 42

ـ الگوریتم FCNN 42

بازشناسی برخط حروف فارسی برپایه مدل مارکوف 43

ـ مدل مخفی مارکوف 44

ـ چارچوب بازشناسی 44

ـ غربال کردن حروف نامزد توسط بخش های حروف 45

ـ غربال کردن حروف نامزد توسط اجزای حروف 45

ـ نمونه بردار 46

ـ استخراج ویژگی 47

چکیده

نرم افزارهای پردازش متن برای تشخیص وبازیابی الفبا توسط کامپیوتر طراحی می شوند.برای ساخت وتوسعه چنین نرم افزارهایی نیازمند تحقیقات در زمینه های سیستم های بیومتریک ،پردازش تصویر، سامانه های هوشمند که بر گرفته از (سیستمهای خبره ،الگوریتم ژنتیک ومنطق فازی ) می باشیم .در این تحقیق ابتدا نگاهی اجمالی به مفاهیم سیستم های تشخیص هویت ،پردازش تصویر وانواع سیستم های پردازش متن ومراحل مختلف برای تکمیل چنین سیستم های داریم .سپس با استناد به مقالات مختلف در زمینه پردازش متن که بیشتر مباحث پیش پردازش را با روشهای مختلف مورد ارزیابی قرار داده اند .روشهای بهبود مراحل پیش پردازش را برای توسعه یک سیستم پردازش متن کارامد مورد مطالعه وبررسی قرار می دهیم .مباحث ذکر شده در این تحقیق شامل (شناسایی کلمات فارسی با استفاده از شبکه های عصبی مصنوعی – بازشناسی کلمات دست نویس فارسی با حروف کسسته با استفاده از شبکه های عصبی سلسله مراتبی– بازشناسی کلمات دست نویس فارسی بااستفاده از ویژگی هیستوگرام گرادیان بهبود یافته – بازشناسی برون خطی کلمات دستنویس فارسی بر مبنای فشرده سازی تصاویر – بازشناسی برخط حروف فارسی بر پایه مدل مارکوف ) می باشند.

مقدمه
رایانه تنها یک ابزار است، و ما انسان ها می باید شیوة کار کردن را به او بیاموزیم، و امکانات کار را هم برایش فراهم آوریم،. یکی از آنها نرم افزارها OCR است که برای تشخیص و بازیابی الفبا توسط کامپیوتر طراحی می شوند. OCRسرنام اصطلاحی است که صورت کامل آن در واژه نامه های انگلیسی به دو صورت آمده است .
1- Recognition Optical Character
2- Optical Character Reader
در چند دهه گذشته بازشناسی الگوهای نوشتاری شامل حروف، ارقام و دیگر نمادهای متداول در اسناد نوشته شده به زبان های مختلف، توسط گرو ههای مختلفی از محققین مورد مطالعه و بررسی قرار گرفته است. نتیجه این تحقیقات منجر به پیدایش مجموع های از رو شهای سریع و تا حد زیادی مطمئن موسوم بهOCR به منظور وارد نمودن اطلاعات موجود در اسناد، مدارک، کتا بها و سایر مکتوبات تایپی و حتی دست نوشت به داخل رایانه شده است.
تصویر سند غالبا توسط روبشگر و یا دوربین دیجیتال تولید می‌شود و شامل تعدادی پیکسل با رنگ های مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعه‌ای از پیکسل‌ها هستند. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، باید به نحوی نوشته‌های موجود در سند را بازشناسی کرد. چنین کاری توسط نرم‌افزارهای نویسه‌خوان نوری انجام می شود. واژه OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته می‌شد. پسوند نوری در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمی‌تر بازشناسی نویسه‌ها با مرکب مغناطیسی،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دست نوشته و متون چاپی مطرح شدند که دامنه کار را به کلمات و عبارات رساندند.
هم‌اکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی به کار می‌برند. سامانه نویسه‌خوان مثل یک نفر ماشین‌نویس، متن سند را می‌خواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کند. معمولاً یک روبشگر، تصویر سند را برای OCR فراهم می‌کند. سامانه نویسه‌خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آن‌ها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانه نویسه‌خوان بسیار کم حجم و قابل جستجو است.
سامانه‌های نویسه‌خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو پایه اصلی این سامانه‌ها هستند.که در ابتدای تحقیق به بررسی انها پرداختیم. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبانهای لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوه جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه‌خوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینه پردازش تصویرانجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است.

مدیر دوشنبه 4 مرداد 1395 ساعت 20:46

پیچک فایل

پیچک فایل

سیستم های تشخیص هویت (پردازش تصویر)

سیستم های تشخیص هویت (پردازش تصویر)

پیچک فایل

ابر برجسب

جدیدترین یادداشت‌ها

بایگانی

جستجو

سیستم های تشخیص هویت (پردازش تصویر)

سیستم های تشخیص هویت (پردازش تصویر)