ارائه يک رهيافت جديد براي تشخيص هويت افراد از روي راه رفتن بر مبناي الگوريتم dtw اصلاح شده و مجموعه هاي فازي
روشهاي زيادي براي تشخيص هويت افراد از روي راه رفتن در تصاوير ويديويي ارائه شده اند كه مي توان آنها را به دو دسته کلي طبقه بندي نمود: رهيافت هاي آماري و رهيافت هاي مبتني بر مدل، رهيافت هاي ارائه شده شامل سه فاز کلي هستند: پيش پردازش، استخراج ويژگي، تشخيص. بررسي اين رهيافت ها نشان مي دهد که در فاز پيش پردازش معمولاً يک الگوريتم حذف زمينه ساده صورت مي پذيرد و تا کنون کار جدي در اين فاز صورت نگرفته است.در اين مقاله يک رهيافت جديد براي تشخيص هويت افراد از روي راه رفتن ارائه شده است در روش پيشنهادي ، در فاز پيش پردازش به منظور تخمين دقيق پس زمينه و آشکار سازي شيء از يک رهيافت جديد مبتني بر مجموعه هاي فازي و در فاز ، تشخيص نيز يک الگوريتم جديد برمبنای روش dtw استفاده شده است كه نتايج بدست آمده روي مجموعه آموزشي usf ،كارايي اين روش را تاييد مي كند.
در اين مقاله از توانايي طبق هبند يکننده 1svm درقلب ساختار طبقه بند يکننده HMM به منظور بهبود راندمان آن استفاده شده است. طبقه بندي کننده 2 HMM از ترکيب هاي گاوسي براي تخمين احتمالات شرطي استفاده م يکند حال آنکه در اين تحقيق از طبقه بندي کننده SVM به جاي توابع گوسي استفاده شده است. طبقه بندي کننده SVM نتايج بسيار خوبي در زمينه تشخيص الگو 3 ارائه کرده و به دليل خاصيت عموميت بخشي آن، در اين مدل ترکيبي از آن استفاده شده است. در اين تحقيق خروجيهاي SVM به صورت احتمالات شرطي در نظر گرفته شده و از آنها به عنوان احتمال انتشار 4 در HMM اوليه استفاده شده است. اين روش ترکيبي با استفاده از بانک هاي اطلاعاتي مختلفي آموزش 5 داده و تست شده است. نتايج حاصل نشان مي دهد که اين طبق هبندي کننده نسبت به طبقه دکننده HMM اتركيبهاي گاوسي دقت بيشتري دارد.
استخراج اتوماتیک نقاط کلیدی صورت از روی تصاویر رنگی متعامد
در اين مقاله، آلگوريتمي براساس مدل ترکيبي گوسي جهت استخراج پوست رنگي صورت همراه با تصحيح سايه هاي تصوير از روي تصاوير رنگي متعامد قدامي و جانبي ارائه ميشود. اين آلگوريتم قادر است در شرايط نورپردازي متغير، مرز دقيق پوست رنگي صورت را در نماهاي متعامد مشخص کند. با مکا ن يابي خودکار ويژگي هاي مطرح در صورت از روي تصاوير متعامد،آلگوريتمي جهت تعيين تعدادي از نقاط کليدي صورت ارائه مي گردد. اين نقاط در اندازه گير يهاي پزشکي صورت قابل استفاده اند. با استفاده از مولفه هاي کرومينانس فضاي YCbCr وارائه آلگوريتمي، محدوده تقريبي ويژگي هاي صورت از قبيل چشم ها، لب و بيني از تصوير قدامي بدست مي آيد. سپس تلفيق اطلاعات بدست آمده با اطلاعات لبه در آن نواحي، نقاط کليدي آن ويژگ يها محاسبه ميشود. همچنين استخراج دقيق تر پوست رنگي صورت در نماي جانبي همراه با اطلاعات لبه خارجي صورت، ما را قادر ميسازد مرز بيروني صورت را در نماي جانبي بطور دقيق داشته باشيم. سپس نوک بيني را به عنوان يکي از نقاط کليدي براساس مرز بيروني صورت در نماي جانبي محاسبه کرده و با تقسيم بندي مرز بيروني صورت بر آنها و مشت قگيري، تعداد n به چند قطعه، انطباق منحني درجه ديگري از نقاط کليدي صورت در نماي جانبي بدست ميآيد.
بهره گيري از اطلاعات تصويري مانند شکلهاي لب و حرکات لب مي تواند دقت و مقاومت سيستم های تشخيص اتوماتيک گفتار را ارتقاء دهد. در اين مقاله، يک الگوريتم جديد براي استخراج کانتور لب بر اساس ناحيه بندي تصاوير ارائه شده است. در اين الگوريتم، با بهره گيري از يک مدل 16 نقطه اي براي توصيف کانتور لب، از شايستگيهاي روشهاي مبتني بر مدلهاي نقطهاي و مدلهاي پارامتري استفاده شده است. در ابتدا بوسيله روشهاي خوشه بندي فازي، يک نگاشت احتمال از تصاوير رنگي بدست مي آوريم سپس با استفاده از اين نگاشت، يک تابع انرژي بر اساس ناحيه بندي تصاوير که احتمال اتصال ناحيه لب و غير لب را ماکزيمم ميکند، تعريف ميشود و با فرآيند بهينه سازي نقطه اي تکرارپذير، مدل لب را بر روي نگاشت احتمال تصوير تحت بررسي منطبق ميکنيم. در اين فرآيند با هر بار تکرار، تنظيم 16 نقطه لب بوسيله 2 منحني درجه دوم و چهارم کنترل ميشود. آزمايشات نشان ميدهد که الگوريتم پيشنهاد شده داراي نتايج قابل قبولي بر روي تصاوير ساده لب در 20 فرد مختلف ميباشد.
استخراج ويژگي از تصاوير عنبيه با استفاده از تبديل موجک دوبچيز2 و فيلترهاي گابور به همراه آناليز حساسيت
در اين مقاله روشي جديد بر مبناي تبديل موجک دوبچيز 2 و جهت گيريهاي فيلترهاي گابور براي استخراج بردار ويژگي از تصوير عنبيه در سامانه هاي تشخيص هويت با استفاده از تصاوير عنبيه ارائه شده است. پس از دو بار اعمال موجک دوبچيز 2 بر تصوير عنبيه و کاهش ابعاد آن، فيلترهاي گابور را در جهت هاي مختلف به تصوير اعمال کرده و به ازاي هر پيكسل از تصوير جهتي را كه خروجي اعمال فيلتر در آن جهت بيشترين اندازه را دارد به عنوان نماينده آن پيكسل در بردار ويژگي انتخاب ميکنيم. سپس بردار ويژگي تصوير ورودي را با بردار ويژگي تک تک تصاوير موجود در پايگاه داده مقايسه کرده و از روي ميزان شباهت دو کد عمل تشخيص هويت را انجام مي دهيم. نتايج اعمال اين روش بر روي پايگاه داده CASIA نشان دهنده درصد موفقيت 30/99 % و نرخ خطاي معادل 017/ 0 ميباشد همچنين در اين مقاله اثرات نويز و تغييرات شدت نور محيط و تباين (contrast) بر روي سامانه بررسي شده که نشان دهنده مقاومت سامانه در برابر اين گونه اغتشاشات است.
استفاده از پراكندگي مقادير ويژه در ايجاد درخت ِخوشهبنديِ فازي بدون راهنما
خوشه بندي يكي از ابزار اصلي در شناسايي الگو است. در خوشه بندي بدون راهنما از تعداد خوشه ها اطلاعي در دست نيست و به كمك يك معيار، خوشة بوجود آمده ارزيابي مي شود. عموماً معيار چگاليِ خوشه، براي اعتبار سنجي خوشه بندي بكار ميرود. در اين مقاله از معيارِ پراكندگيِ مقاديرِ ويژة ماتريسِ كوروليشنِ بردار ويژگيِ ورودي، در سنجشِ چگالي خوشه استفاده مي شود و اثبات مي شود كه اين معيار با طيف قدرت ارتباطِ مستقيم دارد و براين اساس، آستانة مناسب روي معيار پيشنهادي بدست ميآيد كه خوشه هايي با طيف قدرت همسان حاصل مي شود. يك درختِ تصميمِ دودويي براي خوش هبندي داده ها ايجاد شده كه در هر گرهِ آن، بر اساسِ معيار پيشنهادي، داده ها به دو خوشه با الگوريتم k –ميانگين فازي تقسيم مي شوند. نتايج بدست آمده از بكارگيريِ روش پيشنهادي بر رويِ داده هاي مصنوعي و مقايسة آن با روشهاي ارائه شده توسط Xie و Bezdek كارايي آنرا نشان مي دهد. همچنين از الگوريتم پيشنهادي در تقطيع تصوير استفاده ميشود. تلفيق ويژگيهايِ سطوح خاكستري و گراديان تصوير با استفاده از اين الگوريتم نتايج خوبي در تقطيع تصوير حاصل ميكند
استفاده از الگوريتم ژنتيک در حل مسأله تطبيق غيردقيق زيرگراف به منظور استفاده در تشخيص شی
تشخيص شیء مبتنی بر گراف، يکی از روشهای مقاوم و موثر در تشخيص شیء و بينايی ماشين محسوب می شود. در اين مقاله، به مطالعه و تجزيه و تحليل حل مسأله تطبيق غيردقيق زيرگراف که در تشخيص شیء مبتنی بر گراف کاربرد اساسی دارد پرداخته می شود. بدين منظور مسأله تطبيق غيردقيق زيرگراف بصورت يک مسأله بهينه سازی فرمولبندی شده و سپس جهت حل آن، الگوريتم ژنتيک پيشنهاد می گردد. کدينگ، عملگرهای برش و جهش متناسب با مسأله، طراحی و پيادهسازی می شود. در طراحی عملگرهای ويژه، از تکنيکهای ابتکاری جهت افزايش راندمان الگوريتم بهره- برداری می شود. شبيهسازی و مقايسه نتايج با نتايج بدست آمده از روش متعارف نيلسون، نشان می دهد که با افزايش تعداد گرهها در مسأله تشخيص شیء، روش الگوريتم ژنتيک از کارايی محاسباتی بهتری برخوردار است.
A small eigen value based approach is adopted in this paper to develop a skew estimation algorithm with a high accuracy and language independency capabilities. The lower pixels of characters are extracted and subjected to a straight line fitting algorithm to fit the best line among lines of document image. Later the small eigen vale is used to estimate the skew angle of the resultant document image
در اين تحقيق ويژگی جديد ضرايب خود همبستگی برای استخراج از اسناد متنی به منظور بازشناسی قلم های فارسی معرفی شده است. در اين روش، تصوير سند مستقل از محتوای متن به عنوان يک تصوير بافت دار در نظر گرفته می شود که بافت متن، وابسته به نوع قلم می باشد. سپس ضرايب خود همبستگی به عنوان ويژگيهای مناسب برای طبقه بندی قلمهای مختلف استخراج می شود . روش پيشنهادی روی مجموعه ای شامل 1000 زيرتصوير از 20 نوع قلم متداول فارسی آزمايش شده است . نرخ بازش ناسی 95.7 به کمک همسايه نزديکتر، مناسب بودن روش پيشنهاد شده k طبقه بند را نشان می دهد . در اين مقاله همچنين استفاده از الگوريتم وراثتی برای کاهش بعد بردار ويژگی پيشنهاد شده است که علاوه بر کاهش ميزان ويژگيهای استخراجی به کمتر از نصف، افزايش دقت طبقه بندی به نرخ بازشناسی 96.9 نيز حاصل شده است.
بازشناسي ديداري گفتار با استفاده از مدلهاي شکل فعال و مدلهاي مخفي مارکوف
بازشناسي تصويري گفتار فرايندي است که در سالهاي اخير برای کمک به افرادي كه دچار آسيب در سيستم صوتي بوده ، مورد توجه محققين قرار گرفته است . در اين مقاله، يک رويکرد جديد براي تشخيص ديداري گفتار ارائه شده است که شامل دو مرحله استخراج ويژگي از دنباله تصاوير لب و طبقه بندي ويژگي هاي بدست آمده ميباشد. براي استخراج ويژگي ، يک الگوريتم جديد براي استخراج کانتور لب مبتني بر نقاط با استفاده از asm پيشنهاد شده است .در اين الگوريتم، ابتدا يک مدل لب 16 نقطه اي برای توصيف کانتور لب استفاده شده است که اين نقاط توسط چند مد اول تغييرات شکل بدست آمده از مجموعه داده آموزشي کنترل ميشوند. با کمک آناليز خوشه بندي فازي، يک نگاشت احتمال از تصاوير رنگي لب بدست آمده است و يک تابع هزينه مبتني بر ناحيه ساخته شده است . با فرآيند بهينه سازي جديد، مدل لب را بر روي نگاشت احتمال تصوير تحت بررسي منطبق مي کنيم و از پارامترهاي اين مدل به عنوان ويژگي در هر فريم استفاده شده است . در نهايت براي يکسان سازي بعد بردار ويژگي، از روش درون يابي و برای کاهش بعد بردار ويژگي از روشهاي fld و pca استفاده مي گردد . برای طبقه بندي 6 واژه، از الگوريتم hmm استفاده شده و ارزيابي بر روي مجموعه دادگان جمع آوري شده از تصاوير لب 20 گوينده مختلف، صورت گرفته که بيشترين نرخ شناسايي % 89 ميباشد.