مدل مخفی مارکوف
یکی از روش های پر کاربرد در مدل سازی از داده های صوتی مدل مخفی مارکوف می باشد و این روش در بسیاری از موارد دارای کارایی بسیار خوبی می باشد.عمده استفاده از این روش در تشخیص گفتار می باشد.
تئوري زنجيره مارکوف از حدود صد سال پيش براي رياضيدانان و مهندسان شناخته شده بوده است ،اما به علت نبود الگوريتم خاص براي بهينه کردن پارامترهاي مدل ،درکاربردهاي عملي مورد استفاده قرارنگرفت،تا اينکه با ارائه الگوريتمي در اواخر دهه 1960 به سرعت در موارد مختلف ،همچون پردازش صحبت ، بکار گرفته شد.
استفاده از روشهاي آماري مانند مدل مخفي مارکوف (hmm)داراي مزاياي خاصي مي باشد که مي توان به نکات زير اشاره نمود:
نخست آنکه ،مدل از ساختار رياضي مستحکمي برخوردار است و مي تواند پايه نظري براي حوزه وسيعي از کاربردها را تشکيل دهد.
دوم آنکه،اگر مدل به درستي به کار گرفته شود،مي تواند در بسياري از کاربردهاي عملي مهم مورد استفاده قرار گيرد.
یک مدل مخفی مارکوف از اجزا زیر تشکیل می شود :
،تعداد حالات در يک مدل ؛که حالات مجزا با و حالت در زمان با مشخص می شود.
،تعداد سمبلهاي قابل مشاهده در هر حالت؛ سمبلهاي مشاهده پذير به خروجي فيزيکي سيستم مدل شده مربوط مي شوند. در آزمايش پرتاب سکه ، سمبلها، پشت وروي سکه مي باشند.سمبلهاي مجزا را با مشخص می شوند.
توزيع احتمال انتقال حالت که :
يعني احتمال انتقال از حالت به حالت .
توزيع احتمال رويت سمبل در حالت که:
يعني احتمال رويت سمبل هنگامي که در حالت هستيم .
توزيع حالت اوليه ( احتمال انتخاب حالت اول )
با مشخص شدن مقادير مناسب براي ، قابليت توليد يک رشته را دارد که هر يک سمبل از ميان و تعداد مشا هدات در رشته مي باشد.
بنابراين براي توليد يک رشته از مشاهدات به کمک مدل از الگوريتم زير استفاده مي کنيم:
با توجه به توزيع حالت اوليه يک حالت نخست انتخاب مي کنيم .
را برابر يک قرار ميدهيم ) ( .
با توجه به توزيع احتمال سمبل در وضعيت را انتخاب مي کنيم.
با توجه به توزيع احتمال انتقال حالت براي به يک حالت جديد منتقل مي شويم.
را برابر قرار مي دهيم اگر > بود به مرحله باز مي گرديم، در غير اين صورت به کار خاتمه مي دهيم.
مراحل فوق مي تواند براي توليد يک رشته از مشاهدات ويا مدلي براي توضيح اينکه چگونه يک رشته از مشاهدات توسط يک مناسب توليد شده است، بکار رود.
از بحث بالا مشخص مي شود که براي تشخيص کامل يک نياز به تشخيص دو پارامتر مدل و تشخيص سمبلهاي قابل مشاهده و تشخيص سه پارامتر احتمالي مي باشد .براي راحتي ما از نماد زير براي نمايش کامل پارامترهاي يک مدل استفاده مي کنيم :
پس از حصول آشنایی مختصر با این مدل در ادامه به سه نوع مسئله مطرح شده در خصوص آن پرداخته می شود که پاسخ به این مسایل می تواند در حل مسایل گوناگون کمک کند.
مسئله اول: با توجه به رشته داده شده ومدل داده شده با چه دقتي مي توان ، احتمال رويت رشته داده شده را محاسبه کرد.
مسئله دوم : با توجه به رشته داده شده و مدل ، چگونه مي توان رشته حالت مربوطه را به گونهاي انتخاب کرد تا حالت بهينه بدست آيد يعني مشاهدات را به بهترين صورت توضيح دهد.
مسئله سوم: چگونه ميتوان پارامتر هاي را به گونه اي انتخاب کرد تا ماکزيمم شود.
مسئله ا ول يک مساله محاسباتي ميباشد. با داشتن مدل و رشته مشاهده ميخواهيم احتمال مشاهده اين رشته را توسط اين مدل محاسبه کنيم. به اين مساله به گونه ديگر هم ميتوان نگاه کردوآن اينکه ميخواهيم ببينيم که مدل ورشته چقدر با يکديگر همخواني دارند. نگاه دوم بسيار موثر است، مثلا اگر ما خواسته باشيم از ميان چند مدل، مدل مناسبي را انتخاب کنيم.راه حل مساله اول ، جواب مناسبي را به ما خواهد داد.
با پرداختن به مساله دوم ما سعي خواهيم کرد که از ابهام قسمت مخفي مدل بکاهيم يعني يک رشته حالت صحيح را انتخاب کنيم. اما در اکثر موارد عملي يک جواب صحيح براي اين پاسخ وجود ندارد بنابراين ما بدنبال حالت بهينهاي هستيم که اين مسئله را به نحو احسن حل کند.
در برخورد با مساله سوم ، تلاش ما بر آن است تا با بهينه كردن پارامترهاي مدل ، توضيحي مناسب براي براي بدست آوردن رشته مشاهده شده بيابيم. با استفاده از رشته مشاهده شده ، درطي مرحله آموزش ، پارامترهاي مدل را ارزيابي ميكنيم .
مرحله آموزش در موارد عملي استفاده از مهمترين قسمت ميباشد . چرا كه اين اجازه را به ما ميدهد تا پارامترهاي مدل را با رشته مورد نظر هماهنگ سازيم يعني بدست آوردن بهترين مدل براي فرايند واقعي.
براي روشن شدن بهتر مطلب، يك سيستم تشخيص صحبت كلمات مجزا را در نظر ميگيريم.فرض كنيم كه بخواهيم ، كلمه مجزا را از يكديگر تشخيص دهيم . براي هر يك از كلمه مجموعه يك مدل ، حالته طراحي ميكنيم.
در مرحله اول بايد چندين مدل مجزا براي كلمات توليد كنيم ، اين كار بوسيله راه حل مسأله سوم براي تخمين پارامترهاي مدل هر كلمه در حالت بهينه صورت ميگيرد .بري تعميق بخشيدن به فهم معني فيزيكي حالات مدل ، با كمك گرفتن از راه حل مسأله دوم هر يك از رشتههاي آموزش كلمه را به حالات مجزا تقسيم ميكنيم . هدف ما در اين مرحله ايجاد اصلاحاتي براي افزايش توانايي مدل كردن رشته كلمه تلفظ شده است .
در مرحله آخر كه ، مختلف طراحي وبهينه شده نوبت به تشخيص كلمه جديد ميرسد. كلمه جديد به هر يك از مدلها اعمال شده و با توجه به حل مسأله اول هر كدام از مدلها كه بيشتري را نتيجه داد، نتيجه مطلوب خواهد بود.
تا اینجا آشنایی مختصری با این روش مدل سازی ایجاد شده است.انتخاب یا عدم انتخاب این روش به آینده و پس از بررسی روش های دیگر موکول خواهد شد.به طبع در صورت انتخاب این روش بیشتر از این به آن خواهیم پرداخت.
متاسفانه به خاطر نقص در ویرایشگر نتونستم متن رو به طور کامل بذارم.فرمول های مربوط به متن بالا هم کپی نشد
به همین خاطر فایل مربوط به این مطلب رو ضمیمه کردم.
امید وارم مفید باشه