مدل مخفی مارکوف (HMM) تلاشی است برای مدل سازی آماری دستگاه تولید گفتار و به همین دلیل به اولین دسته از روش های شناسایی گفتار تعلق دارد. در طول چندین سال گذشته این روش به عنوان موفقترین روش در شناسایی گفتار مورد استفاده قرار گرفته است. دلیل اصلی این مساله این است که مدل HMM قادر است به شکل بسیار خوبی خصوصیات سیگنال گفتار را در یک قالب ریاضی قابل فهم تعریف نماید.
فایل تهیه شده نگاهی دارد بر مفاهیم اولیه مدل مخفی مارکوف و مدل سازی شناسایی گفتار به این روش که منبعی کامل برای دانشجویان مهندس برق و کامپیوتر (هوش مصنوعی و شناسایی آماری الگو) می باشد. بسیاری از پروژه های دانشجویی به این موضوع می پردازند. در این جزوه سعی شده که مفاهیم اولیه به طور مبسوط برای مخاطبان شرح داده شود که این امر در سه بخش به صورت زیر تنظیم شده است:
بخش اول : آشنایی با مدل مارکوف
1-1- مقدمه
1-2- فرآیند مارکوف گسسته
1-3- مرتبه مدل مارکوف
1-3-1- مدل مارکوف مرتبه صفر
1-3-2- مدل مارکوف مرتبه اول
1-3-3- مدل مارکوف مرتبه m ام
1-4- مدل مخفی مارکوف
1-5- یک مثال واقعی
1-6- سه مساله اصلی
1-7- انواع مدل های مخفی مارکوف و HMM پیوسته
1-8- مدل مخلوط گوسی
1-9- فرضیات تئوری مدل مخفی مارکوف
1-10- مساله ارزیابی و الگوریتم پیشرو (forward)
1-11- مساله کد گشایی و الگوریتم ویتربی (Viterbi Algorithm)
1-12- مساله یادگیری
1-12-1- معیار بیشترین شباهت(ML)
1-12-1-1- الگوریتم بام- ولش
1-12-1-2- الگوریتم حداکثر سازی امید ریاضی
1-12-1-3- روش مبتنی بر گرادیان
1-12-1-4- محاسبه گرادیان برحسب پارامترهای احتمال حالات
1-12-1-5- محاسبه گرادیان برحسب پارامترهای احتمال حالات .
1-12-2- معیار ماکزیمم اطلاعات متقابل
1-12-2-1- محاسبه گرادیان برحسب احتمالات انتقال
1-12-2-2- گرادیان برحسب احتمالات مشاهدات
بخش دوم : مدل مارکوف مخفی در MATLAB
2-1- مثال تاس و سکه
2-2- دستور hmmgenerate
2-3- دستور hmmviterbi
2-4- دستور hmmestimate
2-5- دستور hmmtrain
2-6- دستور hmmdecode
بخش سوم : تشخیص گفتار با روش مدل مخفی مارکف (HMM)
3-1- استفاده از مدل HMM در شناسایی گفتار
3-2- استفاده از HMM در شناسایی کلمات جداگانه
3-2-1- آموزش 3-2-2- شناسایی
3-3- استفاده از مدل HMM در شناسایی گفتار پیوسته
3-3-1- آموزش مدل های HMM برای کاربرد شناسایی گفتار پیوسته
3-3-1-1- آموزش ML
3-3-1-2- آموزش MMI
3-3-2- شناسایی با استفاده از شناسایی کننده گفتار پیوسته
3-3-2-1- شناسایی مبتنی بر الگوریتم ویتربی
3-3-2-2- الگوریتم ساخت سطح Level Building .
3-3-2-3- جستجوی N-best
3-4- پردازش صدا