ّرنامه نویسی
			 
			 
			
		
		
		
			
			[INDENT][RIGHT]پردازش و شناسایی گفتار 
تمرین شماره 1 
در متلب برنامه اي براي رسم اسپکتروگرام سیگنال گفتار بنویسید. براي کد خود پارامتر طول پنجره را متغیر در 
نظر بگیرید و اسپکتروگرام باریک باند و پهن باند حاصل از برنامه خود را با نتیجه حاصل از نرم افزار 
براي نگاشت به حوزه فرکانس از تابع wavesurfer 
متلب استفاده نمایید. FFT مقایسه نمایید.  
پردازش و شناسایی گفتار 
تمرین شماره 2 
1 - یک تابع براي برچسبگذاري قطعات گفتاري سکوت، واکدار و بیواك در گفتار بنویسید. در تابع خود از 
اطلاعات فرکانس گام، انرژي و نرخ عبور از صفر به دلخواه می توانید استفاده کنید. 
2 - در مورد مزیت استفاده از هر یک از این اطلاعات در تقطیع محتواي گفتاري و به عبارتی تشخیص 
بحث کنید. (voice Activity Detection) فعالیتهاي گفتار 
را به نمونه هایی از (white noise) نویز سفید ADD_Noise_From_File 3 - با استفاده از تابع 
10 و 20 دسیبل اعمال کنید. نتیجه پیاده سازي خود را براي کشف ، برابر 5 SNR سیگنال گفتار با 
فعالیتهاي گفتاري در فایل نویزي شده بررسی نمایید و در مورد برتري ویژگیهاي فوق الذکر در این 
حالت نیز بحث نمایید. 
در این تمرین و تمام تمرینهاي بعد طول فریمها را 30 ، همپوشانی را 20 و پنجره را از نوع همینگ در نظر 
بگیرید. 
92/10. 
پردازش و شناسایی گفتار 
تمرین شماره 3 و 4 
1 - یک جمله دلخواه ضبط نمایید. 
بدست آورید. (اندازه فریمها را 30 میلی Matlab 2 - براي گفتار فوق ویژگیهاي زیر را به کمک نرم افزار 
ثانیه و همپوشانی فریمها را 20 میلی ثانیه در نظر بگیرید.) 
ضرایب پیشگویی خطی به روش اتوکورولیشن .a 
LPCC ضرایب .b 
را دانلود نمایید. دقت داشته باشید که کدهاي اجرایی HTK 3 - براي تمرینهاي بعدي لازم است که ابزار 
(باینري) این ابزار براي تمرین جاري کافی است و نیازي به کامپایل و استفاده از کدهاي منبع وجود 
ندارد. 
در آدرس HTKbook مستندات این جعبه ابزار که با نام .a 
موجود است nesl.ee.ucla.edu/projects/ibadge/docs/ASR/htk/htkbook.pdf 
براي استخراج ویژگی استفاده می شود. ابزار Hcopy را مطالعه نمایید. از این جعبه ابزار برنامه 
را مطالعه کرده و تنظیمات لازم براي استخراج ویژگیهاي زیر را انجام دهید و Hcopy 
ویژگیهاي مذکور را بدست آورید. (اندازه فریمها را 30 میلی ثانیه و همپوشانی فریمها را 20 
میلی ثانیه در نظر بگیرید.) 
ضرایب پیشگویی خطی به روش اتوکورولیشن .i 
LPCC ضرایب .ii 
MFCC ضرایب .iii 
MFCC مشتقات اول و دوم ضرایب .iv 
ویژگیهاي ذکر شده در بالا را به فرمت متنی تبدیل نموده و لیست HList با استفاده از دستور .b 
کنید. 
4 - نتایج حاصل از بندهاي 1 و 3 را با یکدیگر مقایسه کنید. 
92/12 
پردازش و شناسایی گفتار 
تمرین شماره 5 
بیان نمایید. فرمتهاي اول تا سوم این واکه را استخراج کنید. /u/ شامل واکه .wav 1 - یک فایل 
2 - عبارت "ما او را دوستدار خود می دانستیم" را ضبط نمایید. 
3 - با استفاده از ویژگیهایی مانند انرژي و نرخ عبور از صفر محل واکه هاي موجود در گفتار فوق را 
را در تمام طول گفتار تعیین /u/ تشخیص دهید و سپس با استفاده از فرمنتها محل احتمالی واکه 
کنید.]
		 
		
		
		
		
		
		
		
	 |