ّرنامه نویسی
[INDENT][RIGHT]پردازش و شناسایی گفتار
تمرین شماره 1
در متلب برنامه اي براي رسم اسپکتروگرام سیگنال گفتار بنویسید. براي کد خود پارامتر طول پنجره را متغیر در
نظر بگیرید و اسپکتروگرام باریک باند و پهن باند حاصل از برنامه خود را با نتیجه حاصل از نرم افزار
براي نگاشت به حوزه فرکانس از تابع wavesurfer
متلب استفاده نمایید. FFT مقایسه نمایید.
پردازش و شناسایی گفتار
تمرین شماره 2
1 - یک تابع براي برچسبگذاري قطعات گفتاري سکوت، واکدار و بیواك در گفتار بنویسید. در تابع خود از
اطلاعات فرکانس گام، انرژي و نرخ عبور از صفر به دلخواه می توانید استفاده کنید.
2 - در مورد مزیت استفاده از هر یک از این اطلاعات در تقطیع محتواي گفتاري و به عبارتی تشخیص
بحث کنید. (voice Activity Detection) فعالیتهاي گفتار
را به نمونه هایی از (white noise) نویز سفید ADD_Noise_From_File 3 - با استفاده از تابع
10 و 20 دسیبل اعمال کنید. نتیجه پیاده سازي خود را براي کشف ، برابر 5 SNR سیگنال گفتار با
فعالیتهاي گفتاري در فایل نویزي شده بررسی نمایید و در مورد برتري ویژگیهاي فوق الذکر در این
حالت نیز بحث نمایید.
در این تمرین و تمام تمرینهاي بعد طول فریمها را 30 ، همپوشانی را 20 و پنجره را از نوع همینگ در نظر
بگیرید.
92/10.
پردازش و شناسایی گفتار
تمرین شماره 3 و 4
1 - یک جمله دلخواه ضبط نمایید.
بدست آورید. (اندازه فریمها را 30 میلی Matlab 2 - براي گفتار فوق ویژگیهاي زیر را به کمک نرم افزار
ثانیه و همپوشانی فریمها را 20 میلی ثانیه در نظر بگیرید.)
ضرایب پیشگویی خطی به روش اتوکورولیشن .a
LPCC ضرایب .b
را دانلود نمایید. دقت داشته باشید که کدهاي اجرایی HTK 3 - براي تمرینهاي بعدي لازم است که ابزار
(باینري) این ابزار براي تمرین جاري کافی است و نیازي به کامپایل و استفاده از کدهاي منبع وجود
ندارد.
در آدرس HTKbook مستندات این جعبه ابزار که با نام .a
موجود است nesl.ee.ucla.edu/projects/ibadge/docs/ASR/htk/htkbook.pdf
براي استخراج ویژگی استفاده می شود. ابزار Hcopy را مطالعه نمایید. از این جعبه ابزار برنامه
را مطالعه کرده و تنظیمات لازم براي استخراج ویژگیهاي زیر را انجام دهید و Hcopy
ویژگیهاي مذکور را بدست آورید. (اندازه فریمها را 30 میلی ثانیه و همپوشانی فریمها را 20
میلی ثانیه در نظر بگیرید.)
ضرایب پیشگویی خطی به روش اتوکورولیشن .i
LPCC ضرایب .ii
MFCC ضرایب .iii
MFCC مشتقات اول و دوم ضرایب .iv
ویژگیهاي ذکر شده در بالا را به فرمت متنی تبدیل نموده و لیست HList با استفاده از دستور .b
کنید.
4 - نتایج حاصل از بندهاي 1 و 3 را با یکدیگر مقایسه کنید.
92/12
پردازش و شناسایی گفتار
تمرین شماره 5
بیان نمایید. فرمتهاي اول تا سوم این واکه را استخراج کنید. /u/ شامل واکه .wav 1 - یک فایل
2 - عبارت "ما او را دوستدار خود می دانستیم" را ضبط نمایید.
3 - با استفاده از ویژگیهایی مانند انرژي و نرخ عبور از صفر محل واکه هاي موجود در گفتار فوق را
را در تمام طول گفتار تعیین /u/ تشخیص دهید و سپس با استفاده از فرمنتها محل احتمالی واکه
کنید.]
|