استخراج ویژگی های صوتی(1)
هدف از پردازش سیگنال های صوتی طبقه بندی آنها می باشد . مسایل مرتبط با طبقه بندی سیگنال های صوتی در دنیای امروز عموما در راستای حل مسائل یاد شده در زیر مطرح می باشند :
• دسته بندی اصوات موسیقی
• دسته بندی نوع موسیقی
• آوا نویسی ابزار موسیقی
• تقسیم بندی موسیقی
• تشخیص گوینده
• تشخیص زبان
• بازیابی صدا
• تشخیص مفهوم
• تقسیم بندی تصاویر با استفاده از صدا و ...
اما در مورد پردازش سیگنال های صوتی مربوط به انسان شاید گام اول تقسیم بندی این سیگنال های polyphonic می باشد که در این زمینه روش های متنوعی وجود دارد.اما این روش ها دارای یک هسته اصلی می باشند که در ادامه به آن پرداخته می شود.
اولین گام در طبقه بندی استخراج ویژگی هایی است که قرار است طبقه بندی بر اساس آن انجام شود.هر چقدر ویژگی های استخراج شده بتوانند تمایز بین سیگنال های مختلف را بهتر نشان دهند به طبع عملیات طبقه بندی با سهولت و کارایی بالاتری امکان پذیر است.با توجه به این مطالب می توان عمده عملیات تشخیص سیگنال اعم از صوتی و ... را در دو بخش اساسی قرار داد :
• استخراج ویژگی ها
• طبقه بندی بر اساس مدل ها
در بخش طبقه بندی استفاده از مدل های آماری و در واقع یافتن یک مدل معتبر در مورد سیگنال های موجود می تواند کاری بس دشوار و سنگین ،همراه با محاسبات بالا باشد.در این راستا به منظور طبقه بندی می توان از مدل های معتبر موجود مثل HMM و یا روش های مبتنی بر شبکه های عصبی استفاده کرد.حال اگر فرض را در این مرحله بر استفاده از شبکه های عصبی قرار دهیم این بخش خود به دو زیر بخش تقسیم می شود :
• آموزش شبکه بر مبنای نمونه های موجود
• تقسیم بندی نمونه های جدید با استفاده از شبکه آموزش دیده
در پست بعدی با چند نمونه از ویژگی های صوتی آشنا خواهیم شد.
|