Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > پردازش صوت، گفتار و زبان طبيعی ! > پردازش سيگنال ديجيتال


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack (1) ابزارهاي تاپيک نحوه نمايش
قديمي ۰۳-۱۳-۱۳۸۷, ۰۹:۰۵ بعد از ظهر   1 links from elsewhere to this Post. Click to view. #1 (لینک دائم)
عضو جدید
 
آواتار m.kia83
 
تاريخ عضويت: ارديبهشت ۱۳۸۷
پست ها: 9
تشكرها: 0
47 تشكر در 7 پست
Lightbulb استخراج ویژگی های صوتی(2)

معرفی ویژگی های صوتی :


این مرحله در پردازش انواع سیگنال ها اجتناب ناپذیر می باشد.یک سیگنال در یک بازه زمانی حاوی داده های نامربوط بسیاری می باشد که به صورت مستقیم می توان از آنها برای طبقه بندی استفاده کرد.مشکل اصلی در این زمینه یافتن ویژگی های موثری است که به روند طبقه بندی سرعت و دقت بالاتری بخشند.زیرا ویژگی های ضعیف علاوه بر دشوار ساختن عملیات طبقه بندی ، موجب دریافت نتایج ضعیف می گردند.در این راستا در ادامه انواع ویژگی های سیگنال های صوتی به اجمال مورد بررسی قرار می گیرند.
ویژگی های طیفی

ویژگی های طیفی ویژگی هایی هستند که یک طیف را در بازه های زمانی کوچک قابل تمایز می سازند.این ویژگی ها به خصوص درباره طبقه بندی سیگنال های صوتی بسیار موثر می باشند.اگر چه ویژگی های متفاوتی در مسایل مختلف قابل بحث هستند ، اما در مورد موضوعاتی مانند تشخیص آوا ها و ابزار های موسیقی ویژگی های موقتی از جایگاه ویژه ای برخوردارند.
در استخراج ویژگی های طیفی فاز مربوط به طیف قابل حذف است و به این منجر به 50 در صد کاهش اطلاعات خواهد شد.همچنین ساختار مناسب طیف در اکثر مواقع قابل حذف می باشد.همچنین می توان بسیاری از اطلاعات نامربوط دیگر را حذف نمود.تنها چیزی که باقی می ماند طیف ضخیم مربوط به توزیع انرژی می باشد که در طبقه بندی سیگنال های صوتی از اهمیت بالایی بر خوردار می باشد و در واقع پایه ای برای تشخیص ویژگی های گفتار و آوا های صوتی می باشد.
ضرایب Cepstral

ضرایب Cepstral که با c(k) نشان داده می شوند یک راه بسیار مناسب برای مدل کردن توزیع انرژی طیف می باشند.این ضرایب به صورت زیر قابل محاسبه اند :
C(k)=IDFT{log|DFT{x(n)}|}
که DFT تبدیل فوریه و IDFT معکوس آن می باشد.در نرم افزار MATLAB این ضرایب به صورت زیر قابل محاسبه اند :
c = real(ifft( log( abs( fft(x)))));
از آنجا که دقت عددی تولید شده بسیار کم اهمیت می باشد در فرمول بالا جز حقیقی به عنوان c در نظر گرفته شده است.
ضرایب Cepstral در فریم های کوتاهی در طول زمان محاسبه می شوند که البته مدل های محاسبه شده با محاسبه میانگین و واریانس هر ضریب در طول زمان قابل افزایش است.فقط از M ضریب اول Cepstral به عنوان ویژگی استفاده می شود.در مورد این ضرایب نکات زیر حائز اهمیت است :
• در صورت استفاده از کلیه ضرایب طیف به صورت دقیق به دست می آید.
• شمای طیف ضخیم با استفاده از ضرایب ابتدایی به دست می آید.
• دقت مدل سازی با توجه به تعداد ضرایب تعیین می شود.
• اولین ضریب که انرژی می باشد دور انداخته می شود.
معمولا M=f/2000 تخمین خوبی برای M می باشد که f در این فرمول فرکانس می باشد.


مشکل عمده در استفاده از ضرایب Cepstral خطی بودن مقیاس فرکانس می باشد.زیرا معمولا فرکانس هایی که در محدوده 100 تا 200 هرتز و 10 تا 20 کیلو هرتز هستند دارای اهمیت می باشند که ضرایب Cepstral این محدوده را به حساب نمی آورند.در این شرایط به نظر می آید که مقیاس لگاریتمی از فرکانس بتواند عملکرد بهتری داشته باشد.برای حل این مشکل باید توجه داشت که عمدتا ما به دنبال تشابهات و عدم تشابهات در مورد ادراک ها برای طبقه بندی هستیم ضمن اینکه ویژگی های مرتبط استخراج شده از این ادراک ها ما را به سمت یک کلاس بندی مطلوب هدایت می کند.بنابراین در راستای رسیدن به هدف نیاز به مرغوب سازی ویژگی ها با اعمال اندکی تغییر در آنها احساس می شود. البته باید توجه داشت که اعمال تغییرات کوچک در ویژگی ها منجر به اعمال تغییرات کوچک در داده های ادراکی می شود(و بالعکس).به دلیل پایین بودن وضوح این تغییرات به خاطر مناسب نبودن مقیاس نیاز به ضرایبی با درجه وضوح بالاتری در نشان دادن این تغییرات جزیی داریم . این نیاز منجر به استفاده از ضرایب جدیدی تحت عنوان ضرایب Mel-frequency cepstralمی شود که به طور کامل کمبود های یاد شده را پوشش می دهد.در ادامه به بررسی تاثیر انواع مقیاس ها بر روی کیفیت خواهیم پرداخت.


حال اگر در حوزه فرکانسی از مقیاس لگاریتمی استفاده شود به این ترتیب فاصله بین نت ها با وضوح بیشتری نسبت به حالت قبل قبل قابل مشاهده است.در واقع به داده های ادراکی نزدیک تر است.

همانطور که دیده شد استفاده از مقیاس لگاریتمی در دامنه و فرکانس منجر به وضوح بیشتر می شود.اعمال این تغییر بر روی ضرایب Cepstral منتهی به تولید یک سری از ویژگی های جدیدی خواهد شد که در قسمت بعد به آن پرداخته خواهد شد.
m.kia83 آفلاين است   پاسخ با نقل قول
از m.kia83 تشكر كرده اند:
1mega (۱۱-۱۳-۱۳۹۱), hotanyahya (۰۵-۱۶-۱۳۸۸), kamran.amini (۰۹-۱۳-۱۳۹۰), khabar22 (۰۹-۱۷-۱۳۹۱), masood (۰۵-۹-۱۳۹۲), s-sharifi (۰۷-۱۵-۱۳۹۱), sama1212 (۰۳-۱۲-۱۳۹۰), samiran90 (۰۸-۴-۱۳۹۲)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۳-۲۲-۱۳۹۰, ۰۲:۴۹ بعد از ظهر   #2 (لینک دائم)
عضو فعال
 
آواتار sama1212
 
تاريخ عضويت: دي ۱۳۸۹
پست ها: 15
تشكرها: 16
6 تشكر در 3 پست
پيش فرض

اگه برای استخراج ویژگی ها از نرم افزار متلب استفاده کرده ایدممنون میشم راهنماییم کنید
sama1212 آفلاين است   پاسخ با نقل قول
از sama1212 تشكر كرده است:
khabar22 (۰۹-۱۷-۱۳۹۱)
قديمي ۰۴-۲۴-۱۳۹۲, ۰۲:۵۴ بعد از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار mahsa safa
 
تاريخ عضويت: تير ۱۳۹۲
پست ها: 1
تشكرها: 0
0 تشكر در 0 پست
پيش فرض

سلام ... کسی میتونه در زمینه شناسایی احساسات در گفتار با شبکه عصبی کمکم کنه؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
ممنوون میشم
mahsa safa آفلاين است   پاسخ با نقل قول
قديمي ۰۴-۲۴-۱۳۹۲, ۰۷:۱۲ بعد از ظهر   #4 (لینک دائم)
عضو فوق فعال
 
آواتار kamran_kenzo
 
تاريخ عضويت: تير ۱۳۸۹
محل سكونت: Tehran
پست ها: 190
تشكرها: 4
91 تشكر در 74 پست
پيش فرض

نقل قول:
نوشته اصلي بوسيله mahsa safa نمايش پست
سلام ... کسی میتونه در زمینه شناسایی احساسات در گفتار با شبکه عصبی کمکم کنه؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
ممنوون میشم
شناسایی احساسات هم مانند خیلی از مسائل یکی مسئله دسته بندی است (مثلا غمگین، ترسیده، خوشحال وغیره).
در ابتدا نیاز به داده هایی دارید که در آنها احساس مشخص باشد تا بتوانید توسط آن یک دسته بند بسازید. از سیگنال های گفتار ویژگی ها مناسب را استخراج کنید سپس با استفاده از ویژگی های استخراج شده و احساس مربوط به هرکدام دسته بند را آموزش دهید. پس از آن سیستم شما آماده است تا با دادن یک داده جدید احساس را مشخص کند.
kamran_kenzo آفلاين است   پاسخ با نقل قول
پاسخ

LinkBacks (?)
LinkBack to this Thread: http://artificial.ir/intelligence/thread45.html
نوشته شده توسط For Type تاريخ
اهمیت هوش مصنوعی This thread Refback ۰۹-۱۲-۱۳۸۷ ۱۲:۳۲ بعد از ظهر


كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۵:۳۳ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design