ANFIS بازشناسي احساسات انسان با استفاده از شبكه عصبي– فازي
در اين مقاله به بررسي موضوع بازشناسي احساسات در گفتار انسان با در نظر گرفتن خصوصيات زبان و فرهنگ فارسي مي پردازيم. اين موضوع به دليل افزايش روزافزون تراكنش ميان ماشين و انسان و نياز به محاوره خودكار اين دو و حذف اپراتور انساني اهميت ويژه اي در مباحث هوش مصنوعي يافته است. اما موضوعي كه ما مورد توجه قرار داده ايم تاثير فرهنگ و هنجارهاي اجتماعي در بروز احساسات هنگام جمع آوري داده و سپس بازشناسي احساسات با در نظر گرفتن ويژگيهاي فرهنگ محلي و زبان مي باشد. روش پيشنهادي ما يك روش تركيبي با استفاده از (Adaptive Neural Network Fuzzy Inference System) ANFIS مي باشد كه بر روي دو دسته از ويژگيهاي متفاوت صوت حاوي احساسات پياده سازي و نتايج آن با يكديگر مقايسه شده است. داده هاي مورد استفاده در اين مقاله با حفظ خصوصيات محلي فرهنگ و زبان فارسي و در محيط داراي نويز معمول توسط گوينده واحد جمع آوري شده اند و ويژگيهاي استخراج شده از آنها در سطح زيركلمه (Subword) به دو دسته تقسيم مي شوند. دسته اول شامل طول و ضرايب (linear prediction filter coefficients) LPC و دسته دوم شامل طول و خصوصيات فركانسي سيگنالهاي صوت )كه با استفاده از سري فوريه استخراج شده( مي باشد، نتايج بدست آمده نشان مي دهد كه استفاده از ويژگيهاي فركانسي صوت به همراه شبكه ANFIS جوابهاي بهتري نسبت به استفاده از ويژگيهاي LPC صوت و همچنين ساير روشهاي بكار گرفته شده در تحقيقات مشابه كه در اين زمنيه انجام شده است ارائه مي كند.
|