بهبود بازشناسي گفتار توسط شبکههاي عصبي دربرگيرنده الگوهای زمانی
بهبود بازشناسي گفتار توسط شبکههاي عصبي دربرگيرنده الگوهای زمانی
الگوهاي زماني يا "Temporal Patterns" از جمله ويژگي هاي موثر در بهبود بازشناسي گفتار مي باشند. از آنجا كه شبكه هاي عصبي MLP جزو طبقه بندي كننده هاي قدرتمند استاتيك مي باشند، اگر بخواهيم از اين نوع ساختار شبكه اي در بازشناسي گفتار استفاده كنيم، بهتر است به هر صورت ممكن، شبكه را وادار سازيم، الگوهاي زماني را از دنبالة ويژگيهاي ورودي يادگيري نموده و آن را در فرآيند دسته بندي قاب هاي ورودي گفتار دخالت دهد. در اين مقاله، با بررسي و آزمايش اين شبكه و مدل هاي ديگر شبكه ايِ كه به صورتي قوي تر به پردازش و يادگيري ويژگيهاي مبتني بر الگوهاي زماني مي پردازند، سعي در افزايش كارايي سيستم هاي بازشناس گفتار پيوسته و مستقل از گوينده خواهيم داشت. همچنين به تحليل نوع عملكرد اين روش ها و مدل هاي مبتني بر آ ن ها خواهيم پرداخت. با در نظر گرفتن نتايج يك مدل پايه بازشناس "TDNN" كه بازدهي حدود 83,7 % بر روي دادة تست انتخابي ما از دادگان فارس دات داشته است، با استفاده از يك مدل تركيبي ارائه شده در تحقيق حاضر، ميزان بازشناسي 88,1 % در دادگان آزمون تميز حاصل شده است. در حالي كه مدل تركيبي پيشنهادي، نسبت به مدل پايه بازشناس "TDNN" در شرايط نويز شديد، بين 7 تا 20 درصد مقاوم تر از شبكة "TDNN" عمل مي نمايد. همچنين مدل تركيبي ديگري معرفي مي گردد كه به علت استفادة متمركزتر از ويژگي الگوهاي زماني، مقاوم تر از مدل تركيبي اوليه، در شرايط نويز شديد عمل مينمايد
|