تعيين تعداد گويندگان در فايل گفتاري به منظور رديابي گوينده به كمك الگوريتم خوشه بندي
تعيين تعداد گويندگان در فايل گفتاري به منظور رديابي گوينده به كمك الگوريتم خوشه بندي كلوني مورچه ها
خلاصه مقاله:
در اكثر روشهاي خوشه بندي فرض ميشود كه تعداد دقيق خوشهها در آغاز مشخص است، كه البته اين فرض در بيشتر مواقع صحت ندارد. در رديابي و خوشهبندي گفتار مبتني بر گوينده عمدتا ما اطلاعي از تعداد دقيق گويندهها در قطعه گفتاري نداريم. در اين مقاله روشي مبتني بر الگوريتم خوشه بندي كلوني مورچهها به منظور تعيين تعداد گويندگان در يك فايل گفتاري و خوشهبندي قطعات مربوط با هر يك از گويندگان پيشنهاد شده است. الگوريتم كلوني مورچهها يك الگوريتم شبه تصادفي است كه قادر به تخمين تعداد خوشههاي مناسب براي يك مجموعه از دادههاي ورودي ميباشد. در روشي كه در اين مقاله پيشنهاد ميگردد، در ابتدا به كمك الگوريتم مورچهها يك خوشهبندي اوليه از قطعات گفتاري ايجاد ميشود و تعداد گويندگان موجود در گفتار تخمين زده ميشود. سپس با استفاده از روشهاي خوشهبندي متداول، خوشهبندي قطعات گفتاري انجام ميگردد. همچنين در اين مقاله روشي پيشنهاد ميشود كه با كمك آنها بتوان تعداد تخمين زده شده از گويندگان را به مقدار صحيح نزديكتر نمود.
كلمات كليدي:
رديابي گوينده، كلوني مورچه ها، معيار اطلاعات بيز.