Прo вплив завад й параметрів налаштування на якість функціонування системи автоматичного розпізнавання мови
Основний зміст сторінки статті
Анотація
Розробку систем автоматичного розпізнавання мови доцільно робити з урахуванням впливу перешкод різної природи (шум акустичного оточення, реверберація, фільтрація й кодування мовного сигналу в системах зв'язку). В даній роботі експериментально досліджено вплив завад і деяких характеристик системи автоматичного розпізнавання мови на якість розпізнавання. Отримано рекомендації з оптимізації параметрів системи автоматичного розпізнавання мови для декількох сценаріїв її використання.
Бібл.10, рис. 1, табл.6.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
Audacity / [Online]. Available at: http://audacity.sourceforge.net. (Rus) (17.01.2013)
Documentation for HTK [Online]. Available at: http://htk.eng.cam.ac.uk/docs/docs.shtml. (17.01.2013).
Furui S. 50 years of progress in speech and speaker recognition [Online]. – Available at: http://www.furui.cs.titech.ac.jp/publication/2005/SPCOM05.pdf. (17.01.2013)
Nelson N. HTK MFCC Study. [Online]. Available at: http://speech-research.com/mfccStudy.html (17.01.2013).
Sony Sound Forge™ 10 Pro [Online]. Available at: http://www.sonycreativesoftware.com/.(17.01.2013)
Verbout S.M. Signal (1994), [Enhancement for Automatic Recognition of Noisy Speech]. Master degree dissertation for the degree of Master of Science. May, P.84.
A short course on HTK [Online]. Available at: http://www.speech.com.ua/htk_course.html. (Rus) (17.01.2013).
Prodeus А.N., Ladoshko O.N. (2007), [Optimization of speech recognition system algorithms with usage of НТК toolkit]. Electronics and Communication. no 4. pp. 53–60. (Rus)
Prodeus А.N., Litvinov S.V. (2009), [Modeling of Ukrainian speech recognition system with usage of НТК toolkit]. Electronics and Communication. no 1. pp. 88–94. (Rus)
Fonetic transcription. Modern Russian language [Online]. Available at: http://morfema.ru/publ/15-1-0-3. (Rus) (17.01.2013).