Програмний інструментарій для тестування систем обробки мовленнєвих сигналів. Частина 2. Оцінка ефективності
Основний зміст сторінки статті
Анотація
Запропоновано склад програмного інструментарію для досліджень і оптимізації алгоритмів систем корекції й кодування мовленнєвих сигналів, що піддані різного роду спотворенням, таким як шумова й ревербераційна перешкоди, помилки кодування. У першій частині даної роботи розглянуто інструментарій, що дозволяє розв’язувати такі завдання як створення корпусів зашумленої мови й корекція зашумлених мовленнєвих сигналів. У даній, другій частині роботи, запропоновано програмний інструментарій для атестації систем обробки мовних сигналів, що піддаються тестуванню, за такими критеріями як якість і розбірливість мовлення, достовірність автоматичного розпізнавання мовлення. Розроблений інструментарій є неоднорідним: частина обчислень виконується в середовищі Matlab, а частина - поза цим середовищем. Незважаючи на зазначену особливість, даний інструментарій дозволяє спільно використовувати всі необхідні програмні компоненти, що забезпечує наскрізну автоматизацію обробки мовленнєвих сигналів, починаючи від їхнього навмисного спотворення, наступної корекції - і закінчуючи оцінкою якості відновлених мовленнєвих сигналів.
Бібл. 6, рис. 2.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
(2012), “POLQA Application Guide”. Germany. HEAD acoustics GmbH, P. 29.
(2007), “Recommendation ITU-T P.863”. Switzerland. Geneva, P. 76.
Loizou P. (2007), “Speech enhancement: Theory and Practice”. Boca Raton: CRC Press, p. 632.
Simulation of Acoustic Environments Including the Transmission over Telephone Channels. [On-line]. – Available: http://dnt.kr.hsnr.de/sireac.html (21.05.2013).
Jacob Benesty, M. Mohan Sondhi, Yiteng Huang. (2008), “Springer Handbook of Speech Processing”. Berlin: Springer-Verlag, P. 1176.
VoiceBox: Speech Processing Toolbox for MATLAB. [On-line]. Available: http://www.ee.ic.ac.uk/hp/staff/dmb/ (21.05.2013)