Программный инструментарий для тестирования систем обработки речевых сигналов. Часть 2. Оценка эффективности
##plugins.themes.bootstrap3.article.main##
Аннотация
Предложен состав программного инструментария для исследований и оптимизации алгоритмов систем коррекции и кодирования речевых сигналов, подверженных различного рода искажениям, таким как шумовая и реверберационная помехи, ошибки кодирования. В первой части данной работы рассмотрен инструментарий, позволяющий решать такие задачи как создание корпусов зашумленной речи и коррекция зашумленных речевых сигналов. В данной, второй части работы, предложен программный инструментарий для аттестации тестируемых систем обработки речевых сигналов по таким критериям как качество и разборчивость речи, достоверность автоматического распознавания речи. Разработанный инструментарий является неоднородным: часть вычислений производится в среде Matlab, а часть – вне этой среды. Несмотря на указанную особенность, данный инструментарий позволяет совместно использовать все необходимые программные компоненты, что обеспечивает сквозную автоматизацию обработки речевых сигналов, начиная от их намеренного искажения, последующей коррекции – и заканчивая оценкой качества восстановленных речевых сигналов.
Библ. 6, рис. 2.
##plugins.themes.bootstrap3.article.details##
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, публикующиеся в данном журнале, соглашаются со следующими условиями:- Авторы сохраняют за собой права на авторство своей работы и предоставляют журналу право первой публикации этой работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылокой на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы сохраняют право заключать отдельные договора на неэксклюзивное распространение работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном архиве учреждения или публиковать в составе монографии), с условием сохраниения ссылки на оригинальную публикацию в этом журнале.
- Политика журнала разрешает и поощряет размещение авторами в сети Интернет (например в институтском хранилище или на персональном сайте) рукописи работы как до ее подачи в редакцию, так и во время ее редакционной обработки, так как это способствует продуктивной научной дискуссии и положительно сказывается на оперативности и динамике цитирования статьи (см. The Effect of Open Access).
Библиографические ссылки
(2012), “POLQA Application Guide”. Germany. HEAD acoustics GmbH, P. 29.
(2007), “Recommendation ITU-T P.863”. Switzerland. Geneva, P. 76.
Loizou P. (2007), “Speech enhancement: Theory and Practice”. Boca Raton: CRC Press, p. 632.
Simulation of Acoustic Environments Including the Transmission over Telephone Channels. [On-line]. – Available: http://dnt.kr.hsnr.de/sireac.html (21.05.2013).
Jacob Benesty, M. Mohan Sondhi, Yiteng Huang. (2008), “Springer Handbook of Speech Processing”. Berlin: Springer-Verlag, P. 1176.
VoiceBox: Speech Processing Toolbox for MATLAB. [On-line]. Available: http://www.ee.ic.ac.uk/hp/staff/dmb/ (21.05.2013)