Оптимизация параметров алгоритма подавления поздней реверберации
##plugins.themes.bootstrap3.article.main##
Аннотация
Показано существование оптимальных, в смысле таких критериев как точность распознавания речи и качество речи, значений границы между ранними отражениями и поздней реверберацией. Если оптимальное значение границы выбрано, использование метода logMMSE для подавления поздней реверберации позволяет повысить точность распознавания речи с 22 ... 30% до 56 ... 74%, а качество речи PESQ - с 2.281 до 2,33.
Библ. 6 , рис. 4.
##plugins.themes.bootstrap3.article.details##
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, публикующиеся в данном журнале, соглашаются со следующими условиями:- Авторы сохраняют за собой права на авторство своей работы и предоставляют журналу право первой публикации этой работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылокой на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы сохраняют право заключать отдельные договора на неэксклюзивное распространение работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном архиве учреждения или публиковать в составе монографии), с условием сохраниения ссылки на оригинальную публикацию в этом журнале.
- Политика журнала разрешает и поощряет размещение авторами в сети Интернет (например в институтском хранилище или на персональном сайте) рукописи работы как до ее подачи в редакцию, так и во время ее редакционной обработки, так как это способствует продуктивной научной дискуссии и положительно сказывается на оперативности и динамике цитирования статьи (см. The Effect of Open Access).
Библиографические ссылки
Naylor P., Gaubitch N. (2010), “Speech Der-everberation”. Springer.
Habets E.A.P. (2007), “Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement”. Ph.D Thesis. Eindho-ven.
Ephraim Y., Malah D. (1985), “Speech En-hancement Using a Minimum Mean-Square Er-ror Log-Spectral Amplitude Estimator”. IEEE Transactions on Acoustic, Speech, and Signal Processing. Vol. ASSP-33. No. 2. Pp. 443-445.
Loizou P. (2007), “Speech enhancement: The-ory and Practice”. Boca Raton: CRC Press.
Young S. (2005), “The HTK Book”. Cambridge University Engineering Department. [Online]. Available: http://htk.eng.cam.ac.uk/download.shtml
Brooks M. (2010), “VOICEBOX: Speech Proc-essing Toolbox for MATLAB”. [Online]. Avail-able: