Оптимізація параметрів алгоритму ослаблення пізньої реверберації
Основний зміст сторінки статті
Анотація
Показано існування оптимальних, в сенсі таких критеріїв як точність розпізнавання мовлення та якість мовлення, значень границі між ранніми відлуннями та пізньою реверберацією. Якщо оптимальне значення границі є обраним, використання методу logMMSE для ослаблення дії пізньої реверберації дозволяє підвищити точність розпізнавання мовлення з 22...30% до 56...74%, а якість мовлення PESQ - з 2.281 до 2,33.
Бібл.6, рис. 4.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
Naylor P., Gaubitch N. (2010), “Speech Der-everberation”. Springer.
Habets E.A.P. (2007), “Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement”. Ph.D Thesis. Eindho-ven.
Ephraim Y., Malah D. (1985), “Speech En-hancement Using a Minimum Mean-Square Er-ror Log-Spectral Amplitude Estimator”. IEEE Transactions on Acoustic, Speech, and Signal Processing. Vol. ASSP-33. No. 2. Pp. 443-445.
Loizou P. (2007), “Speech enhancement: The-ory and Practice”. Boca Raton: CRC Press.
Young S. (2005), “The HTK Book”. Cambridge University Engineering Department. [Online]. Available: http://htk.eng.cam.ac.uk/download.shtml
Brooks M. (2010), “VOICEBOX: Speech Proc-essing Toolbox for MATLAB”. [Online]. Avail-able: