Оцінка впливу нелінійності фазової частотної характеристики системи на якість мовленнєвих сигналів
Основний зміст сторінки статті
Анотація
Показано, що для слухової системи людини прийнятними є фазові спотворення мовленнєвих сигналів, якщо максимальна різниця групових часів затримки в області високих і низьких частот не перевищує 50 мс - при такій різниці групових часів затримки інтерференція між суміжними голосними й приголосними звуками є практично непомітною на слух. Вказано значення об'єктивних показників якості мовлення у вигляді сегментного відношення сигнал-шум (SSNR), логарифмічно-спектральних спотворень (LSD), барк-спектральних спотворень (BSD) і перцептуальної оцінки якості мовлення (PESQ), що відповідають знайденому граничному значенню 50 мс. Бібл. 7, рис. 6, табл. 1.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
Edited by Martin R., Heute U. and Antweiler C. (2008), Advances in Digital Speech Transmission. John Wiley & Sons Ltd, England, P. 572.
Blauert J. (1978), Group delay distortions in electroacoustical systems. J. Acoust. Soc. Am. Vol.63, No.5. Pp. 1478-1483.
Habets E.A.P. (2007), Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement. PhD dissertation, Eindhoven, P. 257.
Perceptual Evaluation of Speech Quality (PESQ) ITU-T Recommendations P.862, P.862.1, P.862.2. Version 2.0. October 2005.
Didovskiy V.S., Didovskaia M.V., Prodeus A.N. (2008), “Acoustic assessment of speech communication channels. Monograph,” K.: Imex-Ltd, P. 420. (Rus)
Oppenheim A., Schafer R. (2006), “Digital signal processing,” M.: Techospera, P. 858. (Rus)
Smirnova N.S., Chistikov P.G. (2011), “Phonetic analysis program in statistics in Russian texts and its use for applications in the field of speech technology,” Proc. XXVII Intern. Conf. «Dialog», M., Pp. 632-644 (Rus)