Об'єктивне оцінювання якості мовленнєвих сигналів, обмеже-них смугою частот
Основний зміст сторінки статті
Анотація
Експериментально отримані залежності об'єктивних оцінок якості мовленнєвого сигналу від смуги частот, що займає сигнал. У рамках даної задач виконано співставлення розглянутих показників якості мовленнєвого сигналу. Показано, що прості в обчислювальному відношенні показники у вигляді сегментного відношення сигнал-шум (SSNR) і логарифмічно-спектральних спотворень (LSD) можуть неадекватно реагувати на зміну смуги частот. Значно коректніше поводяться більше складні в обчислювальному плані перцептуальні показники, такі як барк-спектральні спотворення (BSD) й перцептуальна оцінка якості мовлення (PESQ), що дозволяє, в остаточному підсумку, уточнити реальні потреби слухової системи людини до сприйняття мовлення.
Бібл.14, рис. 5.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
Beerends J., Wijngaarden S., Buuren R. Extension of ITU-T Recommendation P.862 PESQ towards Measuring Speech Intelligibility with Vocoders. New Directions for Improving Audio Effectiveness // Meeting Proceedings RTO-MP-HFM-123, Paper 10, P.10-1–10-6. Neuilly-sur-Seine, France: RTO. [Online]. Available: http://www.rto.nato.int/abstracts.aps
Blauert J., ed. Communication acoustics. – Springer-Verlag Berlin Heidelberg, 2005. – 385 p.
Cote N. Integral and diagnostic intrusive prediction of speech - Springer-Verlag Berlin Heidelberg, 2011. – 267 p.
Ellis D. PLP and RASTA in Matlab // [Online]. Available: http://www.ee.columbia.edu/~dpwe/resources/matlab/rastamat/
Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech // J. Acoust. Soc. America. – 1990. – Vol. 87. – P. 1738-1753.
Loizou P. Matlab Software. PESQ and other objective measures for evaluating quality of speech // [Online]. Available: http://ecs.utdallas.edu/loizou/speech/software.htm
Moller S. Quality of Telephone-Based Spoken Dialogue Systems – Springer Science + Business Me-dia, Inc., 2005. – 490 p.
Naylor P., Gaubitch N. Speech Dereverberation. – Springer, 2010. – 399 p.
Next-Generation (3G/4G) Voice Quality Testing with POLQA®. White Paper. – Rohde & Schwarz, 2012. – 22 p.
Perceptual Evaluation of Speech Quality (PESQ) ITU-T Recommendations P.862, P.862.1, P.862.2. Version 2.0 – October 2005.
Perceptual Objective Listening Quality Assessment (POLQA) ITU-T Recommendations P.863 – Janu-ary 2011.
Prodeus A. PESQ Matlab Driver // MathWorks, 2014. [Online]. Available: http://www.mathworks.com/matlabcentral/fileexchange/47333-pesq-matlab-driver
Raake A. Speech Quality of VoIP. Assessment and Prediction. – John Wiley, 2006. - 338 p.
Recommendation P.862. Amendment 2 (11/05), 2011. [Online]. Available: http://www.itu.int/rec/T-REC-P.862-200511-I!Amd2/en