Объективное оценивание качества речевых сигналов, ограниченных по полосе частот
##plugins.themes.bootstrap3.article.main##
Аннотация
Экспериментально получены зависимости объективных оценок качества речевого сигнала от полосы частот, занимаемой сигналом. В рамках данной задачи произведено сопоставление рассмотренных показателей качества речевого сигнала. Показано, что простые в вычислительном отношении показатели в виде сегментного отношения сигнал-шум (SSNR) и логарифмически-спектральных искажений (LSD) могут неадекватно реагировать на изменение полосы частот. Значительно корректнее ведут себя более сложные в вычислительном плане перцептуальные показатели, такие как барк-спектральные искажения (BSD) и перцептуальная оценка качества речи (PESQ), что позволяет, в конечном счете, уточнить реальные требования слуховой системы человека к восприятию речи.
Библ. 14 , рис. 5.
##plugins.themes.bootstrap3.article.details##
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, публикующиеся в данном журнале, соглашаются со следующими условиями:- Авторы сохраняют за собой права на авторство своей работы и предоставляют журналу право первой публикации этой работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылокой на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы сохраняют право заключать отдельные договора на неэксклюзивное распространение работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном архиве учреждения или публиковать в составе монографии), с условием сохраниения ссылки на оригинальную публикацию в этом журнале.
- Политика журнала разрешает и поощряет размещение авторами в сети Интернет (например в институтском хранилище или на персональном сайте) рукописи работы как до ее подачи в редакцию, так и во время ее редакционной обработки, так как это способствует продуктивной научной дискуссии и положительно сказывается на оперативности и динамике цитирования статьи (см. The Effect of Open Access).
Библиографические ссылки
Beerends J., Wijngaarden S., Buuren R. Extension of ITU-T Recommendation P.862 PESQ towards Measuring Speech Intelligibility with Vocoders. New Directions for Improving Audio Effectiveness // Meeting Proceedings RTO-MP-HFM-123, Paper 10, P.10-1–10-6. Neuilly-sur-Seine, France: RTO. [Online]. Available: http://www.rto.nato.int/abstracts.aps
Blauert J., ed. Communication acoustics. – Springer-Verlag Berlin Heidelberg, 2005. – 385 p.
Cote N. Integral and diagnostic intrusive prediction of speech - Springer-Verlag Berlin Heidelberg, 2011. – 267 p.
Ellis D. PLP and RASTA in Matlab // [Online]. Available: http://www.ee.columbia.edu/~dpwe/resources/matlab/rastamat/
Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech // J. Acoust. Soc. America. – 1990. – Vol. 87. – P. 1738-1753.
Loizou P. Matlab Software. PESQ and other objective measures for evaluating quality of speech // [Online]. Available: http://ecs.utdallas.edu/loizou/speech/software.htm
Moller S. Quality of Telephone-Based Spoken Dialogue Systems – Springer Science + Business Me-dia, Inc., 2005. – 490 p.
Naylor P., Gaubitch N. Speech Dereverberation. – Springer, 2010. – 399 p.
Next-Generation (3G/4G) Voice Quality Testing with POLQA®. White Paper. – Rohde & Schwarz, 2012. – 22 p.
Perceptual Evaluation of Speech Quality (PESQ) ITU-T Recommendations P.862, P.862.1, P.862.2. Version 2.0 – October 2005.
Perceptual Objective Listening Quality Assessment (POLQA) ITU-T Recommendations P.863 – Janu-ary 2011.
Prodeus A. PESQ Matlab Driver // MathWorks, 2014. [Online]. Available: http://www.mathworks.com/matlabcentral/fileexchange/47333-pesq-matlab-driver
Raake A. Speech Quality of VoIP. Assessment and Prediction. – John Wiley, 2006. - 338 p.
Recommendation P.862. Amendment 2 (11/05), 2011. [Online]. Available: http://www.itu.int/rec/T-REC-P.862-200511-I!Amd2/en