Оценка влияния нелинейности фазовой частотной характеристики системы на качество речевых сигналов
##plugins.themes.bootstrap3.article.main##
Аннотация
Установлено, что для слуховой системы человека приемлемыми являются фазовые искажения речевых сигналов, если максимальная разница групповых времен задержки в области высоких и низких частот не превышает 50 мс – в этом случае интерференция между смежными гласными и согласными звуками на слух практически незаметна. Указаны значения объективных показателей качества речи в виде сегментного отношения сигнал-шум (SSNR), логарифмически-спектральных искажений (LSD), барк-спектральных искажений (BSD) и перцептуальной оценки качества речи (PESQ), соответствующие найденному пороговому значению 50 мс. Библ. 7, рис. 6, табл. 1.
##plugins.themes.bootstrap3.article.details##
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, публикующиеся в данном журнале, соглашаются со следующими условиями:- Авторы сохраняют за собой права на авторство своей работы и предоставляют журналу право первой публикации этой работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылокой на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы сохраняют право заключать отдельные договора на неэксклюзивное распространение работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном архиве учреждения или публиковать в составе монографии), с условием сохраниения ссылки на оригинальную публикацию в этом журнале.
- Политика журнала разрешает и поощряет размещение авторами в сети Интернет (например в институтском хранилище или на персональном сайте) рукописи работы как до ее подачи в редакцию, так и во время ее редакционной обработки, так как это способствует продуктивной научной дискуссии и положительно сказывается на оперативности и динамике цитирования статьи (см. The Effect of Open Access).
Библиографические ссылки
Edited by Martin R., Heute U. and Antweiler C. (2008), Advances in Digital Speech Transmission. John Wiley & Sons Ltd, England, P. 572.
Blauert J. (1978), Group delay distortions in electroacoustical systems. J. Acoust. Soc. Am. Vol.63, No.5. Pp. 1478-1483.
Habets E.A.P. (2007), Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement. PhD dissertation, Eindhoven, P. 257.
Perceptual Evaluation of Speech Quality (PESQ) ITU-T Recommendations P.862, P.862.1, P.862.2. Version 2.0. October 2005.
Didovskiy V.S., Didovskaia M.V., Prodeus A.N. (2008), “Acoustic assessment of speech communication channels. Monograph,” K.: Imex-Ltd, P. 420. (Rus)
Oppenheim A., Schafer R. (2006), “Digital signal processing,” M.: Techospera, P. 858. (Rus)
Smirnova N.S., Chistikov P.G. (2011), “Phonetic analysis program in statistics in Russian texts and its use for applications in the field of speech technology,” Proc. XXVII Intern. Conf. «Dialog», M., Pp. 632-644 (Rus)