Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою

Основний зміст сторінки статті

Anastasiia Olehivna Harasiuk
Maksym Volodymyrovych Myronov
Vladyslav Valentynovych Lozinsky
Nguyen Thanh Vy
Alla Vitaliivna Darchuk
Arkadii Mykolaiovych Prodeus

Анотація

Результати акустичної експертизи приміщень та засобів зв’язку, що полягає в оцінюванні розбірливості мовних сигналів, є необхідними для сертифікації приміщень та комунікаційних систем. Оскільки технічні засоби звукоінженерів постійно змінюються й удосконалюються, а також з огляду на зростання переліку факторів, що можуть бути врахованими при оцінюванні розбірливості мови, зростає й кількість апаратно-програмних додатків для такого оцінювання. Таким чином, розробка математичного та програмного забезпечення для прогнозування та вимірювання розбірливості мови є актуальним завданням.

Найбільш поширеними на сьогодні є формантний та модуляційний методи оцінювання розбірливості мови. Формантний метод є дещо обмеженим, оскільки не дозволяє враховувати дію реверберації. Модуляційний метод, в якому мірою оцінювання розбірливості мови є індекс передачі мови (Speech Transmission Index), є вільним від цього недоліку. Тому в деяких роботах можна зустріти висловлювання про «застарілість» формантного методу. Проте, ретельне зіставлення потенційних можливостей формантного та модуляційного методів свідчить, що формантний метод перевершує свого конкурента за точністю і швидкістю обчислень в умовах, коли дія шуму переважає над дією реверберації. Найбільшого поширення набули такі версії формантного методу оцінювання розбірливості мови як індекс артикуляції (Articulation Index) й індекс розбірливості мови  (Speech Intelligibility Index). На території колишнього СРСР найбільш поширеними були версії формантного методу, розвинуті в наукових школах, очолюваних Н. Б. Покровським, М. А. Сапожковим і Ю. С. Биковим. Згідно із формантним методом, область частот мовного сигналу розбивають на суміжні частотні смуги, в межах кожної з яких спектри мови та шуму можна вважати практично незмінними, й формантну розбірливість обчислюють як певну функцію парціальних відношень сигнал-шум, а словесну розбірливість обчислюють через формантну розбірливість.

У даній статті представлено детальний опис алгоритму прогнозування розбірливості мови шляхом аналітичного моделювання. У загальному вигляді алгоритм складається з наступних кроків: на першому етапі обчислень здійснюється формування первинних моделей мовного сигналу і шуму у вигляді масивів вибірок стаціонарних випадкових процесів із заданими спектральними характеристиками. Потім виконується корекція дисперсій цих модельних процесів, щоб забезпечити необхідне інтегральне відношення сигнал-шум. Після такої корекції оцінюються парціальні відношення сигнал-шум. На заключному етапі обчислюються показники розбірливості мови, такі як формантна розбірливість, словесна розбірливість, індекс передачі мови.

Працездатність запропонованого алгоритму перевірена для 4-х видів шумової завади: білої, рожевої, коричневої та типової для навчальних приміщень. Узгодженість отриманих результатів з відомими аналогічними результатами свідчить про коректність запропонованих компонентів аналітичного алгоритму. Окрім того, виконано співставлення результатів оцінювання розбірливості мови, отриманих у відповідності до «класичного» підходу, з результатами оцінювання індексу передачі мови, що дозволило підтвердити тезу про низьку маскувальну здатність білого шуму при малих відношеннях сигнал-шум. Запропонований в даній роботі алгоритм прогнозування розбірливості мови буде корисним студентам в галузі звукоінженерії, фахівцям в галузях розробки та налагодження систем зв’язку, архітектурного проектування, озвучення залів різного призначення, а також керівникам установ, де розбірливість мови є важливим показником.

Блок інформації про статтю

Як цитувати
[1]
A. O. Harasiuk, M. V. Myronov, V. V. Lozinsky, N. Thanh Vy, A. V. Darchuk, і A. M. Prodeus, «Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою», Мікросист., Електрон. та Акуст., т. 24, вип. 5, с. 48–55, Жов 2019.
Розділ
Акустичні прилади та системи

Посилання

J. Collard, “A Theoretical Study of the Articulation and Intelligibility of a Telephone Circuit,” Electr. Commun., vol. 7, pp. 168–186, 1929.

K. D. Kryter and J. H. Ball, “SCIM - A meter for measuring the performance of speech communicationsystems,” ESD-TDR-64-674, 1964.

K. S. Rhebergen and N. J. Versfeld, “A Speech Intelligibility Index-based approach to predict the speech reception threshold for sentences in fluctuating noise for normal-hearing listeners,” J. Acoust. Soc. Am., vol. 117, no. 4, pp. 2181–2192, Apr. 2005, DOI: 10.1121/1.1861713.

N. B. Pokrovskiy, Raschet i izmerenie razborchivosti rechi [Prediction and measurement of speech intelligibility]. Moskow, USSR: Svyazizdat, 1962.

M. A. Sapozhkov, Rechevoy signal v kibernetike i svyazi [Speech signal in cybernetics and communication]. Moscow: Svyazizdat, 1963.

Y. S. Bykov, eoriya razborchivosti rechi i povysheniye effektivnosti radiotelefonnoy svyazi [The theory of speech intelligibility and improving the effectiveness of radiotelephone communications]. Moskow-Leningrad: Gosenergoizdat, 1959.

H. J. M. Steeneken and T. Houtgast, “A physical method for measuring speech‐transmission quality,” J. Acoust. Soc. Am., vol. 67, no. 1, pp. 318–326, 1980, DOI: 10.1121/1.384464.

I. Aldoshina and R. Pritts, Muzykal’naya akustika [Musical acoustics]. St. Petersburg: Composer, 2006, ISBN: 5-7379-0298-6.

A. N. Prodeus, L. B. Dronzhevskaya, V. A. Klimkov, and D. A. Shagitova, “Formantnyy i formantno-modulyatsionnyy metody otsenki razborchivosti rechi. Chast’ 2. Tochnost’ i skorost’ izmereniy [Formant and formant-modulation methods for assessing speech intelligibility. Part 2. Accuracy and speed of measurements.],” Electron. Commun., vol. 16, no. 6, pp. 16–24, 2011.

V. K. Zheleznyak, Y. K. Makarov, and A. A. Horev, “Nekotoryye metodicheskiye podkhody k otsenke effektivnosti zashchity rechevoy informatsii [Some methodological approaches to assessing the effectiveness of protection of speech information],” Spetsial’naya tekhnika, no. 4, p. 39, 2000.

A. N. Prodeus, A. V. Gavrilenko, and V. S. Didkovskiy, “Sopostavleniye versiy formantnogo metoda otsenki razborchivosti rechi [Comparison of versions of the formant method for assessing speech intelligibility],” Electron. Commun., pp. 227–231, 2008.

V. S. Didkovskiy, M. V. Didkovskaya, and A. N. Prodeus, Akusticheskaya ekspertiza kanalov rechevoy kommunikatsii. Monografiya [Acoustic examination of the speech communication channels. Monograph]. Kyiv, Ukraine: Imeks-Ltd, 2008, ISBN: 978-966-8861-85-7.

A. M. Prodeus, K. V. Bukhta, P. V. Morozko, O. V. Serhiienko, I. V. Kotvytskyi, and O. O. Dvornyk, “Automated Subjective Assessment of Speech Intelligibility in Various Listening Modes,” Microsystems, Electron. Acoust., vol. 23, no. 3, pp. 49–57, Jun. 2018, DOI: 10.20535/2523-4455.2018.23.3.130367.