Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою

##plugins.themes.bootstrap3.article.main##

Anastasiia Olehivna Harasiuk
Maksym Volodymyrovych Myronov
Vladyslav Valentynovych Lozinsky
Nguyen Thanh Vy
Alla Vitaliivna Darchuk
Arkadii Mykolaiovych Prodeus

Анотація

Результати акустичної експертизи приміщень та засобів зв’язку, що полягає в оцінюванні розбірливості мовних сигналів, є необхідними для сертифікації приміщень та комунікаційних систем. Оскільки технічні засоби звукоінженерів постійно змінюються й удосконалюються, а також з огляду на зростання переліку факторів, що можуть бути врахованими при оцінюванні розбірливості мови, зростає й кількість апаратно-програмних додатків для такого оцінювання. Таким чином, розробка математичного та програмного забезпечення для прогнозування та вимірювання розбірливості мови є актуальним завданням.

Найбільш поширеними на сьогодні є формантний та модуляційний методи оцінювання розбірливості мови. Формантний метод є дещо обмеженим, оскільки не дозволяє враховувати дію реверберації. Модуляційний метод, в якому мірою оцінювання розбірливості мови є індекс передачі мови (Speech Transmission Index), є вільним від цього недоліку. Тому в деяких роботах можна зустріти висловлювання про «застарілість» формантного методу. Проте, ретельне зіставлення потенційних можливостей формантного та модуляційного методів свідчить, що формантний метод перевершує свого конкурента за точністю і швидкістю обчислень в умовах, коли дія шуму переважає над дією реверберації. Найбільшого поширення набули такі версії формантного методу оцінювання розбірливості мови як індекс артикуляції (Articulation Index) й індекс розбірливості мови  (Speech Intelligibility Index). На території колишнього СРСР найбільш поширеними були версії формантного методу, розвинуті в наукових школах, очолюваних Н. Б. Покровським, М. А. Сапожковим і Ю. С. Биковим. Згідно із формантним методом, область частот мовного сигналу розбивають на суміжні частотні смуги, в межах кожної з яких спектри мови та шуму можна вважати практично незмінними, й формантну розбірливість обчислюють як певну функцію парціальних відношень сигнал-шум, а словесну розбірливість обчислюють через формантну розбірливість.

У даній статті представлено детальний опис алгоритму прогнозування розбірливості мови шляхом аналітичного моделювання. У загальному вигляді алгоритм складається з наступних кроків: на першому етапі обчислень здійснюється формування первинних моделей мовного сигналу і шуму у вигляді масивів вибірок стаціонарних випадкових процесів із заданими спектральними характеристиками. Потім виконується корекція дисперсій цих модельних процесів, щоб забезпечити необхідне інтегральне відношення сигнал-шум. Після такої корекції оцінюються парціальні відношення сигнал-шум. На заключному етапі обчислюються показники розбірливості мови, такі як формантна розбірливість, словесна розбірливість, індекс передачі мови.

Працездатність запропонованого алгоритму перевірена для 4-х видів шумової завади: білої, рожевої, коричневої та типової для навчальних приміщень. Узгодженість отриманих результатів з відомими аналогічними результатами свідчить про коректність запропонованих компонентів аналітичного алгоритму. Окрім того, виконано співставлення результатів оцінювання розбірливості мови, отриманих у відповідності до «класичного» підходу, з результатами оцінювання індексу передачі мови, що дозволило підтвердити тезу про низьку маскувальну здатність білого шуму при малих відношеннях сигнал-шум. Запропонований в даній роботі алгоритм прогнозування розбірливості мови буде корисним студентам в галузі звукоінженерії, фахівцям в галузях розробки та налагодження систем зв’язку, архітектурного проектування, озвучення залів різного призначення, а також керівникам установ, де розбірливість мови є важливим показником.

##plugins.themes.bootstrap3.article.details##

Як цитувати
Harasiuk, A. O., Myronov, M. V., Lozinsky, V. V., Thanh Vy, N., Darchuk, A. V., & Prodeus, A. M. (2019). Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою. Мікросистеми, Електроніка та Акустика, 24(5), 48–55. https://doi.org/10.20535/2523-4455.2019.24.5.192893
Розділ
Акустичні прилади та системи

Посилання

J. Collard, “A Theoretical Study of the Articulation and Intelligibility of a Telephone Circuit,” Electr. Commun., vol. 7, pp. 168–186, 1929.

K. D. Kryter and J. H. Ball, “SCIM - A meter for measuring the performance of speech communicationsystems,” ESD-TDR-64-674, 1964.

K. S. Rhebergen and N. J. Versfeld, “A Speech Intelligibility Index-based approach to predict the speech reception threshold for sentences in fluctuating noise for normal-hearing listeners,” J. Acoust. Soc. Am., vol. 117, no. 4, pp. 2181–2192, Apr. 2005, DOI: 10.1121/1.1861713.

N. B. Pokrovskiy, Raschet i izmerenie razborchivosti rechi [Prediction and measurement of speech intelligibility]. Moskow, USSR: Svyazizdat, 1962.

M. A. Sapozhkov, Rechevoy signal v kibernetike i svyazi [Speech signal in cybernetics and communication]. Moscow: Svyazizdat, 1963.

Y. S. Bykov, eoriya razborchivosti rechi i povysheniye effektivnosti radiotelefonnoy svyazi [The theory of speech intelligibility and improving the effectiveness of radiotelephone communications]. Moskow-Leningrad: Gosenergoizdat, 1959.

H. J. M. Steeneken and T. Houtgast, “A physical method for measuring speech‐transmission quality,” J. Acoust. Soc. Am., vol. 67, no. 1, pp. 318–326, 1980, DOI: 10.1121/1.384464.

I. Aldoshina and R. Pritts, Muzykal’naya akustika [Musical acoustics]. St. Petersburg: Composer, 2006, ISBN: 5-7379-0298-6.

A. N. Prodeus, L. B. Dronzhevskaya, V. A. Klimkov, and D. A. Shagitova, “Formantnyy i formantno-modulyatsionnyy metody otsenki razborchivosti rechi. Chast’ 2. Tochnost’ i skorost’ izmereniy [Formant and formant-modulation methods for assessing speech intelligibility. Part 2. Accuracy and speed of measurements.],” Electron. Commun., vol. 16, no. 6, pp. 16–24, 2011.

V. K. Zheleznyak, Y. K. Makarov, and A. A. Horev, “Nekotoryye metodicheskiye podkhody k otsenke effektivnosti zashchity rechevoy informatsii [Some methodological approaches to assessing the effectiveness of protection of speech information],” Spetsial’naya tekhnika, no. 4, p. 39, 2000.

A. N. Prodeus, A. V. Gavrilenko, and V. S. Didkovskiy, “Sopostavleniye versiy formantnogo metoda otsenki razborchivosti rechi [Comparison of versions of the formant method for assessing speech intelligibility],” Electron. Commun., pp. 227–231, 2008.

V. S. Didkovskiy, M. V. Didkovskaya, and A. N. Prodeus, Akusticheskaya ekspertiza kanalov rechevoy kommunikatsii. Monografiya [Acoustic examination of the speech communication channels. Monograph]. Kyiv, Ukraine: Imeks-Ltd, 2008, ISBN: 978-966-8861-85-7.

A. M. Prodeus, K. V. Bukhta, P. V. Morozko, O. V. Serhiienko, I. V. Kotvytskyi, and O. O. Dvornyk, “Automated Subjective Assessment of Speech Intelligibility in Various Listening Modes,” Microsystems, Electron. Acoust., vol. 23, no. 3, pp. 49–57, Jun. 2018, DOI: 10.20535/2523-4455.2018.23.3.130367.

Статті цього автора (авторів), які найбільше читають