Алгоритм автоматичної класифікації сегментів мови основі автокореляційних та енергетичних характеристик
Основний зміст сторінки статті
Анотація
У статті запропоновано алгоритм сегментації мовного сигналу за ознаками вокалізації, заснований на особливостях автокореляційної функції та розподіл енергії різних звуків за частотним спектром. Показано, що класифікаційні характеристики запропонованого алгоритму забезпечують досить високу якість сегментації незалежно від характеристик мовного сигналу, що демонструє перевагу перед алгоритмами, орієнтованими на сигнали з певними характеристиками. Наведено результати роботи алгоритму для різних типів звуків чоловічих та жіночих голосів.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
C. Lemyre, M. Jelinek, and R. Lefebvre, “New approach to voiced onset detection in speech signal and its application for frame error concealment”, in 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, USA, 2008, pp. 4757–4760. DOI:10.1109/ICASSP.2008.4518720
A. Prodeus, “Digital speech coding:modeling vocoders in Matlab”, Electronics and Communications, no. 1, pp. 56–64, 2006.
M. Kulesza, G. Szwoch, and A. Czyżewsk, “HighQuality Speech Coding using Combined Parametricand Perceptual Modules”, PWASET, no. 13, pp. 244–249, 2006.
T. Van Pham, “Wavelet analisys for robust speechprocessing and applications”, 2007, p. 171.
V. Zhuikov and A. Kharchenko, “Algorithm for classifying speech signal segments”, Electronics and Communications, no. 2-3, pp. 130–137, 2009.
Orlov A.I., Applied statistics, Moscow: Izdatel’stvo «Ekzamen», 2004.
G. Szwoch, M. Kulesza, and A. Czyzewski, “Transient detection algorithms for speech coding applications”, The Journal of the Acoustical Society of America, vol. 120, no. 5_Supplement, pp. 3217–3217, Nov. 2006. DOI:10.1121/1.4788162
Y. Kalintsev, Speech intelligibility in digital vocoders, Moscow: Radio and Communications, 1991.
J. Flanagan, Analysis, synthesis and speech perception trans, Moscow: Communication, 1968.
J. Kaiser, “On a simple algorithm to calculate the ’energy’ of a signal”, in International Conference on Acoustics, Speech, and Signal Processing, Albuquerque, NM, USA, 1990, pp. 381–384. DOI:10.1109/ICASSP.1990.115702
P. Maragos and A. Potamianos, “Higher order differential energy operators”, IEEE Signal Processing Letters, vol. 2, no. 8, pp. 152–154, Aug. 1995 DOI:10.1109/97.404130
J. Markel and A. Gray, Linear speech prediction, Moscow: Svyaz, 1980.
V. Hardle, J. Krekyacharyan, D. Picard, and A. Tsybakov, Wavelets,approximation and statistical applications