Алгоритм автоматической классификации сегментов речи на основе автокорреляционных и энергетических характеристик

В.Я.  Жуйков; Н.Н.  Кузнецов; А.Н.  Харченко

doi:10.20535/2312-1807.2010.58.5.284799

pdf

Опубликован: Mar 29, 2010

DOI: https://doi.org/10.20535/2312-1807.2010.58.5.284799

Ключевые слова:

.

В.Я. Жуйков

Н.Н. Кузнецов

А.Н. Харченко

Аннотация

В статье предложен алгоритм сегментации речевого сигнала по признакам вокализации, основанный на особенностях автокорреляционной функции и распределении энергии различных звуков по частотному спектру. Показано, что классификационные характеристики предложенного алгоритма обеспечивают достаточно высокое качество сегментации не зависимо от характеристик речевого сигнала, что демонстрирует его преимущество перед алгоритмами, ориентированными на сигналы с определенными характеристиками. Приведены результаты работы алгоритма для различных типов звуков мужских и женских голосов.

Как цитировать

Жуйков, В. ., Кузнецов, Н. ., & Харченко, А. . (2010). Алгоритм автоматической классификации сегментов речи на основе автокорреляционных и энергетических характеристик. Электроника и Связь, 15(5), 83–89. https://doi.org/10.20535/2312-1807.2010.58.5.284799

Выпуск

Том 15 № 5 (2010)

Раздел

методы и средства обработки сигналов и изображений

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Авторы, публикующиеся в данном журнале, соглашаются со следующими условиями:

Авторы сохраняют за собой права на авторство своей работы и предоставляют журналу право первой публикации этой работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылокой на авторов оригинальной работы и оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные договора на неэксклюзивное распространение работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном архиве учреждения или публиковать в составе монографии), с условием сохраниения ссылки на оригинальную публикацию в этом журнале.
Политика журнала разрешает и поощряет размещение авторами в сети Интернет (например в институтском хранилище или на персональном сайте) рукописи работы как до ее подачи в редакцию, так и во время ее редакционной обработки, так как это способствует продуктивной научной дискуссии и положительно сказывается на оперативности и динамике цитирования статьи (см. The Effect of Open Access).

Библиографические ссылки

C. Lemyre, M. Jelinek, and R. Lefebvre, “New approach to voiced onset detection in speech signal and its application for frame error concealment”, in 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, USA, 2008, pp. 4757–4760. DOI:10.1109/ICASSP.2008.4518720

A. Prodeus, “Digital speech coding:modeling vocoders in Matlab”, Electronics and Communications, no. 1, pp. 56–64, 2006.

M. Kulesza, G. Szwoch, and A. Czyżewsk, “HighQuality Speech Coding using Combined Parametricand Perceptual Modules”, PWASET, no. 13, pp. 244–249, 2006.

T. Van Pham, “Wavelet analisys for robust speechprocessing and applications”, 2007, p. 171.

V. Zhuikov and A. Kharchenko, “Algorithm for classifying speech signal segments”, Electronics and Communications, no. 2-3, pp. 130–137, 2009.

Orlov A.I., Applied statistics, Moscow: Izdatel’stvo «Ekzamen», 2004.

G. Szwoch, M. Kulesza, and A. Czyzewski, “Transient detection algorithms for speech coding applications”, The Journal of the Acoustical Society of America, vol. 120, no. 5_Supplement, pp. 3217–3217, Nov. 2006. DOI:10.1121/1.4788162

Y. Kalintsev, Speech intelligibility in digital vocoders, Moscow: Radio and Communications, 1991.

J. Flanagan, Analysis, synthesis and speech perception trans, Moscow: Communication, 1968.

J. Kaiser, “On a simple algorithm to calculate the ’energy’ of a signal”, in International Conference on Acoustics, Speech, and Signal Processing, Albuquerque, NM, USA, 1990, pp. 381–384. DOI:10.1109/ICASSP.1990.115702

P. Maragos and A. Potamianos, “Higher order differential energy operators”, IEEE Signal Processing Letters, vol. 2, no. 8, pp. 152–154, Aug. 1995 DOI:10.1109/97.404130

J. Markel and A. Gray, Linear speech prediction, Moscow: Svyaz, 1980.

V. Hardle, J. Krekyacharyan, D. Picard, and A. Tsybakov, Wavelets,approximation and statistical applications

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Аннотация

##plugins.themes.bootstrap3.article.details##

Библиографические ссылки