Аналіз впливу параметрів обробки звукового сигналу на якість розпізнавання голосових команд

Автор(и)

  • Л .П. Дюжаєв Національний технічний університет України “Київський політехнічний інститут” http://orcid.org/0000-0003-2106-8891
  • В.Ю. Коваль ТОВ "Центральна промислова група"

DOI:

https://doi.org/10.20535/RADAP.2014.56.34-41

Ключові слова:

розпізнавання мови, голосові команди, мелкепстральні коефіцієнти, динамічне викривлення часу

Анотація

В роботі розглянуто структуру системи розпізнавання голосових команд, алгоритм виділення мелкепстральних коефіцієнтів та їх порівняння методом динамічного викривлення часу. В системі зі словником з п’ятдесяти команд вимовлених одним диктором було досліджено вплив на якість розпізнавання голосової команди таких параметрів як: частоти дискретизації, тривалості фрейму, кількості вибірок Фур’є, виду віконної функції на якість розпізнавання голосової команди.

Біографії авторів

Л .П. Дюжаєв, Національний технічний університет України “Київський політехнічний інститут”

Дюжаєв Л .П., к.т.н, доцент каф. конструювання та вироництва радіоапаратури

В.Ю. Коваль, ТОВ "Центральна промислова група"

Коваль В.Ю.

Посилання

Перелік посилань

Яцковський В.С. Алгоритм оцінювання темпу музикальних сигналів / В. С. Яцковський, Д.М. Бруслік // Електроніка та системи управління. – 2012. – № 31. – с. 5-9.

Dhingra S. D. Isolated speech recognition using MFCC and DTW / S. D. Dhingra, G. Nijhawan, P. Pandit // International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering. – 2007. – Vol. 2, No 8. – pp. 4085 - 4092.

Гладышев К. К. Информативные признаки на основе линейных спек-тральных корней в системах распознавания команд: автореф. дис. на соискание ученой степени канд. техн. наук: спец. 05.13.01 – «Системный анализ, управление и обработка информации» / Гладышев Константин Константинович; СПб. госуд. унив. телекоммуникаций им. проф. М.А. Бонч–Бруевича. – СПб, 2010. – 16 с.

Al–Naymat G. SparseDTW: A Novel Approach to Speed up Dynamic Time Warping. / G. Al–Naymat, S. Chawla, J. Taheri // The 2009 Australasian Data Mining. – 2009. – Vol. 101 – pp. 117–127.

Muda L. Voice Recognition Algorithms using Mel–Frequency Cepstral Coefficient (MFCC) and Dynamic Time Warping (DTW) Techniques. / L. Muda, M. Begam, I. Elamvazuthi // Journal of computing. – 2010. – Vol. 2, No 3. – pp.

Колоколов А. С. Обработка сигнала в частотной области при распознавании речи. / А. С. Колоколов // Проблемы управления. – № 3. – 2006 г. c. 13–18.

References

Yatskovsky V.S. and Bruslik D.N. (2012) Algorithm of tempo estimation of musical signals. Electronics and Control Systems. No 31, pp. 5-9.

Dhingra S.D. and Nijhawan G. (2007) Isolated speech recognition using MFCC and DTW. International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering. Vol. 2, No. 8, pp. 4085 – 4092.

Gladyshev K. K. (2010) Informativnye priznaki na osnove linejnyh spektral'nyh kornej v sistemah raspoznavanija komand. Diss. Cand.. Tekhn. nauk [Informative features based on linear spectral roots in commands recognition systems. Cand. Sci. diss.]. Saint-Petersburg, The Bonch-Bruevich Saint - Petersburg State University of Telecommunications, 16 p. Available at: www.sut.ru/doci/nauka/avtoref/glad.doc

Al-Naymat G., Chawla S. and Taheri J. (2009) SparseDTW: A Novel Approach to Speed up Dynamic Time Warping. The 2009 Australasian Data Mining. Vol. 101, Melbourne, Australia, ACM Digital Library, pp. 117-127.

Muda L., Begam M. and Elamvazuthi I. (2010) Voice Recognition Algorithms using Mel–Frequency Cepstral Coefficient (MFCC) and Dynamic Time Warping (DTW) Techniques. Journal of computing. Vol. 2, No 3, pp. 138–143.

Kolokolov A.S. (2006) Frequency domain signal processing in speech recognition. Control Science. No 3, pp. 13-18. (In Russian)

##submission.downloads##

Опубліковано

2014-04-03

Як цитувати

Дюжаєв, Л. .П. і Коваль, В. (2014) «Аналіз впливу параметрів обробки звукового сигналу на якість розпізнавання голосових команд», Вісник НТУУ "КПІ". Серія Радіотехніка, Радіоапаратобудування, 0(56), с. 34-41. doi: 10.20535/RADAP.2014.56.34-41.

Номер

Розділ

Обчислювальні методи в радіоелектроніці