Алгоритм оброблення аудіосигналів із використанням методу машинного навчання

Автор(и)

  • С. О. Сокольський Національний технічний університет України ''Київський політехнічний інститут імені Ігоря Сікорського'', м. Київ, Україна https://orcid.org/0000-0002-2409-1539
  • А. В. Мовчанюк Національний технічний університет України ''Київський політехнічний інститут імені Ігоря Сікорського'', м. Київ, Україна https://orcid.org/0000-0003-2901-0424

DOI:

https://doi.org/10.20535/RADAP.2023.93.39-51

Ключові слова:

Дрон, малий безпілотний літальний апарат, спектр, обробка сигналу, виявлення сигналу, згорткові нейроні мережі, глибоке навчання

Анотація

Малi безпiлотнi лiтальнi апарати або дрони швидко розвиваються та впроваджуються. Але це також збiльшує i загрозу громадськiй та нацiональнiй безпецi через ризики їхнього неправомiрного використання. Перспективним напрямком для вирiшення цiєї проблеми є акустичний метод, що включає в себе аналiз звукових характеристик i доплерiвського зсуву сигнатур безпiлотникiв, використання масивiв мiкрофонiв та методи машинного навчання. Задачею цієї статті є розроблення алгоритму для ефективного виявлення та класифікації аудіосигналів малих безпілотних літальних апаратів із використанням згорткової нейронної мережі глибокого навчання, побудова архітектури та оцінка ефективності її роботи. Перед подачею набору аудіозаписів дронів на вхід мережі, підвищили їхню якість застосувавши нормалізацію, Вінеровську фільтрацію, сегментацію — поділили аудіо на кадри тривалістю 25 мс з перекриттям 50% та віконне керування за допомогою вікна Хеммінга, оскільки у завданні оброблення аудіосигналів важливіша точність у часовій області. Отримані дані розділили у співвідношенні 60/20/20 на три набори: для навчання, валідації та тестування. Далі представили дані спрощеним набором ознак, визначивши з кожного кадру оброблених аудіосигналів мел-спектрограми, для фіксації часових та спектральних характеристик. Діапазон частот аналізу становить межі робочих частот моделі мікрофону (20 Гц — 20 кГц), частотна розділова здатність 50 Гц, а кількість робочих мел-смуг дорівнює 30. Використовуючи навчальні дані та отримані ознаки аудіосигналів, розробили архітектуру нейронної мережі для досліджень роботи алгоритму виявлення дронів. Вона складається із 10 пар шарів згортки, ReLU, пакетної нормалізації та максимального пулингу. Їхня кількість визначається розміром вікна об'єднання в часі. Наступними є шари згладжування, відсікання, повнозв'язний та Softmax. Для нормалізації вихідних даних і отримання фінальних ймовірностей застосовується шар класифікації. У якості оптимізатора для навчання моделі обрано Adam, початкова швидкість навчання дорівнює 0.001, а після проходження 75% епох поступово зменшується у 10 разів, для покращення збіжності. Точність розпізнавання даних складає 99%, оцінка F1 — 0.93, що вказує на високий рівень загальної продуктивності архітектури. Максимальна відстань ефективного виявлення дронів алгоритмом складає 200 м.

Біографії авторів

С. О. Сокольський , Національний технічний університет України ''Київський політехнічний інститут імені Ігоря Сікорського'', м. Київ, Україна

аспірант

А. В. Мовчанюк , Національний технічний університет України ''Київський політехнічний інститут імені Ігоря Сікорського'', м. Київ, Україна

к.т.н., доцент

Посилання

References

Park S., Kim H. T., Lee S., Joo H. and Kim H. (2021). Survey on Anti-Drone Systems: Components, Designs, and Challenges. IEEE Access, Vol. 9, pp. 42635-42659. DOI: 10.1109/ACCESS.2021.3065926.

Kozeruk S. O., Korzhyk O. V. (2022). Detection, Localization and Identification of Small Aircraft by Acoustic Radiation. Visnyk NTUU KPI Seriia - Radiotekhnika Radioaparatobuduvannia, Iss. 89, pp. 29-38. DOI:10.20535/RADAP.2019.76.15-20.

Junfeng Guo, Ishtiaq Ahmad and KyungHi Chang (2020). Classification, positioning, and tracking of drones by HMM using acoustic circular microphone array beamforming. EURASIP Journal on Wireless Communications and Networking, Iss. 9, pp. 29-38. DOI:10.1186/s13638-019-1632-9.

Yousaf, J., Zia, H., Alhalabi, M. et al. (2020). Drone and Controller Detection and Localization: Trends and Challenges. EAppl. Sci., Vol. 12(24), pp. 1-22. DOI:10.3390/app122412612.

Mazumder J., Raj A. B. (2020). Detection and Classification of UAV Using Propeller Doppler Profiles for Counter UAV Systems. 2020 5th International Conference on Communication and Electronics Systems (ICCES), pp. 221–227. DOI:10.1109/ICCES48766.2020.91380.

Al-Emadi S., Al-Ali A. and Al-Ali A. (2021). Audio-Based Drone Detection and Identification Using Deep Learning Techniques with Dataset Enhancement through Generative Adversarial Networks. Sensors, Vol. 21(15), pp. 1-26. DOI:10.3390/s21154953.

Subbotin S. O. (2020). Neironni merezhi: teoriia ta praktyka: navch. posibnyk [Neural Networks: Theory and Practice]. Zhytomyr: O. O. Yevenok, 184 p.

Mahdavi F., Rajabi R. (2020). Drone Detection Using Convolutional Neural Networks. 2020 6th Iranian Conference on Signal Processing and Intelligent Systems (ICSPIS), pp. 1-5. DOI:10.1109/ICSPIS51611.2020.9349620.

Zeghidour N., Xu Q., Liptchinsky V., et al. (2019). Fully Convolutional Speech Recognition, Vol. 2. pp. 1-5. DOI: 10.48550/arXiv.1812.06864.

Sokolskyi S. O., Movchaniuk A. V. (2023). Electro-Acoustic Path of the Detector for Detection of Small Unmanned Aerial Vehicles. Visnyk VPI, Iss. 2, pp. 135-144. DOI:10.31649/1997-9266-2023-167-2-135-144.

Singh J. (2019). An introduction to audio processing and machine learning using Python. Opensource.com, accessed on: Aug 19, 2023.

Pratheeksha N. (2018). The dummy's guide to MFCC. Medium.com, accessed on: Sep 3, 2023.

Ignatenko G. S., Lamchanovskii A. G. (2019). Classification of audio signals using neural networks. International Scientific Journal «Young Scientist», Iss. 48(286), pp. 23-25.

Nair Vinod; Hinton Geoffrey E. (2010). Rectified Linear Units Improve Restricted Boltzmann Machines. 27th International Conference on International Conference on Machine Learning, pp. 807–814. DOI:10.5555/3104322.3104425.

Diederik P. Kingma, Jimmy Lei Ba (2015). Adam: A method for stochastic optimization. 3rd International Conference for Learning Representations, pp. 1-15. DOI:10.48550/arXiv.1412.6980.

##submission.downloads##

Опубліковано

2023-09-30

Як цитувати

Сокольський , С. О. і Мовчанюк , А. В. (2023) «Алгоритм оброблення аудіосигналів із використанням методу машинного навчання», Вісник НТУУ "КПІ". Серія Радіотехніка, Радіоапаратобудування, (93), с. 39-51. doi: 10.20535/RADAP.2023.93.39-51.

Номер

Розділ

Телекомунікації, радіолокація і навігація, радіоптика та електроакустика