Алгоритм оброблення аудіосигналів із використанням методу машинного навчання
DOI:
https://doi.org/10.20535/RADAP.2023.93.39-51Ключові слова:
Дрон, малий безпілотний літальний апарат, спектр, обробка сигналу, виявлення сигналу, згорткові нейроні мережі, глибоке навчанняАнотація
Малi безпiлотнi лiтальнi апарати або дрони швидко розвиваються та впроваджуються. Але це також збiльшує i загрозу громадськiй та нацiональнiй безпецi через ризики їхнього неправомiрного використання. Перспективним напрямком для вирiшення цiєї проблеми є акустичний метод, що включає в себе аналiз звукових характеристик i доплерiвського зсуву сигнатур безпiлотникiв, використання масивiв мiкрофонiв та методи машинного навчання. Задачею цієї статті є розроблення алгоритму для ефективного виявлення та класифікації аудіосигналів малих безпілотних літальних апаратів із використанням згорткової нейронної мережі глибокого навчання, побудова архітектури та оцінка ефективності її роботи. Перед подачею набору аудіозаписів дронів на вхід мережі, підвищили їхню якість застосувавши нормалізацію, Вінеровську фільтрацію, сегментацію — поділили аудіо на кадри тривалістю 25 мс з перекриттям 50% та віконне керування за допомогою вікна Хеммінга, оскільки у завданні оброблення аудіосигналів важливіша точність у часовій області. Отримані дані розділили у співвідношенні 60/20/20 на три набори: для навчання, валідації та тестування. Далі представили дані спрощеним набором ознак, визначивши з кожного кадру оброблених аудіосигналів мел-спектрограми, для фіксації часових та спектральних характеристик. Діапазон частот аналізу становить межі робочих частот моделі мікрофону (20 Гц — 20 кГц), частотна розділова здатність 50 Гц, а кількість робочих мел-смуг дорівнює 30. Використовуючи навчальні дані та отримані ознаки аудіосигналів, розробили архітектуру нейронної мережі для досліджень роботи алгоритму виявлення дронів. Вона складається із 10 пар шарів згортки, ReLU, пакетної нормалізації та максимального пулингу. Їхня кількість визначається розміром вікна об'єднання в часі. Наступними є шари згладжування, відсікання, повнозв'язний та Softmax. Для нормалізації вихідних даних і отримання фінальних ймовірностей застосовується шар класифікації. У якості оптимізатора для навчання моделі обрано Adam, початкова швидкість навчання дорівнює 0.001, а після проходження 75% епох поступово зменшується у 10 разів, для покращення збіжності. Точність розпізнавання даних складає 99%, оцінка F1 — 0.93, що вказує на високий рівень загальної продуктивності архітектури. Максимальна відстань ефективного виявлення дронів алгоритмом складає 200 м.
Посилання
References
Park S., Kim H. T., Lee S., Joo H. and Kim H. (2021). Survey on Anti-Drone Systems: Components, Designs, and Challenges. IEEE Access, Vol. 9, pp. 42635-42659. DOI: 10.1109/ACCESS.2021.3065926.
Kozeruk S. O., Korzhyk O. V. (2022). Detection, Localization and Identification of Small Aircraft by Acoustic Radiation. Visnyk NTUU KPI Seriia - Radiotekhnika Radioaparatobuduvannia, Iss. 89, pp. 29-38. DOI:10.20535/RADAP.2019.76.15-20.
Junfeng Guo, Ishtiaq Ahmad and KyungHi Chang (2020). Classification, positioning, and tracking of drones by HMM using acoustic circular microphone array beamforming. EURASIP Journal on Wireless Communications and Networking, Iss. 9, pp. 29-38. DOI:10.1186/s13638-019-1632-9.
Yousaf, J., Zia, H., Alhalabi, M. et al. (2020). Drone and Controller Detection and Localization: Trends and Challenges. EAppl. Sci., Vol. 12(24), pp. 1-22. DOI:10.3390/app122412612.
Mazumder J., Raj A. B. (2020). Detection and Classification of UAV Using Propeller Doppler Profiles for Counter UAV Systems. 2020 5th International Conference on Communication and Electronics Systems (ICCES), pp. 221–227. DOI:10.1109/ICCES48766.2020.91380.
Al-Emadi S., Al-Ali A. and Al-Ali A. (2021). Audio-Based Drone Detection and Identification Using Deep Learning Techniques with Dataset Enhancement through Generative Adversarial Networks. Sensors, Vol. 21(15), pp. 1-26. DOI:10.3390/s21154953.
Subbotin S. O. (2020). Neironni merezhi: teoriia ta praktyka: navch. posibnyk [Neural Networks: Theory and Practice]. Zhytomyr: O. O. Yevenok, 184 p.
Mahdavi F., Rajabi R. (2020). Drone Detection Using Convolutional Neural Networks. 2020 6th Iranian Conference on Signal Processing and Intelligent Systems (ICSPIS), pp. 1-5. DOI:10.1109/ICSPIS51611.2020.9349620.
Zeghidour N., Xu Q., Liptchinsky V., et al. (2019). Fully Convolutional Speech Recognition, Vol. 2. pp. 1-5. DOI: 10.48550/arXiv.1812.06864.
Sokolskyi S. O., Movchaniuk A. V. (2023). Electro-Acoustic Path of the Detector for Detection of Small Unmanned Aerial Vehicles. Visnyk VPI, Iss. 2, pp. 135-144. DOI:10.31649/1997-9266-2023-167-2-135-144.
Singh J. (2019). An introduction to audio processing and machine learning using Python. Opensource.com, accessed on: Aug 19, 2023.
Pratheeksha N. (2018). The dummy's guide to MFCC. Medium.com, accessed on: Sep 3, 2023.
Ignatenko G. S., Lamchanovskii A. G. (2019). Classification of audio signals using neural networks. International Scientific Journal «Young Scientist», Iss. 48(286), pp. 23-25.
Nair Vinod; Hinton Geoffrey E. (2010). Rectified Linear Units Improve Restricted Boltzmann Machines. 27th International Conference on International Conference on Machine Learning, pp. 807–814. DOI:10.5555/3104322.3104425.
Diederik P. Kingma, Jimmy Lei Ba (2015). Adam: A method for stochastic optimization. 3rd International Conference for Learning Representations, pp. 1-15. DOI:10.48550/arXiv.1412.6980.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2023 Сергій Сокольський
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.