Дослідження характеристик згорткової нейронної мережі на мікроконтролері ESP32-CAM
Основний зміст сторінки статті
Анотація
Статтю присвячено вирішенню проблеми використання нейронних мереж для розпізнавання зображень у режимі реального часу на малопотужних портативних пристроях, що працюють на мікроконтролерах. Як цільовий пристрій використано мікроконтролер ESP-32© CAM, на якому розгорнуто штучну нейронну мережу, написану з використанням мови програмування Python® і бібліотеки Tensorflow© для побудови нейронних мереж. У роботі виконано порівняння продуктивності мікроконтролера та персонального комп’ютера для виявлення об’єктів за допомогою нейронної мережі та їх класифікації. Порівняння проведено за часом розпізнавання зображення та відсотком правильно класифікованих об'єктів. У статті показано, що кількість епох навчання впливає на точність класифікації об’єктів на зображенні. Отримані результати демонструють, що збільшення кількості епох навчання підвищує точність розпізнавання об’єктів за допомогою досліджуваної нейронної мережі, але значне збільшення кількості епох не призводить до суттєвого покращення точності розпізнавання. Під час навчання нейромережі виявлено певне «перенавчання» моделі. Дана проблема виникла через велику кількість епох навчання на малій кількості навчальних даних для створеної моделі. Для уникнення цієї проблеми в майбутньому рекомендовано брати більше навчального матеріалу або спростити модель для використання уже існуючого набору навчальних даних. Аналіз отриманих даних показав, що відмінність у точності роботи між мікроконтролером та персональним комп’ютером склала 5%, що не є суттєвим, проте відмінність у затраченому часі склала більше ніж у 2 рази, що є критичним для класифікації об’єктів у режимі реального часу. Результати роботи моделі на мікроконтролері показали точність, яка складає 50%. Точність в залежності від класу така: для літаків, автомобілів, кораблів, вантажівок та птахів точність класифікації об'єктів склала 100%, а для тварин точність класифікації об'єктів склала 0%. З отриманих даних видно тенденцію, що найкраще розпізнаються образи техніки різних типів та птахи, а точність розпізнавання тварин є нульовою. Також наведено рекомендації з удосконалення роботи моделі, які б підвищили її точність.
Блок інформації про статтю
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
European Parliament, "What is artificial intelligence and how is it used?," European Parliament news, 04 09 2020. [Online]. Available: https://www.europarl.europa.eu/news/en/headlines/society/20200827STO85804/what-is-artificial-intelligence-and-how-is-it-used. [Accessed 01 05 2023].
DATACONOMY MEDIA GMBH, "AI’s invisible hand on daily life," Eray Eliaçık, 09 05 2022. [Online]. Available: https://dataconomy.com/2022/05/09/artificial-intelligence-in-everyday-life/. [Accessed 01 05 2023]
J. Gerhart, Home Automation & Wiring, New York: McGraw-Hill, 1999. ISBN: 978-0070246744
Startup info, "Most Common Problems with Smart Home Technology Systems," Kossi Adzo, 09 08 2022. [Online]. Available: https://startup.info/most-common-problems-with-smart-home-technology-systems/. [Accessed 01 05 2023]
R. O. Duda, P. E. Hart and D. G. Stork, Pattern Classification, Toronto: A Wiley Interscience publication John Wiley & Sons, 1973. ISBN: 978-0-471-05669-0
Termin.in.ua, "Neural network — what it is, how it works and why it is needed.," [Online]. Available: https://termin.in.ua/neyromerezha/#lwptoc21. [Accessed 03 05 2023]
The Motley Fool., "3 Things You Need to Know About Apple's A12 Bionic Chip," Ashraf Eassa , 14 09 2018. [Online]. Available: https://www.fool.com/investing/2018/09/14/3-things-you-need-to-know-about-apples-a12-bionic.aspx. [Accessed 03 05 2023]
K. Amer, M. Samy, M. Shaker and M. ElHelw, "Deep Convolutional Neural Network-Based Autonomous Drone Navigation," [Online]. Available: https://arxiv.org/ftp/arxiv/papers/1905/1905.01657.pdf. [Accessed 17 05 2023]
P. Warden and D. Situnayake, TinyML: Machine Learning with TensorFlow Lite on Arduino and Ultra-Low-Power Microcontrollers, O'Reilly Media, 2019. ISBN: 978-1492052043
Python organization, "Python official webpage," Python.org, [Online]. Available: https://www.python.org/. [Accessed 13 04 2023]
Tensorflow organization, "Tensorflow official webpage," Google incorporated, [Online]. Available: https://www.tensorflow.org/?hl=ru. [Accessed 13 04 2023]
X. Jiang, A. Hadidp, Y. Pang, E. Granger and X. Feng, Deep Learning in Object Detection and Recognition, Texas: Computer Science and Engineering Department, University of Texas at Arlington, 2019. ISBN: 978-9811506512
U. Kern, "Convolutional neural network (CNN)," [Online]. Available: https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/. [Accessed 17 04 2023]
M. Minsky and S. Papert, Perceptrons. An Introduction to Computational Geometry, Massachusetts: The MIT Press, 1969. ISBN: 9780262630221
Zhytomyr State Technical University, "Explanation of the principle of convolution in neural networks," [Online]. Available: https://conf.ztu.edu.ua/wp-content/uploads/2019/02/45-1.pdf. [Accessed 19 04 2023]
Tensorflow organization, "Cifar10 dataset," Google incorporated, [Online]. Available: https://www.tensorflow.org/datasets/catalog/cifar10?hl=ru. [Accessed 13 04 2023]
A. Krizhevsky, V. Nair and G. Hinton, "Explanation of the CIFAR-10 dataset," [Online]. Available: https://www.cs.toronto.edu/~kriz/cifar.html. [Accessed 19 04 2023]
Lenovo corporation, "Lenovo Legion," Lenovo corporation, [Online]. Available: https://www.lenovo.com/ua/uk/laptops/legion-laptops/legion-5-series/Legion-5-15ACH6H/p/88GMY501582. [Accessed 13 04 2023]
AI-Thinker, "ESP-32 CAM datasheet," [Online]. Available: https://docs.ai-thinker.com/_media/esp32/docs/esp32-cam_product_specification_zh.pdf. [Accessed 14 02 2023]
Micropython organization , "Micro Python," [Online]. Available: https://micropython.org/download/esp32/. [Accessed 20 02 2023]
Omnivision, "OV2640 2Mp/FOV120-NV datasheet," [Online]. Available: https://www.ovt.com/wp-content/uploads/2021/01/OV2640-Volume-Production-FINAL.pdf. [Accessed 20 02 2023]
Tensorflow organization, "Tensorflow lite compiler," Google incorporated, [Online]. Available: https://www.tensorflow.org/lite?hl=en. [Accessed 28 04 2022]
V. Chandra and A. Hareendran, Artificial Intelligence and Machine Learning, Delhi: PHI Learning, 2014
Evergreen, "What are convolutional neural networks and where are they applied?," [Online]. Available: https://evergreens.com.ua/ua/articles/cnn.html. [Accessed 17 04 2023]
130.com.ua, "What is an onboard computer and why is it necessary?," [Online]. Available: https://130.com.ua/uk/what-is-trip-computers/. [Accessed 11 04 2023]
A. H. Habibi and H. E. Jahani, Guide to Convolutional Neural Networks, Spain: Springer International Publishing, 2017. ISBN: 978-3319575490