Розпізнавання та класифікація рептилій за допомогою штучної нейронної мережі
Методика виявлення рептилій за допомогою штучного інтелекту та її потенціал для вирішення важливих питань екології, сільського господарства та наукових досліджень. Розпізнавання зображень як одне з завдань, з якими справляються згорткові нейронні мережі.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 25.11.2023 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Львівський національний університет ім. І. Франка
Розпізнавання та класифікація рептилій за допомогою штучної нейронної мережі
Колос Надія Мирославівна,
кандидат фізико-математичних наук, доцент кафедри дискретного аналізу та інтелектуальних систем
Пац Анастасія Богданівна,
випускниця (бакалавр комп'ютерних наук) факультету прикладної математики та інформатики
м. Львів
Анотація
Від початку народження цивілізації, людина старалася систематизувати та видобувати певні знання із візуальної інформації, яку вона отримала із навколишнього середовища: наскельні малюнки, пізніше ілюстровані рукописи, ще пізніше - цілі енциклопедії з детальними зображеннями флори і фауни. А із появою камери процес отримання візуальних даних спростився в рази і надалі кількість цих даних експоненційно зростала.
Виявлення рептилій за допомогою штучного інтелекту має потенціал для вирішення низки важливих питань екології, сільського господарства та наукових досліджень. Маркування дикої природи є ефективним інструментом для збереження та управління багатьма видами. Ряд методів маркування використовується для управління та збереження рептилій.
Класифікація зображень із локалізацією - це віднесення зображення до заданого класу та малювання обмежувальної рамки навколо об'єкта, щоб показати, де він на ньому розташований. Розпізнавання зображень є одним із завдань, з якими успішно справляються згорткові нейронні мережі (CNN), - нейронні мережі, призначені для розпізнавання шаблонів.
У статті описано тренування моделі штучної нейронної мережі, а саме YOLOv5 на 24 прошарки, яка з точністю до 85% розпізнає та відносить плазуна на зображенні до одного із восьми визначених класів: хамелеони, крокодили, жаби, гекони, ігуани, ящірки, змії та черепахи. Дані для тренування та тестування моделі взято із відкритих джерел, зокрема пошукової системи Googleа також дочірньої платформи Google - Kaggle. Кожне зображення окремо було оброблене в графічному інструменті для анотації зображень Labellmg. У такий спосіб було опрацьовано 1135 фотографій 8-ми видів рептилій, 906 з яких в тренувальній, а 229 в тестовій вибірці.
Також було створено віконний застосунок на мові Pythonдля практичного застосування моделі з можливістю завантажити фото з комп'ютера та отримати результат у вигляді зображення з окресленими на ньому знайденими рептиліями.
Ключові слова: штучна нейронна мережа, згорткова нейронна мережа, CNN, штучний інтелект, розпізнавання об'єктів, класифікація, рептилії, плазуни, Python, YOLO.
Abstract
KolosNadiiaMyroslavivnaCandidate of Physical and Mathematical Sciences, Associate Professor at the Department of Discrete Analysis and Intelligent Systems, Ivan Franko National University of Lviv, Lviv,
Pats AnastasiiaBohdanivnaGraduate, Ivan Franko National University of Lviv, Bachelor of Computer Science, Lviv,
Recognition and classification of reptiles using artificial neural network
From the beginning of the birth of civilization, people tried to systematize and extract certain knowledge from the visual information they received from the environment: rock paintings, later illustrated manuscripts, even later - entire encyclopedias with detailed images of flora and fauna. And with the advent of the camera, the process of obtaining visual data became many times easier, and in the future, the amount of this data grew exponentially.
Detecting reptiles with the help of artificial intelligence has the potential to solve a number of important questions in ecology, agriculture and scientific research. The marking of wildlife is an effective tool for the conservation and management of many species. A range of marking techniques is used in reptiles management and conservation.
Image classification with localization is placing an image in a given class and drawing a bounding box around an object to show where ifs located in an image. Image recognition is one of the tasks in which convolutional neural networks (CNN) excel. CNN - the neural networks designed to recognize patterns.
The article describes the training of a 24-layer artificial neural network model, namely YOLOv5, which with 85% accuracy recognizes and assigns a reptile in an image to one of eight defined classes: chameleons, crocodiles, frogs, geckos, iguanas, lizards, snakes, and turtles. The data for training and testing the model are taken from open sources, in particular from the Google search engine, as well as Google's subsidiary platform - Kaggle. Each image was individually processed in the LabelImg image annotation tool. In this way, 1135 photos of 8 types of reptiles were processed, 906 of which were in the training sample, and 229 in the test sample.
A Python window application was also created for practical using of the model with the ability to download a photo from a computer and get the result as an image with the reptiles found on it outlined.
Keywords: artificial neural network, artificial intelligence, convolutional neural network, CNN, object recognition, classification, reptiles, Python, YOLO.
Основна частина
Постановка проблеми. Ефективними методами спостереження за об'єктами навколишнього середовища стали розробка та впровадження у виробничі процеси штучного інтелекту, зокрема штучних неиронних мереж, що, відтворюючи роботу людського мозку, мають властивість навчатися і розпізнавати певні закономірності та малюнки, навіть ті, які не піддаються опрацюванню людиною. Основними перевагами штучних нейронних мереж над людським мозком є здатність за короткий час засвоювати набагато більшу кількість інформації.
Завдяки застосуванню широкого спектру програм, які базуються на використанні штучного інтелекту, процес машинного розпізнавання об'єктів на зображеннях створив умови для більш інтенсивного розвитку у найрізноманітніших сферах, як от медицина, автомобільна промисловість, ігри, соціальна комунікація [1]. Також особливо актуальною у XXI столітті стала природоохоронна галузь, для якої використання штучного інтелекту - це вагома перевага, адже чим раніше буде виявлена проблема, тим швидше науковці зможуть взятись за її вирішення, і час, який економить нейронна мережа, буде доданий до часу здорового функціонування нашої планети.
Автоматичне виявлення рептилій на зображеннях за допомогою штучного інтелекту може бути корисним для багатьох сфер природоохоронної галузі. Ось кілька прикладів:
* Збереження фауни: багато видів рептилій знаходяться під загрозою зникнення через втрату первісного середовища існування, зміну клімату та інші негативні фактори. Використовуючи штучний інтелект для виявлення та моніторингу рептилій у їхньому природному середовищі існування, природоохоронці можуть краще зрозуміти особливості природних потреб цих тварин, прослідкувати зміну їхньої поведінки, еволюцію виду при мутації навколишнього середовища та розробити ефективніші стратегії їхнього збереження.
• Сільське господарство: деякі рептилії, наприклад змії, можуть завдавати шкоди посівам і худобі. Використовуючи штучний інтелект для виявлення та відстеження рептилій у сільськогосподарських угіддях, фермери зможуть сформувати знання про їхню поведінку, виокремити типових представників «шкідників» та розробити систему заходів, щоб запобігти збитку і захистити свою власність.
• Екологія: вивчення поведінки рептилій може дати розуміння низки наукових питань зі сфери екології, наприклад наслідків зміни клімату. Використовуючи штучний інтелект для виявлення та відстеження рептилій у польових умовах, дослідники можуть збирати дані, які було б важко або неможливо отримати будь-якими іншими способами, і завдяки ним прослідкувати, як впливають зміни клімату на представників цього виду, чим загрожують ці зміни в майбутньому рептиліям та іншим представникам тваринного світу, які закономірності цих змін можна прослідкувати у довготривалій перспективі.
• Герпетологія: герпетологи вивчають рептилій і земноводних, а виявлення рептилій за допомогою штучного інтелекту може допомогти їм ідентифікувати різних представників цього виду, вивчити їх поведінку та дізнатися більше про їхнє життя у різних умовах навколишнього середовища. Це може допомогти покращити наше розуміння цих тварин та їхньої ролі серед інших тварин у фауні.
Аналіз останніх досліджень і публікацій. Враховуючи зростання актуальності природоохоронної та екологічної тематики, в останні роки з'являються все нові і нові роботи по розпізнаванню плазунів та інших тварин з використанням різного роду глибоких нейронних мереж.
Так робота [2] присвячена класифікації отруйних та неотруйних змій за допомогою згорткових нейронних мереж. Запропонована авторами модель здатна класифікувати зображення змії з рівнем точності до 91%.
У дослідженні [3] була розроблена модель глибокого навчання на основі мережі CNNдля виявлення та класифікації тварин до однієї із трьох категорій: риби, рептилії та амфібії. Автори декларують дуже хороші результати точності, а саме, до 99% на тестових зображеннях.
У роботі 2023 року [4] автори навчили та протестували кілька моделей машинного навчання для класифікації трьох груп плазунів (змій, ящірок і жаб) за зображеннями із фотопасток. Під час експерементів із кількома моделями точність розпізнавання варіювалася від 72 до 87%.
Серед подібних досліджень останніх років варто відзначити статтю [5], у якій автори використали 8-прошаркову згорткову нейронну мережу для класифікації крокодилів, ящірок, змій та черепах. Модель, представлена у даній роботі досягає точності 64,3%. Порівняно із згаданою роботою, ми використали складнішу архітектуру нейронної мережі, що дозволило нам збільшити кількість класів розпізнавання, досягти кращої точності розпізнавання, а також ми вирішили не розглядати клас крокодилів, оскільки ці тварини є значно більшими за усіх інших рептилій по розміру і системі легше їх знаходити.
Мета статті - розробка та тренування моделі штучної нейронної мережі, яка б з високою точністю розпізнавала та класифікувала 8 видів рептилій на зображеннях; створення віконного застосунку для практичного застосування моделі.
Виклад основного матеріалу. Згорткові нейронні мережі (Convolutionalneuralnetwork, CNN [6, 7]) - це мережева архітектура для алгоритмів глибокого навчання, яка спеціально використовується для розпізнавання зображень і завдань, які включають обробку піксельних даних. Такий тип нейронної мережі може розкривати ключову інформацію як у часових рядах, так і в зображеннях. З цієї причини він дуже цінний для завдань, пов'язаних із зображеннями, наприклад класифікація об'єктів і розпізнавання образів.
Згорткові нейронні мережі глибокого навчання зазвичай складаються з трьох рівнів: згорткового прошарку (Convolutionallayer), прошарку об'єднання (Poolinglayer) та повнозв'язного прошарку (Fullyconnected, FC).
Більшість обчислень відбувається на згортковому рівні, який є основним будівельним блоком CNN. Мережа CNNможе мати кілька (іноді кілька сотень) послідовних згорткових прошарків. З технічної точки зору згортковий прошарок - це перетворення, яке застосовує певне ядро (фільтр) до невеликого вікна навколо кожної точки входу. Фільтр переміщається по зображенню, перевіряючи, чи присутня певна ознака в зображенні. За кілька ітерацій ядро охоплює все зображення. Після кожної ітерації обчислюється скалярний добуток між вхідними пікселями та фільтром. Остаточний результат серії точок називається картою об'єктів (featuremap). Зрештою, зображення перетворюється на числові значення на даному прошарку, що дозволяє CNNінтерпретувати зображення та витягувати з нього відповідні шаблони.
Від згорткового до повнозв'язного прошарку складність CNNзростає. Саме ця зростаюча складність дозволяє CNNпослідовно ідентифікувати більші частини та складніші характеристики зображення, поки вона нарешті не ідентифікує об'єкт повністю.
Для програм розпізнавання зображень, класифікації зображень і комп'ютерного зору (CV) CNNособливо корисні, оскільки вони забезпечують високоточні результати, особливо коли задіяно багато даних.
CNNможна перенавчити для нових завдань розпізнавання та побудувати на основі вже існуючих мереж. Ці переваги відкривають нові можливості використання згорткових нейронних мереж для реальних додатків без збільшення обчислювальної складності чи витрат.
Використані технології.
Python [8, 9] - це інтерпретована об'єктно-орієнтована мова програмування високого рівня з динамічною семантикою.
JupyterNotebookнадає середовище розробки на основі браузера, який зручний для співпраці, обміну та навіть публікації результатів наукових досліджень.
Colaboratory, або скорочено «Colab», є продуктом Google Research. Colabдозволяє будь-кому писати та виконувати довільний код Pythonчерез браузер і особливо добре підходить для машинного навчання та аналізу даних. Також Colabдозволяє використовувати блокноти Jupyterі ділитися ними з іншими без необхідності завантажувати, інсталювати чи запускати будь-що.
LabelImg - це графічний інструмент анотації зображень, який дозволяє малювати візуальні рамки навколо об'єктів на кожному зображенні, а також автоматично зберігає XML-файли зображень з мітками.
NumPy - це розширення мови Python, формати даних якого включають матриці та багатовимірні масиви.
Matplotlib - бібліотека для мови Pythonдля 20-графіків і зображень, яка переважно використовується для візуалізації наукових, інженерних і фінансових даних.
Pandas - це програмна бібліотека, написана для мови програмування Pythonдля зручної обробки даних та їхнього аналізу.
OpenCV[10] - допомагає студентам та професіоналам ефективно реалізовувати проекти та виконувати дослідження, використовуючи комп'ютерний зір та інфраструктуру машинного навчання, які раніше були доступні лише для кількох дослідницьких лабораторій. В бібліотеці OpenCVреалізовано і оптимізовано понад 2000 алгоритмів, що включає в себе як класичні алгоритми машинного зору так і сучасні.
YOLO (YouOnlyLookOnce) - система виявлення об'єктів у реальному часі, розроблена компанією Ultralytics. YOLOv5 [11, 12] - це найсучасніша модель виявлення об'єктів у реальному часі, яка пропонує покращену продуктивність і точність порівняно з попередніми версіями. Компанія Ultralyticsрозробила та випустила YOLOv5 як проект із відкритим вихідним кодом, зробивши його доступним для спільноти комп'ютерного зору та розробників у всьому світі. Проєкт отримав значну популярність завдяки своїй простоті, універсальності та високій продуктивності в задачах виявлення об'єктів. Він широко використовується в різних дослідницьких проектах, академічних дослідженнях і практичних застосуваннях.
YOLOv5 побудовано на архітектурі глибокої нейронної мережі, яка поєднує згорткові нейронні мережі (CNN) та прошарки виділяння ознак для виявлення та локалізації об'єктів на зображенні.
Підготовка даних та тренування моделі нейронної мережі для розпізнавання зображень. Пошук даних, а саме зображень різних видів плазунів, для тренування та тестування моделі, було здійснено за допомогою відкритих джерел, зокрема пошукової системи Googleа також дочірньої платформи Google - Kaggle, що дозволяє користувачам знаходити набори даних, які вони хочуть використовувати для побудови моделей штучного інтелекту. Згодом потрібно було вручну відсортувати та помістити зображення в каталоги по категоріях: «chameleon»Ј¬ «crocodile»Ј¬ «frog»Ј¬ «gecko», «iguana»Ј¬ «lizard»Ј¬ «snake»Ј¬ «turtle».
Кожне зображення окремо було оброблене в графічному інструменті для анотації зображень Labellmg (Рис. 1).
На виході отримуємо xml-файл з інформацією про саме фото (довжина, ширина, глибина), визначеними координатами рамки, назвою позначеного об'єкту і тому подібне. Витягуємо дані в таблицю, також розраховуємо додаткові параметри, наприклад середина рамки, її довжина та ширина. Оскільки нам не потрібна вся інформація, беремо лише потрібні нам дані з кожного xml-файлу та записуємо у звичайний текстовий файл центр рамки по х та по у, ширину та висоту рамки.
Рис. 1. Приклад анотації зображення в Labellmg
Ділимо всі елементи в папці на тренувальні (80%) та тестові (20%) дані та завантажуємо у відповідні папки на GoogleDrive. Повторюємо цю процедуру з зображеннями рептилій кожного класу.
Загалом, таким чином було оброблено 1135 фотографій 8-ми видів рептилій (Таб.), 906 з яких в тренувальній папці, а 229 в тестовій.
Назви класів рептилій та кількість даних в них
Назва |
Тренувальна |
Тестова |
|
Chameleon |
139 |
33 |
|
Crocodile |
108 |
28 |
|
Frog |
101 |
23 |
|
Gecko |
103 |
29 |
|
Iguana |
106 |
26 |
|
Lizard |
137 |
38 |
|
Snake |
105 |
26 |
|
Turtle |
107 |
26 |
|
Загалом |
906 |
229 |
Кількість появ класів плазунів може відрізнятись від кількості зображень плазунів, оскільки на одному фото могло бути більше одного плазуна, або ж декілька їх видів.
Рис. 2. Представлення даних у вигляді діаграми
Архітектура моделі. Модель YOLOv5sмає 24 прошарки (Рис. 3).
Рис. 3. Архітектура моделі YOLOv5s
Conv - застосовує функцію SigmoidLinearUnit (SiLU) поелементно;
C3 - CSP Bottleneck з 3 згортками;
SPPF - Spatial Pyramid Pooling-Fast прошарок для YOLOV5 від Glenn Jocher;
Upsample - збільшує дискретизацію заданих багатоканальних 1D(часових), 2D(просторових) або 3D (об'ємних) даних;
Concat - об'єднує список тензорів (скаляри, вектори, лінійні оператори) уздовж виміру.
Тренування моделі. Тренування моделі відбувалось на платформі GoogleColab, адже там можна під'єднатись до GoogleDriveде знаходяться всі необхідні, попередньо завантажені дані.
РепозиторійYOLOv5 було клоновано з GitHubза допомогою «! git clone https://github.com/ultralytics/yolov5».
Шляхом практичного підбору було вибрано відповідні параметри для навчання нещодавно розробленого набору даних. Для навчання моделі було обрано 49 епох, що зайняло приблизно 30 хв. Результати навчання показані на Рис. 4.
Рис. 4. Опис результатів тренування моделі
Точність натренованої моделі (Precision) - 0.801 (в класах варіюється
TP
від 0.715 до 0.926) обчислювалась за формулою: Precision= jp+pp.
Повнота натренованої моделі (Recall) - 0.823 (в класах варіюється від
TP
0.757 до 0.931) обчислювалась за формулою: Recall=Чч+ѓФ.
Тут TP= TruePositives (позитивний і правильний прогноз); FP= FalsePositives (позитивний, але неправильний прогноз); FN= FalseNegatives (негативний і неправильний прогноз).
Наступна матриця невідповідностей (Рис. 5) більш детально ілюструє якість розпізнавання по кожному із класів.
Рис. 5. Матриця невідповідностей
Виявлені рептилії на деяких тестових зображеннях після тренування моделі див. Рис. 6.
Рис. 6. Виявлені рептилії у тестовій вибірці
Віконний застосунок. Після збереження натренованої моделі, було створено віконний застосунок на мові Python, використавши графічну бібліотеку Tkinterдля зручного використання моделі для розпізнавання рептилій на фото. Зображення для тестування були взяті з пошукової системи Google. Кнопкою «Selectanimage» завантажуємо зображення з комп'ютера та після натискання «Detect» з'являється нове вікно з обраним зображенням та окресленими рамками з рептиліями на ньому (якщо такі були знайдені), див. Рис. 7.
нейронний мережа рептилія інтелект
Рис. 7. Результати розпізнавання в за стосунку
Висновки. Для реалізації задачі було зібрано дані у вигляді зображень різних видів рептилій. Також використано нейронну мережу YOLOv5, що складається з 24 прошарків, в тому числі згорткових. Натреновано модель для розпізнавання та класифікації плазунів на вхідних зображеннях з точністю до 85%. В результаті на зображеннях можна виявити до восьми видів рептилій: хамелеонів, крокодилів, жаб, геконів, ігуан, ящірок, змій та черепах.
Також було створено віконний застосунок для практичного застосування моделі з можливістю завантажити фото з комп'ютера та отримати результат у вигляді зображення з окресленими на ньому знайденими плазунами. Код програми доступний у [13].
Ця стаття може знайти своє застосування у вивченні та виявленні плазунів в дослідницьких, наукових та сільськогосподарських сферах. Бути корисною для подальшого індивідуального користування, або ж основою для майбутніх покращених застосунків для розпізнавання та класифікації обраних рептилій та інших їх видів.
Література
1. Ian Goodfellow, YoshuaBengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series) // MTE Press, 2016 - 800 стор.
2. Progga, N.I., Rezoana, N., Hossain, M.S., Islam, R.U., Andersson, K. A CNN Based Model for Venomous and Non-venomous Snake Classification // Applied Intelligence and Informatics: First International Conference, AII 2021, Nottingham, UK, Липень 30-31, 2021, Матеріали конференції, с. 216-231. https://doi.org/10.1007/978-3-030-82269-9Ў№7
3. Alsaadi, Elham&El abbadi, Nidhal. Auto Animal Detection and Classification among (Fish, Reptiles and Amphibians Categories) Using Deep Learning // Journal of Advanced Research in Dynamical and Control Systems, 11, 2019, с. 726-736.
4. Binta Islam S, Valles D, Hibbitts TJ, Ryberg WA, Walkup DK, Forstner MRJ. Animal Species Recognition with Deep Convolutional Neural Networks from Ecological Camera Trap Images // Animals. 13 (9):1526, 2023, https://doi.org/10.3390/ani13091526
5. CondroKartiko, AgiPrasetiadi, Elisa Usada. Reptile Recognition based on Convolutional Neural Network // International Journal of Innovative Technology and Exploring Engineering (IJITEE), Т.9 (3S), Січень 2020, с. 112-115.
6. Rahul Awati. Convolutional neural network (CNN) https://www.techtarget.com/searchenterpriseai/definition/convolutional-neural-network
7. Онлайн курс: Fei-Fei Li, Justin Johnson, Serena Yeung. Convolutional Neural Network for Visual Recognition (2017), https://www.classcentral.com/course/youtube-lecture-collection - convolutional-neural-networks-for-visual-recognition-spring-2017-53111
8. VanderPlas, J. Python Data Science Handbook // O5Reilly Media, Inc. 2016 - 546 стор.
9. Документація Python 3.9.0:https://docs.python.org/release/3.9.0/
10. Zelinsky A. Learning OpenCV - Computer Vision with the OpenCV Library (Bradski, G.R. et al.; 2008) [On the Shelf] // IEEE Robotics &Automation Magazine, vol. 16, №3, ст. 100-100, Вересень 2009, doi: 10.1109/MRA.2009.933612.
11. Документація YOLOv5:https://github.com/ultralytics/yolov5
12. Yao, Jia&Qi, Jiaming&Zhang, Jie&Shao, Hongmin&Yang, Jia&Li, Xin. A RealTime Detection Algorithm for Kiwifruit Defects Based on YOLOv5 // Electronics 10 (14):1711 2021, 10.3390/electronics10141711.
13. Код програми: https://github.com/nastyaPats/ReptilesDetection.git
References
1. Ian Goodfellow, YoshuaBengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series) // MTE Press, 2016 - 800 pages.
2. Progga, N.I., Rezoana, N., Hossain, M.S., Islam, R.U., Andersson, K. A CNN Based Model for Venomous and Non-venomous Snake Classification // Applied Intelligence and Informatics: First International Conference, AII 2021, Nottingham, UK, July 30-31, 2021, Proceedings, p. 216-231. https://doi.org/10.1007/978-3-030-82269-9_17
3. Alsaadi, Elham&El abbadi, Nidhal. Auto Animal Detection and Classification among (Fish, Reptiles and Amphibians Categories) Using Deep Learning // Journal of Advanced Research in Dynamical and Control Systems, 11, 2019, p. 726-736.
4. Binta Islam S, Valles D, Hibbitts TJ, Ryberg WA, Walkup DK, Forstner MRJ. Animal Species Recognition with Deep Convolutional Neural Networks from Ecological Camera Trap Images // Animals. 13 (9):1526, 2023, https://doi.org/10.3390/ani13091526
5. CondroKartiko, AgiPrasetiadi, Elisa Usada. Reptile Recognition based on Convolutional Neural Network // International Journal of Innovative Technology and Exploring Engineering (IJITEE), Volume-9 Issue-3S, January 2020, p. 112-115.
6. Rahul Awati. Convolutional neural network (CNN) https://www.techtarget.com/searchenterpriseai/definition/convolutional-neural-network
7. Online course: Fei-Fei Li, Justin Johnson, Serena Yeung. Convolutional Neural Network for Visual Recognition (Spring 2017), https://www.classcentral.com/course/youtube-lecture - collection-convolutional-neural-networks-for-visual-recognition-spring-2017-53111
8. VanderPlas, J. Python Data Science Handbook // O5Reilly Media, Inc. 2016 - 546 pages.
9. Python 3.9.0 documentation URL: https://docs.python.org/release/3.9.0/
10. Zelinsky A. Learning OpenCV - Computer Vision with the OpenCV Library (Bradski, G.R. et al.; 2008) [On the Shelf] // IEEE Robotics &Automation Magazine, vol. 16, no. 3, pp. 100-100, September 2009, doi: 10.1109/MRA.2009.933612.
11. YOLOv5 documentation: https://github.com/ultralytics/yolov5
12. Yao, Jia&Qi, Jiaming&Zhang, Jie&Shao, Hongmin&Yang, Jia&Li, Xin. A RealTime Detection Algorithm for Kiwifruit Defects Based on YOLOv5 // Electronics 10 (14):1711 2021, 10.3390/electronics10141711.
13. Program code: https://github.com/nastyaPats/ReptilesDetection.git
Размещено на Allbest.ru
...Подобные документы
Навчання штучних нейронних мереж, особливості їх використання для вирішення практичних завдань. Рецепторна структура сприйняття інформації. Перцептрон як модель розпізнавання. Задача моделювання штучної нейронної мережі з розпаралелюванням процесів.
дипломная работа [2,8 M], добавлен 24.07.2013Специфіка застосування нейронних мереж. Огляд програмних засобів, що використовують нейронні мережі. Побудова загальної моделі згорткової нейронної мережі. Реалізація нейромережного модулю розпізнавання символів на прикладі номерних знаків автомобілів.
дипломная работа [3,4 M], добавлен 15.03.2022Розробка, дослідження та реалізація методів вирішення завдань аналізу, розпізнавання і оцінювання зображень як один із провідних напрямків інформатики. Класифікація та аналіз існуючих методів розпізнавання образів, переваги та недоліки їх застосування.
статья [525,8 K], добавлен 19.09.2017Історія досліджень, пов’язаних з розпізнаванням образів, його практичне використання. Методи розпізнавання образів: метод перебору, глибокий аналіз характеристик образу, використання штучних нейронних мереж. Характерні риси й типи завдань розпізнавання.
реферат [61,7 K], добавлен 23.12.2013Розробка методів вирішення завдань аналізу, розпізнавання, оцінювання зображень як одних з провідних напрямків інформатики. Описання методу пошуку співпадіння об’єкту-цілі з міткою-прицілом на заданому відеоряді. Виявлення об’єкта на цифровому зображенні.
статья [138,7 K], добавлен 21.09.2017Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу оптичного розпізнавання символів. Шрифтові та безшрифтові алгоритми розпізнавання друкованого тексту.
курсовая работа [1,7 M], добавлен 19.05.2014Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.
дипломная работа [1,6 M], добавлен 02.07.2014Бібліотека Pcap та її реалізація WinPcap під платформу Windows. Аспекти робот з бібліотекою WinPcap. Штучні нейронні мережі. Застосування бібліотеки Winpcap для захоплення мережевого трафіку. Реалізація нейронної мережі Кохонена для аналізу заголовків.
дипломная работа [2,2 M], добавлен 09.06.2012Характеристика інструментів MatLab - пакету прикладних програм для числового аналізу. Основні функції та можливості програмного комплексу. Скриптова мова програмування. Побудова моделі штучної нейронної мережі за допомогою команди NNTool та її тестування.
лабораторная работа [215,8 K], добавлен 11.06.2015Огляд методів розпізнавання образів. Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. Критерій оптимізації параметрів функціонування даної системи. Інформаційне та програмне забезпечення обробки рукописних символів.
дипломная работа [291,0 K], добавлен 14.10.2010Топології нейронної мережі та їх застосування, варіанти вибору архітектури мереж, число проміжних шарів і число елементів, архітектури мереж користувачів. Мережі для задач з багатьма класами, операція додавання матриці втрат, багатошаровий перцептрон.
контрольная работа [227,3 K], добавлен 21.06.2011Характеристика особливостей побудови біологічних та штучних нейронних мереж. Вивчення їх активіаційних функцій: порогової бінарної, лінійної обмеженої, гіперболічного тангенса. Персептрони і зародження штучних нейромереж. Багатошарові нейронні мережі.
реферат [1,2 M], добавлен 11.06.2010Методи побудови довірчих інтервалів для невідомої імовірності. Оцінка неоднорідності генеральної сукупності за допомогою лінійних сплайнів. Непараметричні критерії еквівалентності генеральних сукупностей за допомогою мір близькості між вибірками.
автореферат [32,7 K], добавлен 06.04.2009Поняття штучного інтелекту, його порівняння з природним. Коротка характеристика особливостей використання штучного інтелекту в медицині, військовій справі та комп'ютерних іграх. Проблема взаємодії носіїв універсального штучного інтелекту та суспільства.
контрольная работа [29,6 K], добавлен 07.01.2014Огляд інтелектуальних принципів організації процесу розпізнавання символів. Розробка системи безклавіатурного введення документів у комп’ютер. Опис і обґрунтування проектних рішень; розрахунки і експериментальні дані; впровадження системи в експлуатацію.
дипломная работа [182,5 K], добавлен 07.05.2012Класифікація комп'ютерних мереж. Забезпечення функціонування локальної мережі за допомогою сервера. Топологія локальної мережі. Оптоволоконний інтерфейс до розподілених даних FDDI. Бездротові технології Wi-Fi, Bluetooth, GPRS. Мережеві апаратні засоби.
реферат [561,2 K], добавлен 15.03.2013Алгоритм оптичного розпізнавання образів. Універсальність таких алгоритмів. Технологічність, зручність у процесі використання програми. Два класи алгоритмів розпізнавання друкованих символів: шрифтовий та безшрифтовий. технологія підготовки бази даних.
реферат [24,5 K], добавлен 19.11.2008Захист електронних платежів у мережі Іntегnеt. Побудова захисту електронних банківських документів. Криптографічний захист інформації. Захист інформації та вирішення питань безпеки у СЕП. Роботи програмно-технічних комплексів в інформаційній мережі.
контрольная работа [293,9 K], добавлен 26.07.2009Налаштування інтернет-з’єднання за допомогою мобільного телефону. Проєктування і налаштування провідної мережі, бездротової мережі WiFi. Робота з BT. З’єднання пристроїв, сервіс, безпека. Робота з електронною поштою. Огляд технології 3G, 2.75G, 2.5G.
контрольная работа [29,2 K], добавлен 08.02.2011Системи розпізнавання обличчя. Призначення та область застосування програми "Пошук обличчя люди у відеопотоках стандарту MPEG-4". Штучна нейронна мережа, локалізація та розпізнавання обличчя. Методи, засновані на геометричних характеристиках обличчя.
курсовая работа [1,8 M], добавлен 27.03.2010