• Регистрация
Н/Д
Н/Д 0.00
н/д

Распознавание объектов: 3 вещи, которые необходимо знать

21.10.2020

Что такое распознавание объектов?

Распознавание объектов — это метод компьютерного зрения для идентификации объектов на изображениях или видео. Распознавание объектов является основным результатом алгоритмов глубокого и машинного обучения. При просмотре фотографий или видео, человек может легко распознать людей, предметы, сцены и визуальные детали. Цель состоит в обучении компьютера делать то, что естественно для людей: достичь уровня понимания того, что содержит изображение.


Изображение 1. Использование распознавания объектов для идентификации различных категорий объектов.

Распознавание объектов является важной технологией беспилотных автомобилей, позволяющая им распознавать знаки остановок или отличать пешехода от фонарного столба. Он также полезен в различных приложениях, таких как идентификация заболеваний в биовизуализации, промышленном контроле и роботизированном зрении.

 

Распознавание объектов и обнаружение объектов

Обнаружение объектов и распознавание объектов являются схожими методами для идентификации объектов, но они различаются по своему исполнению. Обнаружение объектов — это процесс обнаружения экземпляров объектов на изображениях. В случае глубокого обучения методы обнаружения объектов — это подмножество методов распознавания объектов, когда объект не только идентифицируется, но и располагается на изображении. Это позволяет идентифицировать несколько объектов и размещать их на одном изображении.


Изображение 2. Распознавание объектов (слева) и обнаружение объектов (справа).

 

Как работает распознавание объектов

Возможно использование различных подходов для распознавания объектов. В последнее время методы машинного и глубокого обучения стали популярными подходами к проблемам распознавания объектов. Обе технологии учатся распознавать объекты на изображениях, но они различаются по своему исполнению.


Изображение 3. Методы машинного обучения и глубокого обучения для распознавания объектов.

В следующем разделе объясняются различия между машинным обучением и глубоким обучением для распознавания объектов и показано, как реализовать оба подхода.

 

Методы распознавания объектов

Распознавание объектов с использованием глубокого обучения

Методы глубокого обучения стали популярным методом распознавания объектов. Модели глубокого обучения, такие как сверточные нейронные сети (или CNN), используются для автоматического изучения присущих объекту свойств, чтобы идентифицировать этот объект. Например, CNN может научиться определять различия между кошками и собаками, анализируя тысячи изображений и изучая характеристики, различающие кошек и собак.

Существует два подхода к распознаванию объектов с использованием глубокого обучения:
- Обучение модели с нуля. Чтобы обучить глубокую сеть с нуля, необходимо собирать очень большой размеченный набор данных и разработать архитектуру сети, которая будет изучать характеристики и строить модель. Результаты могут быть впечатляющими, но этот подход требует большого количества обучающих данных, а также необходимо настраивать уровни и веса в CNN.
- Использование предварительно обученной модели глубокого обучения: большинство приложений глубокого обучения используют подход трансферного обучения – процесс, который включает в себя точную настройку предварительно обученной модели. Для начала берется существующая сеть, такая как AlexNet или GoogLeNet, и вводятся новые данные, содержащие ранее неизвестные классы. Этот метод требует меньше времени и может обеспечить более быстрый результат, поскольку модель уже обучена на тысячах или миллионах изображений.
Глубокое обучение предлагает высокий уровень точности, но требует большого количества данных для точных прогнозов.


Изображение 4: Приложение глубокого обучения, демонстрирующее распознавание объектов ресторанной еды.

 

Распознавание объектов с помощью машинного обучения

Методы машинного обучения также популярны для распознавания объектов и предлагают отличные от глубокого обучения подходы. Распространенные примеры методов машинного обучения являются:
- извлечение функций HOG с помощью модели машинного обучения SVM;
- модели «мешков слов» (bag-of-words) с такими функциями, как SURF и MSER;
- алгоритм Виолы-Джонса, который можно использовать для распознавания различных объектов, включая лица и верхнюю часть тела.

 

Процесс машинного обучения

Для распознавания объектов с использованием стандартного подхода машинного обучения необходимо начать с набора изображений (или видео) и выбрать соответствующие характеристика в каждом изображении. Например, алгоритм извлечения элементов может извлекать элементы ребер или углов, которые можно использовать для различения классов в пользовательских данных.
Эти функции добавляются в модель машинного обучения, которая разделяет эти характеристики на отдельные категории, а затем использует эту информацию при анализе и классификации новых объектов.
Вы можете использовать различные алгоритмы машинного обучения и методы извлечения признаков, которые предлагают множество комбинаций для создания точной модели распознавания объектов.

 


Изображение 5: Рабочий процесс машинного обучения для распознавания объектов.

Использование машинного обучения для распознавания объектов дает гибкость в выборе наилучшего сочетания функций и классификаторов для обучения. Он может достичь точных результатов с минимальными данными.

 

Машинное обучение и глубокое обучение для распознавания объектов

Выбор наилучшего подхода к распознаванию объектов зависит от поставленной задачи. В большинстве случаев машинное обучение может быть эффективным методом, особенно если известно, какие характеристики изображения лучше всего использовать для различения классов объектов.
Главное, о чем следует помнить при выборе между машинным и глубоким обучением, - это наличие у мощного графического процессора и множества размеченных обучающих изображений. Если ответ на любой из этих вопросов отрицательный, подход машинного обучения может быть лучшим выбором. Методы глубокого обучения, как правило, лучше работают с большим количеством изображений, а графический процессор помогает сократить время, необходимое для обучения модели.

 


Изображение 6. Ключевые факторы выбора между глубоким обучением и машинным обучением.

 

Другие методы распознавания объектов

В зависимости от задачи может быть достаточно других, более простых подходов к распознаванию объектов:

- сопоставление с шаблоном, при котором используется небольшое изображение или шаблон для поиска совпадающих областей на большом изображении.
- сегментация изображений и анализ BLOB-объектов, при котором используются простые свойства объекта, такие как размер, цвет или форма.
Как правило, если объект можно распознать с помощью простого подхода, такого как сегментация изображения, лучше всего начать с более простого подхода. Это может обеспечить надежное решение, которое не требует сотен или тысяч обучающих изображений или чрезмерно сложного решения.

 

Распознавание объектов с помощью MATLAB

Глубокое обучение и машинное обучение

С помощью всего нескольких строк кода MATLAB® возможно создавать модели машинного и глубокого обучения для распознавания объектов, не будучи экспертом.

Использование MATLAB для распознавания объектов позволяет добиться успеха за меньшее время, поскольку позволяет:

- использовать свой опыт в предметной области и изучать науку о данных с MATLAB:
Вы можете использовать MATLAB, чтобы учиться и получать опыт в области машинного и глубокого обучения. MATLAB делает изучение этих областей практичным и доступным. Кроме того, MATLAB позволяет экспертам в предметной области создавать модели распознавания объектов вместо того, чтобы передавать задачу специалистам по данным, которые могут не знать отрасль или задачу.

- использовать приложения для разметки данных и построения моделей:
MATLAB позволяет создавать модели машинного и глубокого обучения с минимальным кодом.

С помощью приложения Classification Learner можно быстро создавать модели машинного обучения и сравнивать различные алгоритмы машинного обучения без написания кода.

Используя приложение Image Labeler, можно интерактивно размечать объекты на изображениях и автоматизировать разметку в видеороликах для обучения и тестирования моделей глубокого обучения. Этот интерактивный и автоматизированный подход может привести к лучшим результатам за меньшее время.

- объединять распознавание объектов в единый процесс:
MATLAB может объединить несколько операций в один рабочий процесс. С MATLAB можно думать и программировать в одной среде. Он предлагает инструменты и функции для глубокого и машинного обучения, а также для ряда областей, которые используются в этих алгоритмах, таких как робототехника, компьютерное зрение и аналитика данных.

MATLAB автоматизирует развертывание моделей в корпоративных системах, кластерах, облаках и встроенных устройствах.

 

 

 

Теги

      21.10.2020

      Комментарии