Машинное зрение на практике, или Новые цифровые помощники

23 сентября 2020 г.

В этой статье мы расскажем, как новейшие технологии машинного зрения могут помочь в решении повседневных бизнес-задач. А также о том, почему решений на рынке много, но не все они хорошо работают — и довериться можно лишь нескольким. Кроме того, поделимся собственным опытом реализации подобных проектов на производстве и в бизнесе.

Для начала рассмотрим, что такое современные системы машинного зрения и какие задачи они решают.

Задачи: Поиск объекта, Классификация, Трекинг.

Компоненты систем машинного зрения:

Безусловно, камера (редко одна, чаще несколько десятков, возможно сотни).
ПО работы и управления видеопотоком (VMS или Video Management System).
Обученная нейронная сеть (одна, а чаще несколько, работающих на решение одной задачи).
Серверное оборудование с GPU, где обученные нейросети работают с видеопотоком.
ПО аналитики или «ПО верхнего уровня», куда отправляются результаты от всех перечисленных подсистем, а также прописывается нужная математика и логика исходя из задачи.

Стоит отметить, что среда подготовки и обучения нейросетей не входит в список компонентов машинного зрения, т. к. эта часть выносится за рамки работы готовой системы. Но именно ее функционал и возможности играют ключевую роль в качестве обученной нейросети, ее последующего администрирования и изменения под изменяющиеся бизнес-задачи или требования. В список компонентов также не вошли вторичные системы — как программные, так и аппаратные, подключаемые к системам машинного зрения и работающие с командами, полученными от ПО аналитики.

Приведем несколько примеров прежде, чем продолжить.

1. Контроль использования СИЗ на производстве

Первым объектом поиска нейросети является человек. Следующим — объекты слежения: руки, голова, глаза. Затем на объектах слежения нейросеть обучена распознавать наличие или отсутствие тех или иных СИЗ.

Другими словами: если в поле зрения системы попадает просто защитная каска или перчатка — система никак не реагирует на это событие, поскольку оно не представляет для нее никакого интереса. Интерес представляет именно искомый СИЗ применительно к тому или иному объекту слежения. Т. е. каска на голове — это условный «+», а вот каска в руке или под мышкой — уже условный «-». Для наглядности и лучшего визуального восприятия на этапе обсуждения задания с заказчиком и пилотирования мы выделяем цветом объекты слежения. Когда же система запущена в эксплуатацию, никаких кружочков и квадратиков от нее не требуется. Нужны лишь те самые условные «+» и «-», которые мы передаем по API следующим подключаемым компонентам (вторичным системам).

«Каким компонентам?» — спросите вы.

В случае с промышленной безопасностью важнейшими являются сохранность здоровья персонала и предупреждение несчастных случаев на производстве. Поэтому условные «плюсы» и «минусы» можно свести в графики и таблицы, показав руководству, кто и когда пренебрегает защитой. Но более правильным будет подключение системы оповещения внутренней службы безопасности посредством отправки сигнала на мобильное устройство (смс, e-mail, PUSH) или на пульт оператора с отправкой ключевого кадра, на что среагировала система, и необходимой информацией о времени и месте срабатывания. При этом надо понимать, что работа нейросети происходит в режиме online и 24×7, на отправку уведомления требуются доли секунд. Безусловно, можно отправлять управляющие сигналы на внешние системы оповещения (громкоговорители) — куда угодно, где есть программный интерфейс управления (API).

2. Контроль объектов слежения с использованием БПЛА

В этом примере покажем, что системы машинного зрения не привязаны к стационарным камерам. Это, в том числе, могут быть и камеры беспилотных летательных аппаратов (БПЛА) — как нативные, так и оснащенные тепловизорами, системами ночного зрения и т. д.

Сфера применения огромна! С учетом развития БПЛА, увеличения времени их автономности и качества передаваемого сигнала использовать машинное зрение на БПЛА можно и для облета периметра закрытых территорий с целью его контроля, и для инспекции всевозможных узлов и агрегатов, и для слежения за определенным объектом, и во многих других случаях.

Пример: облет линий высоковольтных ЛЭП с целью поиска провисания линии, пробоя изолятора, упавшего дерева и т. п. Результат работы системы: ключевой кадр, на что сработала система, + GPS-координаты места события для отправки ремонтной бригады на планшет оператору или в ситуационный центр.

Важно понимать, что системы машинного зрения на текущем этапе развития не призваны заменить человека. Относиться к ним надо как к дополнительным, вспомогательным для управленческого персонала системам, помогающим минимизировать ошибки и издержки компании, но принятие решения в любом случае остается за человеком.

3. Превентивная работа с целью повышения культуры вождения

Дано: огромный парк корпоративных автомобилей, оснащённых стандартными видеорегистраторами.

Задача: поиск потенциально агрессивных водителей для проведения разъяснительных бесед и снижения возможности ДТП с их участием.

Решение. Данные с регистраторов агрегируются в дата-центре и обрабатываются нейросетями на предмет поиска нарушений:

пересечение сплошной линии;
пересечение двойной сплошной линии и выезд на встречную полосу;
водитель не уступил пешеходу на пешеходном перекрестке;
опасное сближение с впереди идущим транспортном (экстренное торможение);
поворот/разворот в неположенном месте;
проезд на запрещающий сигнал светофора;
превышение скоростного режима;
съезд с разрешенного участка для движения (съезд с асфальта на обочину).

Результат работы нейросети: таблица с метаданными по каждому водителю — на что, где и когда сработала система, с возможностью просмотреть фрагмент по каждому событию для принятия управленческого решения.

Этим примером мы хотим показать, что не всегда нейросети используют для обработки видеопотоков online. Для нейросетей есть множество задач с уже накопленным материалом, где нужно разобрать архивы с целью поиска того или иного события/объекта.

Кроме того, этот пример демонстрирует, что кроме логики работы есть еще возможность использовать математические методы анализа получаемых данных. Например: мы видим знак ограничения скоростного режима; видим текущую скорость авто из данных видеорегистратора; видим, что знак проезжаем — т. е. начинается зона его действия, и в этот момент начинаем следить именно за превышением скорости авто относительно знака ограничения скорости. Если превышение более 10 км/ч — делаем запись в таблицу, если меньше — не делаем и т. д.

4. Социальное дистанцирование

Законы времени, в котором мы живем, порой слишком быстро диктуют новые правила, к которым нужно так же быстро адаптироваться. И от того, насколько быстро эта адаптация произойдет, зависят выживание бизнеса в сложный период и даже жизни сотрудников.

Ниже предлагаем посмотреть, как можно решать задачи социальной дистанции и в первую очередь — наблюдение, т. е. контроль над соблюдением необходимой (заданной) дистанции.

Вывод из приведенных примеров напрашивается следующий: системы машинного зрения могут быть применимы везде, где есть камеры либо видеоархивы и где существует необходимость находить объекты, классифицировать и следить (трекинг) за ними. При этом одна система может включать в себя сотни камер, которые будут работать как единый организм над решением одной задачи.

Доступность и бесплатность библиотек для обучения простых нейросетей (TensorFlow, Caffe) и популярность языка программирования Phyton сделали процесс создания первых нейросетей крайне простым для любого желающего, кто углубился в тему чуть дальше обывательского уровня. Это и хорошо, и одновременно плохо. Хорошо тем, что вовлеченных в мир искусственного интеллекта программистов все больше и больше, и не за горами фантастические прорывы в этой области. Но с другой стороны, доступность и простота породили огромное количество стартапов, т. е. тех ребят, кто поверил в свои силы, до конца не осознавая всей глубины и сложности задачи, с которой придется столкнуться.

Не секрет, что крупные западные компании вкладывают десятки и сотни миллионов долларов в свои разработки на базе ИИ. Никто не спорит, что это технологии завтрашнего дня, которые начинают свой путь сегодня и с каждым годом становятся умнее, функциональнее и дешевле.

Для своих решений мы выбрали аппаратную и программную платформу, предлагаемую компанией IBM.

Почему IBM?

Мировой опыт IBM и десятилетия инноваций от IBM Research & Development в области видеоаналитики. Все продукты IBM для видеоаналитики и машинного зрения — это не покупки, а собственные разработки, вышедшие из крупнейших исследовательских лабораторий, таких, например, как лаборатория IBM в Китае.
Мировой опыт реализации крупнейших проектов, таких как «Умный город», «Безопасный город», «Безопасный аэропорт», «Безопасный вокзал» и т. д. Экспертиза и опыт команды разработчиков, участвовавших в проектах, доступны и для российских заказчиков.
Решение может быть развернуто как на существующих у заказчика серверах х86 (соответствующих требованиям), так и на собственных серверах IBM System Power AC922 и IC922 с мощными CPU и GPU, которые специально разработаны для задач, связанных с ML/DL и большими потоками данных, и оптимально сбалансированы под них. Серверы IC922 являются отличным и конкурентным аналогом серверам классической х86 архитектуры.
Уникальные алгоритмы, максимально эффективно нагружающие CPU и GPU и равномерно распределяющие нагрузку между ними, что позволяет обрабатывать бОльшее количество потоков на одном сервере.
Быстрое доведение точности до требуемого уровня. Первые нейросети по заданию заказчика могут быть готовы уже через несколько часов после начала работы.
Независимость от конкретного производителя камер или СВН. Мы можем их интегрировать почти в любую существующую среду видеонаблюдения на предприятии с минимальными изменениями.
Широкий пакет программных продуктов IBM, из которых можно создать решение для любой задачи:
- IBM Maximo Visual Inspection (ранее IBM Visual Insight). В состав продукта входит широкий набор инструментов для обучения нейросетевых моделей и подготовки датасета. В состав решения ходят популярные среды глубокого обучения и необходимые для их работы компоненты
- IBM Visual Inspections Mobile (Visual Inspector) — для применения обученных моделей с использованием мобильных устройств для различных инспекций.
- IBM Video Analytics — основной продукт, который позволяет подключать сотни и тысячи камер любых производителей, осуществлять трекинг объектов, имеет специальный интерфейс администратора, дающий возможность настраивать правила поведения или состояния объектов, которые необходимо отслеживать, генерировать мгновенные оповещения в интерфейс оператора или как сигналы другим системам, а также «индексировать» видеопотоки, описывая все происходящее в виде метаданных, по которым впоследствии оператор может выполнять поиск интересующих объектов или событий.

Если вы дочитали до этих строк, значит, статья была как минимум интересна — и либо вы нашли ответы на какие-то копившиеся вопросы, либо вопросов стало еще больше 😊.

У компании Barnet за последние годы накоплен богатый опыт и экспертиза в подобных решениях, что отмечено нашим вендором и чем мы с вами с готовностью поделимся.

Обращайтесь: +7 495 662-99-37, info@barnet.ru.

Источник: На правах рекламы

Печать Печать без изображений Все новости и статьи

Новости ИТ-бизнеса и статьи

Компании повышают требования к системным администраторам на «рынке работодателя»

Аналитики hh.ru специально ко Дню сисадмина, который отмечается в этом году 25 июля, выяснили, как изменился спрос на этих специалистов у российских …

Компания BAIKALSEA Company перешла на AXELOT WMS

BAIKALSEA Company перевела свою складскую логистику под управление AXELOT WMS. С 2017 года BAIKALSEA Company применяет решения AXELOT для управления …

ГК Softline стала платиновым партнером VK Tech

ГК Softline (ПАО «Софтлайн») стала платиновым партнером VK Tech. Новый партнерский статус отражает значимые результаты группы компаний в продвижении …

46% россиян пользуется онлайн-магазинами только в случае необходимости

ИТ-интегратор AWG провел опрос, чтобы комплексно исследовать опыт онлайн-покупок россиян в 2025 году – от частоты обращений к онлайн-ритейлерам …

Цифровой аудитор внедрен на горячей линии московских судов

ДИТ Москвы расширил использование технологий искусственного интеллекта для улучшения качества консультаций в общегородском контакт-центре. На горячей …

Аналитика

25 лучших российских системных интеграторов 2025

IT Channel News публикует результаты очередного исследования «25 лучших российских системных интеграторов» и представляет победителей 2025 года.

25 лучших региональных ИТ-компаний 2024

IT Channel News публикует результаты очередного — уже 17-го! — исследования «25 лучших региональных ИТ-компаний» и представляет победителей 2024 года.

25 лучших российских системных интеграторов 2024

IT Channel News публикует результаты очередного исследования «25 лучших российских системных интеграторов» и представляет победителей 2024 года.

Новые ИТ-продукты

Riso

RISO MH 9350 – единственный в мире ризограф с двумя барабанами

QTECH

QWP-86 — современная точка доступа с двумя радиомодулями.

IPPON

Новинки в Merlion: ИБП Ippon Innova Unity мощностью 10кВА и 20кВА

Истории успеха

Галэкс в рейтинге крупнейших ИТ-компаний России

Компания Абак-2000 — официальный «Надежный поставщик» 2024 года