2022/08/04 12:27:32

Интеллектуальная видеоаналитика

Еще несколько лет назад у систем ИИ в области видеоаналитики было много ограничений, скажем, было невозможно распознавать лицо, если в кадре оно повернуто в сторону, плохо распознавались документы при слабом освещении и т.д. Как изменилась ситуация сегодня? Как методы искусственного интеллекта помогают сегодня распознавать, выявлять объекты, персоны, ситуации высокой сложности и с высокой точностью?

Статья входит в обзор TAdviser "Технологии искусственного интеллекта"

Содержание


Согласно прогнозу аналитиков MarketsandMarkets, объем мирового рынка видеонаблюдения вырастет до 74,6 млрд. долл. к 2025 г. при среднегодовом темпе роста 10,4%. При этом российский рынок, по мнению экспертов Tadviser, растет в среднем на 20% в год. Стремительный спрос обусловлен, как ростом популярности искусственного интеллекта и глубокого обучения для систем видеонаблюдения, так и главной потребностью общества в безопасности. Один из косвенных признаков популярности того или иного рыночного сегмента – объемы бизнес-сделок: в декабре прошлого года компания Intema, принадлежащая «Центру искусственного интеллекта МТС», подписала обязывающие документы о приобретении VisionLabs, одного из лидеров российского рынка распознавания лиц, за 7 млрд руб. Продавцами выступают основатели VisionLabs, которым до сделки принадлежало 51,77% акций, а также структуры «Сбера» и венчурного фонда АФК «Система» Sistema_VC (владели 25,07% и 23,16% акций соответственно). Что касается Сбера, то такое решение компании связано с намерением продать принадлежащий ему пакет акций VisioLabs, чтобы сосредоточиться на развитии «Центра речевых технологий» - еще одной компании в его портфеле, которая, помимо аудиотехнологий, также занимается распознаванием лиц.

Сложные и умные решения видеоаналитики становятся сегодня составной частью аппаратных решений – умных видеокамер и т.п. оборудования, что делает такие решения доступнее для небольшого бизнеса. Например, такого рода решения поставляет компания Dahua Technology под брендом бренда EZ-IP: камеры для видеонаблюдения и видеорегистраторы с видеоаналитикой, а также сетевое оборудование. Устройства предназначены для контроля входа и выхода посетителей, внешнего мониторинга, обеспечения безопасности кассового узла и др.

Управление системой осуществляется с мобильного устройства (технология P2P) удобным для оператора способом – по QR-коду. Предусмотрена также отправка уведомлений на подключенный мобильный телефон.

«
Все это направлено на создание безопасной среды в сфере малого и среднего бизнеса, — говорят в компании.
»

О текущих ограничениях систем видеонаблюдения Михаил Смирнов, и.о. генерального директора компании «Системы компьютерного зрения» (входит в группу компаний ЛАНИТ), говорит так:

«
Ограничения остаются, ведь нельзя увидеть то, чего нет, и нельзя распознать то, чего не видно. Тем не менее, ведется активная доработка алгоритмов по уменьшению числа «нерабочих» ситуаций. Создаются комбинированные методы, которым достаточно распознать объект в какой-то момент, и дальше они его смогут отслеживать. Увеличивается дальность обнаружения, быстродействие систем.
»

По оценке Дмитрия Морозова, директора по развитию компании 3DiVi, точность алгоритмов распознавания сегодня достигает 99,7% на базах объемом около одного миллиона лиц, причем, результат не ухудшает наличие шапки, медицинской маски, парика, очков, фальшивой бороды и т.д. Сегодняшние технологии способны работать в условиях затемнения. Метавселенная ВДНХ 4.9 т

Михаил Смирнов приводит другие примеры продвинутых решений: системы распознавания лиц с больших расстояний (более 20 метров) через видеокамеру смартфона, системы дефектоскопии на производстве, использующие камеры с расширенными возможностями (поляризация, ИК и т.д.) для определения дефектов с миллиметровой точностью, системы 3D-реконструкции с использованием нейровозможностей и т.д. Например, в терминале распознавания лица BioSmart Quasar уникальная оптическая система, включающая стереокамеру с адаптивной подсветкой, способна построить 3D-модель лица даже в полной темноте.

«
Несколько лет назад для обучения нейронных сетей было доступно не так много фотографий лиц, и они чаще всего были сделаны анфас с хорошим равномерным освещением. Соответственно, когда на вход нейросети подавали фотографию с поворотом лица или неравномерным освещением, точность распознавания существенно ухудшалась,- рассказывает Алексей Цыплов, руководитель управления цифровизации производства компании «Русатом Инфраструктурные решения».
»

В последние годы произошел серьезный прорыв в разработке архитектур нейронных сетей, постоянно растет их сложность, говорит эксперт. Помогло также развитие вычислительных мощностей - новые модели видеокарт Nvidia, создании Google тензорных процессоров TPU, да и в целом появились мощные компьютеры, способные справиться с задачей обучения нейросетей в разумное время.

«
Также появились не только большие базы данных с фотографиями, но и технологии построения синтетических данных для обучения нейронных сетей,- продолжает Алексей Цыплов.- Генеративные модели нейросетей позволяют сгенерировать набор картинок с измененным углом поворота головы и разным источником света. Повышение вариативности в данных для обучения нейронных сетей привело к повышению точности распознавания лиц. Нейросети также научились делать дополнительные преобразования, устраняя поворот и наклон, и осуществлять 3D-реконструкцию лица из 2D-изображения лица под углом.
»

В целом, полагает Дмитрий Николаев, к.ф.-м.н., технический директор компании Smart Engines, не всегда достижение нового уровня технического совершенства требует использования принципиально новых подходов.

«
Та ситуация, когда у искусственного интеллекта было много различных ограничений по применению, никогда не была связана непосредственно с особенностями ИИ,- считает он.- Просто для того, чтобы убедиться в том, что ваша система устойчиво работает в некоторых условиях, нужно определенное время.
»

Действительно, системы видеонаблюдения работают в очень разных условиях, и разработчикам необходимо оценить эти условия по самым разным шкалам: освещенность, погодные условия, туман, боремся ли мы с загрязнением камеры или считаем, что она всегда чистая и т.д.

«
Поэтому зрительный интеллект внедряется значительно медленнее, чем, например, технологии проводной связи. Ведь повлиять на сигнал, который идет по экранированному проводу, довольно сложно, а вот на получаемую на выходе картинку можно повлиять миллионом разных способов,- поясняет Дмитрий Николаев.
»

Он приводит в пример решение Smart Engines для полного распознавания основного разворота паспорта РФ с рукописным заполнением, включая не до конца развернутую «книжку» паспорта: потребовалось решить множество технических задачи с учетом всевозможных геометрических особенностей в видеопотоке и на фотографиях, но обновления стека базовых технологий это не потребовало.

Разнообразие типов объектов для видеораспознавания

Компания Platforma, совместное предприятие ВТБ и «Ростелекома», занимается разработкой нового сервиса для страхового бизнеса: он способен оценивать по изображению масштаб повреждений кузова автомобиля после ДТП, обнаруживать на поверхности машины следы грязи, снега, наклеек и т.д. Система, которая прошла обучение на наборе из 30 тыс. фотографий автомобилей, где присутствовало более 65 тыс. элементов автомобиля, устойчиво распознает 48 видов деталей и 14 типов повреждений.

Компания «Системы компьютерного зрения» (входит в группу ЛАНИТ) внедряют решение Smart Timber, предназначенное для автоматизации подсчета круглого леса с помощью алгоритмов компьютерного зрения, на предприятиях лесопромышленного холдинга Segezha Group в Карелии и Вологодской области. В ходе проекта реализована интеграция с системой учета древесины АСД «СегежаЛес», причем, данные со всех бизнес-единиц предприятия собираются на сервере Smart Timber, размещенном в облачном хранилище Segezha Group.

Пилотные проекты показали: система производит измерения с точностью до 97% и позволяет сократить количество ошибок в измерениях, неизбежных при ручном методе подсчета.

«
Система инкорпорирована в контур управления группы и работает вместе с человеком, обучается работать в конкретных прикладных условиях. Объем и качество распознаваемых параметров будет улучшаться непрерывно путем обучения на больших потоках данных,- говорит Сергей Меркулов, директор по цифровой трансформации Segezha Group.
»

Новое направление анализа видео связано с экспресс-аналитика изображений, получаемых с БПЛА. Так, ученые Сколтеха разработали систему мониторинга, позволяющую производить сегментацию изображения в режиме реального времени на борту БПЛА и идентифицировать борщевик - вредоносное растение, представляющее опасность для сельского хозяйства и здоровья человека. Данное решение позволяет получать информацию о распространении растения с высоким разрешением, даже если небо затянуто облаками.

Кроме того, удалось отказаться от традиционной концепции «сбор данных – создание ортофотоплана – анализ полученного изображения» в пользу обработки данных аэрофотосъемки прямо на борту БПЛА во время полета. Это стало нетривиальной задачей, ведь для поставленных целей необходимо запускать тяжелые алгоритмы сегментации на основе так называемых полностью сверточных нейронных сетей (Fully Convolutional Neural Networks, FCNN). Именно сети такого типа позволяют выделять интересующие объекты неправильной формы с точностью до пикселя, что в задаче детектирования борщевика дает возможность с высокой точностью распознавать отдельные растения. Ученым пришлось подобрать подходящую архитектуру одноплатного компьютера и оптимизировать нейронную сеть (для исследования были выбраны популярные архитектуры UNet, SegNet, ResNet), чтобы она смогла запуститься на нем.

В практических испытаниях для обследования территории 28 га ушло 40 мин. при полете на высоте 10 м. При этом ни одно растение не было пропущено, комментирует старший преподаватель Сколтеха Андрей Сомов, научный руководитель проекта. Энергетики «Распределительных сетей» филиала «Сахалинэнерго» (входит в группу компаний «РусГидро») опробовали весной проведение беспилотной аэрофотосъемки участка ЛЭП-35 кВ с помощью комплекса «Геоскан 201». Такие решения используются в электроэнергетике для мониторинга элементов сетевой инфраструктуры, осмотра трасс линий электропередачи для выявления технологических нарушений, проверки состояния просек воздушных линий электропередачи, тепловизионного контроля и других целей.

«
Сейчас в нашем распоряжении находятся два устройства беспилотного типа: с неподвижным крылом - самолет и квадрокоптер, – отмечает оператор беспилотных авиационных систем филиала «Распределительные сети» Андрей Булахов. – Они взаимно дополняют друг друга при обследованиях линий электропередачи. С помощью самолета мы изучаем общее состояние ЛЭП, с помощью квадрокоптера – более детальное, например, элементов опоры при верховом осмотре.
»

Ученые Вятского госуниверситета представили в конце мая на межведомственной конференции «Искусственный интеллект на службе полиции» алгоритм для восстановления и повышения качества изображений и видеопоследовательностей, получаемых с беспилотных летательных аппаратов.

Нетривиальный вариант использования технологий распознавание видео реализовала компания Datana (входит в группу ЛАНИТ). Речь идет о цифровых технологиях для детектирования шлака в потоке стали на Абинском электрометаллургическом завода (АЭМЗ).

Управление процессом выпуска стали и ранее производилось на основе визуальной оценки сталевара, рассказывают в компании: он следил за потоком стали через защитные очки и ориентировался на его цвет, шум, искры и свой опыт. Условия выплавки сопровождаются высокой задымленностью, что часто не позволяет точно определить момент проникновения шлака даже опытному специалисту. В результате вместе с металлом в сталеразливочный ковш попадает печной переокисленный шлак. Datana внедрила собственное комплексное решение Datana Sense: оно отслеживает выпуск стали, визуально подсвечивая шлак в потоке, а при превышении допустимого уровня выдает светозвуковой сигнал. Контроль выпуска производится с помощью инфракрасной камеры дальнего спектра, которая позволяет «видеть» сквозь задымленность, и модуля искусственного интеллекта, точно детектирующего наличие печного шлака в потоке.

По экспертной оценке специалистов АЭМЗ, в результате внедрения Datana Sense, потенциальная экономия раскислителей, ферросплавов и шлакообразующих материалов может составить 10%, а снижение потребления электроэнергии до 5%.

Задачи распознавания на больших объемах данных

Задачи распознавания людей, транспортных средств и т.п. учатся работать все с большим количеством объектов во все более сложных ситуациях.

«
Сегодня системы видеонаблюдения используются в местах с большим потоком людей - спортивные соревнования, транспорт, общественные мероприятия,- говорит Алексей Цыплов из «Русатом Инфраструктурные решения».- С помощью нейросетей можно не только находить преступников, но и отслеживать маршруты их передвижений. Для нейросетей уже не является большой проблемой наличие изменяющих внешность факторов, таких, как очки, борода, маска или головной убор. Также производится распознавание с учетом пола, возраста и расовой принадлежности.
»

Например, ПО компании NtechLab анализирует кадры, снятые с помощью 100 тыс. камер видеонаблюдения в Москве.

Для нейронных сетей процесс распознавания на больших базах данных обладает негативной спецификой. Так, большинство алгоритмов имеют линейную зависимость длительности поиска от размера базы: если база увеличивается в 4 раза, то и время поиска в базе возрастает пропорционально.

Компания VisionLabs добавила к своей базовой платформе компьютерного зрения LUNA программный модуль Index, который позволяет исключать поиска совсем непохожие лица. В компании рассказывают, что теперь в тестах NIST поиск по базе объемом 3 млн. лиц занимает 36 мс, а по базе с 12 млн. лиц — всего 43 мс. При этом точность поиска сохраняется.

Это важно для многих реальных приложений распознавания лиц, рассказывает Сергей Миляев, руководитель исследовательских проектов VisionLabs, ведь стандартные алгоритмы обычно распознают лица на больших базах в течение нескольких секунд, что неприемлемо для сервисов реального времени, например, оплаты проезда «по лицу» в метро. ПО Index уже применяется в биометрической платформе Сбербанка.

Видеоаналитика для создания цифровых двойников

В компании «Наносемантика» рассказывают, как с помощью умных нейросетевых модулей можно создавать цифрового двойника дороги и дорожного движения. Здесь под цифровым двойником подразумевается очень подробная, с точки зрения дорожной инфраструктуры, карта типа «Яндекс карт». Причем, можно кликнуть на объекты интереса (пешеходные переходы, светофоры, перекрестки и т.д.) и увидеть набор фотографий с этого места, говорят специалисты, аналогично режиму вида из глаз «Яндекс карт».

Автомобили с камерами сфотографировали знаки дорожного движения, светофоры, разметку, но перенос этих данных в виртуальное пространство вручную потребовал бы колоссальных ресурсов, рассказывают в компании, а искусственный интеллект позволил автоматизировать эту задачу:

«
Наши асессоры разметили лишь часть изображений, то есть обвели по контуру и классифицировали светофоры, знаки и другие важные объекты, а затем наши специалисты по нейросетями обучили нейросетевые детекторы и классификаторы распознавать эти объекты. С помощью этих умных нейросетевых модулей остальные данные можно размечать и переносить в цифровой двойник уже в автоматическом режиме с очень высоким качеством.
»

В ходе данного проекта встретились проблемы с оптимизацией обучающей выборки. Например, количество накопленных фотографий, содержащих светофоры, измеряется в десятках и сотнях тысяч. Причем, эти объемы с течением времени будут нарастать, так как цель проекта состоит не только в оцифровке дорожной инфраструктуры, но и в мониторинге состояния светофоров со знаками с целью их оперативной замены.

Инженеры «Наносемантики» выделили по ГОСТ несколько десятков типов светофоров. Однако больше половины из них в реальности встречались на дорогах достаточно редко.

«
Из-за этого пришлось отказаться от автоматического определения части типов на текущем этапе. Планируется создание синтетических данных там, где этих исходных данных мало для дальнейшего улучшения системы,- поясняют специалисты.
»

Так же мало данных с видами деформаций знаков, так как весьма тяжело вручную отбирать объекты по подобной тематике в силу их редкости и специфичности. Поэтому часть задач по определению деформаций была решена с помощью классических алгоритмов компьютерного зрения без глубокого машинного обучения.

Еще одна проблемная область - мобильные варианты распознавания, как, например, в случае оцифровки автомобильной дороги. Многие вычисления должны происходить в режиме онлайн на бортовом устройстве машины, а не на удаленном сервере в режиме постобработки. Это обстоятельство предъявляет повышенные требования к производительности системы. Есть также задача сегментации дорожной разметки на спутниковых снимках, где каждая фотография может весить несколько гигабайт, а общее количество таких фотографий измеряется тысячами и десятками тысяч.

«
Еще до конца не решена задача трекинга объектов (светофоров, знаков), так как работа ведется не с видео, а с дискретным набором фотографий с некоторым шагом, привязанным к геолокации,- замечают специалисты «Наносемантики».
»

Видеоаналитика для подтверждения личности

Базовый сервис распознавания лиц – подтверждение личности в электронных сделках – по мере распространения технологий цифровизации охватывает новые сферы применения. Например, для компании ВТБ Лизинг одним из важных приоритетов развития бизнеса является перевод услуг автолизинга в цифровую среду. Для этого в организации создается омниканальная платформа ЭЛИЗА – современное решение электронного лизинга (e-leasing), позволяющее реализовать полностью безбумажную лизинговую сделку. Это означает, рассказывает Константин Есюнин, главный архитектор ВТБ Лизинг, что те документы, которые клиенту придется предоставить компании, например, паспорт, должны обрабатываться в ИТ-системе на скорости, близкой к реальному времени. Речь идет о нескольких секундах: за это время данные паспорта должны быть не только распознаны, но и перенесены в систему CRM. Компания стремится к тому, чтобы после того, как клиент подгрузит в систему снимок паспорта, он за минимальное время получит одобрение сделки и договор для подписания, который сможет тут же подписать электронной подписью, и отправляться за автомобилем.

В австралийском банке National Australia Bank можно оформить крупный кредит или получить ипотеку в удаленном режиме: в электронном виде предоставляются документы и проходит разговор заемщика с сотрудником банка. В таких условиях банки стремятся использовать дополнительные возможности, в частности, распознавание эмоций потенциального заемщика, что позволяет уточнить его скоринговый балл.

На всех рабочих местах сотрудников «Почта Банка» установлены видеокамеры и ПО распознавания лица: сотрудник может приступить к работе в банковской системе только после того, как подтвердит свою личность. Аналогично каждый клиент банка проходит верификацию по базе мошенников. В банке утверждают, что такой подход позволили за год предотвратить более 1200 тыс. попыток использования чужих учетных записей для проникновения в банковскую систему и свыше 2 тыс. подозрительных операций на сумму более 500 млн. руб.

В Банке России контроль доступа сотрудников к информационным ресурсам осуществляется с помощью биометрической системы анализа рисунка вен ладоней компании BioSmart.

Биометрическую аутентификацию с помощью нескольких камер, установленных в автомобиле, предлагает использовать компания LG для запуска двигателя автомобиля без ключа.

В целом, рынок биометрических решений, по оценкам аналитического агентства MarketsandMarkets, вырастет до 41,80 млрд. долл. к 2023 г., темпы среднегодового роста составят при этом почти 20%. Высокие темпы роста сегмента объясняются просто: биометрия радикально упрощает клиентский путь. Например, банк «Ак-Барс» внедрил биометрический сервис для идентификации пользователей программ лояльности в ресторанах Татарстана.

К биоэквайрингу, то есть оплате покупок не банковской картой, а лицом, обращенным к видеокамере, российские банки пока относятся настороженно. Ожидания связаны с развитием Единой биометрической системы (ЕБС), которая должна осенью этого года получить статус государственной системы. Главными препятствиями для распространения биометрической идентификации эксперты считают недоверие граждан к централизованным системам типа ЕБС и дипфейки.

По мнению экспертов Positive Technologies, самый яркий случай, связанный с технологией Deepfake, — обман государственной системы Китая, которая принимала налоговые документы, подтвержденные фальшивой биометрией. Преступная группа обманула систему распознавания лиц правительственной платформы, используя личную информацию и фотографии высокой четкости, приобретенные на черном рынке в онлайне. По некоторым данным злоумышленники подделывали личные данные жертв с 2018 г. Если раньше для реалистичной подмены лица и мимики на видео требовалось использовать большие вычислительные мощности, то сегодня практически на любой смартфон можно установить подобные приложения, говорят эксперты Positive Technologies:

«
Таким образом, развитие этой технологии может стать хорошим подспорьем для злоумышленников.
»

Председатель правления ВТБ Вадим Кулик в интервью журналу BIS Journal в ноябре пошлого года рассказывает о появлении технологий, которые позволяют сохранить конфиденциальность первичных данных и при этом — после проведения определенных манипуляций — строить на них модели. Пример - технология Data Fusion, где нейросеть «оборачивает» первичные данные, чтобы они могут подвергаться обработке предсказательными моделями, но в то же время их дешифровка была бы практически невозможна. Вадим Кулик говорит, что в рамках совместных работ ВТБ и «Ростелекома» в направлении «Платформа больших данных» проведено тестирование технологии MPC (Multiparty computation), которая не требует обмена исходными данными между компаниями, и это дает возможность пользователям сервиса реализовать подход Data Fusion.

Дмитрий Морозов из 3DiVi полагает, что решением может стать переход к децентрализованным системам распределенного реестра – они дадут возможность пользователю делиться своей биометрией напрямую с поставщиком услуги без посредников.

«
Механизмы подделки биометрических данных развиваются с той же скоростью, что и сами технологии,- говорит Светлана Ефимова, сооснователь компании Oz Forensics.- Дипфейки можно назвать одной из самых динамично развивающихся областей мошенников - никого не удивишь поддельными вирусными видео, а в период пандемии случился самый настоящий бум fake news.

»

Действительно, в связи с кратным увеличением количества удаленных финансовых сервисов, кратно растет и количество мошенничества в этой сфере.

«
Злоумышленники все чаще прибегают к уловкам, позволяющим скрыть свою личность и получить услуги банка под видом другого человека,- рассказывает Светлана Ефимова.- Например, используют распечатанные фотографии, фото или видео с другого устройства, высококачественные силиконовые маски, используют дипфейк технологии и подменяют видеопоток, используя виртуальную камеру.
»

Безусловно, это подвергает финансовую организацию риску не просто потерять деньги на ошибочно оформленном банковском продукте, но и нарушить закон, с точки зрения верификации клиента, замечает эксперт.

Сегодня оформилось два основных подхода к детектированию живого лица (Liveness):

  • Активный Liveness: пользователю предлагается сделать какое-то движение: приближение, подмигивание, улыбка, поворот головы. В некоторых случаях при удаленном заключения договора или других вариантов деловых отношений требуется зафиксировать факт активного действия. Активное действие означает, что пользователь ознакомился с договором и, выполнив то, что от него просят - улыбнулся или повернул голову, - подтвердил, что он в ясном уме и твердой памяти действует по собственной воле.

Активный Liveness требует длительного видео (от 3 до 5 с) для того, чтобы пользователь успел сделать действие, увеличивая клиентский путь. В то же время активный вариант Liveness не влияет на безопасность и защиту от spoofing атак, поскольку современные технологии deepfake позволяют обойти любой активный liveness, оживив картинку для выполнения требуемого действия.

  • Пассивный Liveness не предполагает какого-то активного действия, кроме необходимости посмотреть в камеру, не требует длительного видео и может быть упакован в один кадр.

«
Это упрощает передачу и скорость обработки до одного процесса в секунду,- говорят в Oz Forensics.
»

«
Не все производители технологических решений по биометрической идентификации сегодня могут с вероятностью 100% определить, что по ту сторону экрана находится живой человек, что он соответствует личности предъявленного документа, и подтвердить, что во время процесса идентификации никакие персональные данные не утекут третьим лицам,- говорит Светлана Ефимова.- Поэтому при переходе ЕБС в состояние госсистемы важно создать технологические стандарты и требования к программному обеспечению, защищающему интересы всех участников процесса.

»

Поведенческая аналитика на основе биометрии

В целом, в ближайшие годы технологии анализа лиц будут развиваться в русле поведенческой аналитики (User and Entity Behavioral Analytics, UBA/UEBA), говорят в компании «Биткоп»: важно не только понимать, кто именно появился в кадре, но и как ведет себя этот человек в той или иной ситуации.

По мнению аналитиков Gartner, рынок решений UEBA уже перешел в стадию зрелости, для которой характерно, во-первых, широкое использование этих технологий средним и крупным бизнесом и, во-вторых, встраивание функционала UEBA-аналитики в различные вертикальные ниши, связанные с информационной безопасностью: SIEM, управление идентификацией и доступом (IAM), защита конечных точек, предотвращения утечек данных. По оценкам Allied Market Research будет расти до 2025 г. каждый год в среднем на 23,7%, а самые высокие темпы роста будут наблюдаться в сегменте анализа походки.

Источник: компания «Биткоп»

Поведенческая биометрия станет базовым элементом проверки личности в двухфакторной или многофакторной аутентификации, считают исследователи из Frost & Sullivan.

Продукты в сегменте анализа «языка лица и тела» предлагают российские разработчики. Например, компания 3DiVi занимается решениями трекинга тел и лиц (распознавание лиц, движений и жестов). Компания NtechLab развивает ПО для автоматического выявления людей с признаками агрессивного поведения. Для этих целей используется комплексный подход, включающий распознавание силуэта, действий и эмоций.

Видеоаналитика для анализа процессов

Передовые системы видеоаналитики сегодня могут стать хорошими советчиками человека при принятии решений в различных ситуациях, связанных, в первую очередь, с выявлением подозрительных действий и процессов. Например, компания Meta System, специализирующаяся на скоринговых решениях для телематического оборудования, предлагает продукт для страховых компаний - прогнозирование рисков, связанных с работоспособностью водителя, на основе анализа его лица и стиля вождения.

Система Smart Fraud Detection компании «Фаззи Лоджик Лабс» в режиме реального времени анализирует поведение сотрудников с помощью видеокамер и микрофонов. Она умеет сопоставлять эмоции людей в кадре, динамику взглядов с набором шаблонов подозрительных действий сотрудников, например, закрытием видеокамеры или фотографированием экрана камерой телефона.

DLP-система компании «СерчИнформ КИБ» также способна понять, что пользователь навел камеру смартфона на монитор с данными из внутренней корпоративной системы, определить личность этого пользователя, а программный модуль MonitorController в этот момент собирает информацию об открытых сайтах и активных процессах в ИТ-системах на рабочем месте. Таким образом, данные, собираемые DLP-системой по поводу каждого инцидента, могут стать доказательствами в судебных делах о неправомерном доступе к информации или разглашении конфиденциальной информации.

Для того чтобы ИТ-система стала хорошим помощником в задачах оперативного расследования инцидентов, в компании формируется архив видеоинформации в развитыми возможностями интеллектуального поиска. Яков Волкинд, директор филиала компании ITV Group в Санкт-Петербурге, перечисляет ключевые функции такого поиска: поиск всех событий, соответствующих моменту распознавания лица правонарушителя, поиск лиц, контактировавших с выбранным лицом и попавших в поле зрения камер одновременно с ним, поиск по конкретным зонам помещений, поиск по признакам. Так, для банков имеет значение поиск по признакам конкретной транзакции.

Умные технологии видеоаналитики помогают банкам распознавать подозрительное поведение посетителя, например, в позиции стрелка или сотрудника с поднятыми руками и оперативно оповещать персонал банка, даже, если сотрудник не смог воспользоваться тревожной кнопкой.

Компьютерный анализ позы человека

Источник: компания ITV Group

Особое значение имеет анализ действий посетителей в сервисных зонах банкоматов, которые обычно располагаются в неохраняемых помещениях.

Особо важное значение этот функционал приобретает, если речь идет не об офисных помещениях, а деньгохранилищах и, и там необходимо фиксировать все действия, связанные с работой инкассаторов, а также противоправные действия злоумышленников по отношению к банковскому имуществу. Как рассказывает Яков Волкинд, аналитическое ПО компании ITV умеет распознавать на видеоизображении большое число подозрительных ситуаций: лежащий человек (ему стало плохо, или на него было совершено нападение или это бомж, решивший заночевать в теплом месте?) или человек, присевший перед банкоматом на корточки (потенциальный взломщик?), скопление людей в зоне банкоматов (подростки зачем-то собрались группой в этом тихом месте?).

На форуме «Армия-2021» РТИ представил комплекс безостановочного и скрытого досмотра. В интервью ТАСС, которое состоялось в конце мая, генеральный директор РТИ и НИИДАР Юрий Аношко рассказал о текущем состоянии разработки:

«
Мы пошли намного дальше функции идентификации людей. Мы разработали базовые инструменты профайлинга людей, исходя из их сетевой активности на платформах TikTok, Youtube, «Вконтакте», Facebook, «Яндекса» и других сервисов».
»

Система позволяет создать профиль человека и оценить степень угрозы для людей по совокупности характерных признаков во время прохода через площадку досмотра.

Помимо системы профайлинга, программно-аппаратный комплекс безостановочного скрытого досмотра будет включать систему распознавания микровыражений лица и походки.

Кроме того, в интервью ТАСС Юрий Аношко сообщил о создаваемой системе мониторинга с элементами искусственного интеллекта, которая позволит контролировать обстановку в Черном море, предвидеть и предотвращать провокации кораблей НАТО в этом регионе. По словам директора НИИДАР, эта система представляет собой масштабируемую программно-аппаратную платформу, которая позволит осуществлять мониторинг морской обстановки в режиме реального времени:

«
Получая данные от различных открытых и закрытых источников, а также разнородных технических средств, система в автоматическом режиме обрабатывает объектовую информацию и формирует актуальную целевую обстановку в выбранном регионе. При этом в ней непрерывно ведется собственная база данных объектовой информации, позволяющая применять ретроспективный анализ, формировать и доуточнять статистическую модель нормальной судоходной обстановки.
»

«
Применение в дальнейшей обработке алгоритмов машинного обучения и элементов искусственного интеллекта позволит системе выявлять отклонения ситуации от нормальной, обнаруживать и сопровождать потенциально опасные объекты и автоматически выдавать соответствующие уведомления органам военного управления,- говорит Юрий Аношко.
»

Следующий материал обзора >>>
Главная страница обзора >>>

Другие материалы обзора

Другие материалы по теме ИИ