Что такое компьютерное зрение?
Компьютерное зрение — это технология, с помощью которой машины могут находить, отслеживать, классифицировать и идентифицировать объекты, извлекая данные из изображений и анализируя полученную информацию[1].
Компьютерное зрение применяется для распознавания объектов, видеоаналитики, описания содержания изображений и видео, распознавания жестов и рукописного ввода, а также для интеллектуальной обработки изображений.
Чем машинное зрение отличается от компьютерного?
Машинное зрение использует анализ изображений для того, чтобы решать промышленные задачи. Машинное и компьютерное зрение — области связанные
Новичкам может показаться, что это разные названия одной и той же технологии, но это не так, так как компьютерное зрение — это общее название набора технологий, а машинное зрение — сфера применения.
Задачи машинного зрения
Машинное зрение позволяет отказаться от ручного труда, ведь контролировать сборку изделий, считать и измерять объекты, читать текст, цифры и идентифицировать объекты может робот.
Машинное зрение используется в различных областях. В медицине — для того, чтобы более точно ставить диагноз, в промышленности — для снижения себестоимости товаров за счёт автоматизации. В автомобильной индустрии — для навигации беспилотников, а в ритейле — для считывания штрихкодов или подсчёта посетителей.
Системы машинного зрения
Так как машинное зрение используется для решения различных промышленных задач, то в зависимости от того, какую именно задачу нужно решить, создаются специальные системы машинного зрения.
Типовые системы машинного зрения состоят из камер, ПО, процессоров, источников света, приложений программного обеспечения и различных датчиков.«Еврохим», ТМК и другие предприятия представили опыт цифровизации в промышленности на TAdviser SummIT
Например, датчик определил, что деталь на конвейере нужно проверить, запустил камеру и сделал снимок этой детали. После этого изображение отправляется в компьютер, где программное обеспечение для машинного зрения обрабатывает полученную картинку.
После того, как изображение обработано, в зависимости от состояния детали программа пропускает или не пропускает деталь по конвейеру дальше. То есть, если деталь повреждена — программное обеспечение подаст сигнал устройству для её отклонения, остановит производство или предупредит человека о том, что есть деталь с дефектом.
2024: Как российские предприятия внедряют машинное зрение
Российские промышленные предприятия активно осваивают технологии машинного зрения, интегрируя их с искусственным интеллектом для повышения эффективности производства. О растущем интересе к этой сфере стало известно в октябре 2024 года из результатов исследования, проведенного Институтом статистических исследований и экономики знаний НИУ ВШЭ.
Согласно отчету, 78% из 2,3 тыс. опрошенных российских организаций проявляют интерес к продуктам на основе компьютерного зрения. Внедрение этих технологий происходит в несколько этапов и требует значительных инвестиций.
Процесс интеграции машинного зрения начинается с установки специализированного оборудования. Предприятия используют IPv-камеры наружного видеонаблюдения и высокоскоростные камеры, способные снимать до 40 тыс. кадров в секунду. Современные устройства могут детектировать фракции до 1 микрометра, что позволяет контролировать состав материалов с высокой точностью.
Следующим этапом является настройка серверной инфраструктуры, которая обрабатывает большие массивы данных в виде фотографий высокого разрешения. Для снижения нагрузки на серверы применяются нейронные сети, которые анализируют только те снимки, где обнаружены отклонения от заданных параметров.
Заключительным этапом становится разработка и внедрение специального программного обеспечения, включающего модели машинного обучения и алгоритмы обработки изображений. Руководитель департамента систем машинного зрения и нейросетей Nord Clan Пётр Хвесюк отмечает, что для обучения нейросетей необходимо собрать минимум 50 тыс. фотографий, которые могут быть получены как в реальных условиях, так и синтезированы в лаборатории.
Стоимость внедрения технологий машинного зрения варьируется в зависимости от сложности проекта. По оценке эксперта ГК «Юзтех» Ильи Смирнова, базовое решение может обойтись в ₽8–15 млн, а персонализированное программное обеспечение — до ₽20 млн. Окупаемость таких проектов составляет около двух лет.[2]
2022: Искусственный интеллект распознает изображения хуже человека
Искусственный интеллект распознает изображения хуже человека.
У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Об этом ВШЭ сообщила 7 сентября 2022 года. Подробнее здесь. .
2021: Эксперты по компьютерному зрению закрывают проекты из-за нехватки обучающих данных
Согласно новому исследованию компании Datagen, 99% команд специалистов в области компьютерного зрения столкнулись с необходимостью закрыть проекты с использованием машинного обучения из-за недостатка данных для обучения своих моделей. Более того, по той же причине все (100%) участники исследования были вынуждены отложить проекты. Об этом стало известно 27 декабря 2021 года.
Как выяснили исследователи, проблемы с обучающими данными носят самый разный характер и затрагивают команды специалистов в равной степени. Самыми главными проблемами являются недостаточная аннотация (48%), несоответствующий охват предметной области (47%) и дефицит данных (44%).
Нехватка надежных данных для обучения в конкретной предметной области усугубляется тем фактом, что в сфере компьютерного зрения не хватает четко определенных стандартов и передовых практик.
На вопрос о том, как собираются обучающие данные в их организациях, респонденты представили целую «сборную солянку» из различных источников и методологий. Синтетические или настоящие, собранные внутри организации или полученные из публичных наборов данные – как оказалось, для обучения моделей компьютерного зрения организации используют абсолютно все данные, независимо от их происхождения.
Тем не менее, команды специалистов в области компьютерного зрения, похоже, нашли решение проблемы в виде синтетических данных. 96% опрошенных уже используют синтетические данные для обучения своих моделей искусственного интеллекта. Однако качество, источник и доля используемых синтетических данных по-прежнему сильно различаются в зависимости от области, и только 6% команд в настоящее время используют исключительно синтетические данные.
Повсеместный переход на использование синтетических данных соответствует количеству новых прогнозов о том, что 2022 год станет прорывом для синтетических данных.
В online-опросе Datagen приняли участие 300 специалистов в области компьютерного зрения, представляющих 300 отдельных предприятий[3].
2020: Компании начали заменять охранников на камеры с машинным зрением
27 апреля 2020 года стало известно, что розничные магазины, строительные и производственные компании начали оснащать свои помещения и площадки системами видеонаблюдения с искусственным интеллектом. Они следят за тем, носят ли посетители и сотрудники медицинские маски и соблюдают ли между собой дистанцию, как это требуется в связи с пандемией COVID-19. Устанавливать такие системы, стоимость которых достигает $1 тыс. в год, дешевле, чем иметь дополнительных охранников, считают участники рынка, опрошенные агентством Reuters.
Представители нескольких компаний сообщили, что видеонаблюдение с искусственным интеллектом позволит снять любые претензии, связанные с несоблюдением указаний органов здравоохранения и благополучия человека. При наличии такого решения не только посетители и сотрудники магазинов и других предприятий смогут увидеть, что правила безопасности соблюдаются в полной мере, но сделать это также смогут страховщики и регуляторы.
Меньше всего мы хотим, чтобы губернатор закрыл всех нас просто потому, что никто не соблюдает предписанные рекомендации, — поделилась Джен Сьюрт (Jen Suerth), вице-президент чикагской строительной компании Pepper Construction. В апреле 2020 года она запустила «умное» видеонаблюдение на базе программного продукта SmartVid.io для отслеживания поведения рабочих. |
Аналогичные технологии планируют внедрить производитель бриллиантов Samarth Diamond и владелец открытых торговых центров в США RPT Realty. Первая планирует использовать решение от Glimpse Analytics, вторая — RE Insight.
Заказчики уверены в возможностях технологии, потому что они уже использовали подобные инструменты для изучения покупателей, входящих в магазины, а также для обнаружения сотрудников на строительных площадках, которые пренебрегают базовыми правилами техники безопасности.[4]
Как системы компьютерного зрения помогают контролировать качество продукции
- Как системы компьютерного зрения помогают контролировать качество продукции
- Как работает ПО на базе машинного зрения для контроля качества продукта и техпроцессов
Исследования рынка компьютерного зрения
2024: Рост объема мирового рынка машинного зрения на 9% до $15,44 млрд
В 2024 году затраты на глобальном рынке машинного зрения и роботизированных систем с визуальным управлением достигли $15,44 млрд. Показатель предыдущего года, когда расходы в данной сфере оценивались в $14,21 млрд, превышен на 9%. Об этом говорится в исследовании Market Research Future, с результатами которого TAdviser ознакомился в середине января 2025 года.
Одним из ключевых драйверов рассматриваемой отрасли аналитики называют быстрое развитие технологий автоматизации. Предприятия по всему миру стремятся улучшить эффективность работы и сократить производственные издержки. Средства машинного зрения обеспечивают точный контроль качества и распознавание дефектов. При этом минимизируется вмешательство сотрудников предприятий. В результате, повышается продуктивность производственных линий и устраняется человеческий фактор. Это особенно важно в таких секторах, как автомобилестроение, электроника, потребительские товары и фармацевтика, где точность и надежность производственных процессов имеют первостепенное значение.
Стимулирующее воздействие на отрасль также оказывают достижения в области искусственного интеллекта и глубокого обучения. Эти инструменты расширяют возможности систем машинного зрения, позволяя им справляться с комплексными задачами, которые ранее было сложно или невозможно автоматизировать. ИИ помогает осуществлять более точный и быстрый анализ изображений в различных условиях. По мере развития технологий машины получают возможность выполнять операции, требующие высокой остроты зрения, например, выявлять мельчайшие дефекты в продуктах на производственной линии с большей эффективностью.
Растущее использование робототехники в различных секторах является еще одним важным драйвером для рынка машинного зрения. Предприятия из таких отраслей, как сельское хозяйство, логистика и здравоохранение, все чаще используют роботов для различных приложений. Кроме того, растет внедрение коллаборативных роботов, или коботов, которые могут работать вместе с людьми.
Авторы отчета выделяют четыре ключевых сегмента на рассматриваемом рынке: контроль качества; навигация; идентификация и инспекция; измерение и определение размеров. В 2023 году затраты по этим направлениям составили соответственно $3,56 млрд, $3,1 млрд, $4,23 млрд и $3,32 млрд. Среди значимых игроков отрасли названы:
- Slamcore;
- National Instruments;
- Keyence;
- Datalogic;
- Sick AG;
- Advantech;
- Flir Systems;
- Amnon Automotive;
- Cognex;
- Microchip Technology;
- Basler;
- Teledyne Technologies;
- Linefollower;
- Omron;
- Euresys.
В географическом плане лидирует Северная Америка с результатом $5,25 млрд по итогам 2023 года: в этом регионе сосредоточены многие крупные предприятия с передовыми сборочными и производственными линиями, на которых применяются системы машинного зрения. На втором месте располагается Европа с затратами на уровне $4 млрд, а замыкает тройку Азиатско-Тихоокеанский регион с $3,5 млрд. Южная Америка обеспечила вклад в размере $0,75 млрд, Ближний Восток и Африка — примерно $0,71 млрд.
В целом, как отмечается, сложившаяся на рынке ситуация указывает на устойчивую траекторию роста, обусловленную технологическими достижениями, потребностями в автоматизации и необходимостью контроля качества продукции в различных секторах. Аналитики Market Research Future полагают, что в дальнейшем среднегодовой темп роста в сложных процентах (показатель CAGR) составит 8,65%. В результате, к 2032 году затраты в глобальном масштабе могут увеличиться до $30 млрд.[5]
2023: Объем мирового рынка камер с компьютерным зрением за год вырос до $7,41 млрд
В 2023 году продажи камер с компьютерным зрением в глобальном масштабе достигли $7,41 млрд. Для сравнения, годом ранее объем рынка оценивался в $6,14 млрд. Таким образом, зафиксирован рост на уровне 20%. Об этом говорится в исследовании Market Research Future, результаты которого опубликованы в начале ноября 2024 года. Подробнее здесь.
Компьютерное зрение: технологии, рынок, перспективы
Компьютерное зрение: технологии, рынок, перспективы
- Системы видеоаналитики Каталог систем и проектов видеоаналитики
- Основы компьютерного зрения
- Используемые технологии
- Сферы применения
- Мировой рынок компьютерного зрения
- Российский рынок компьютерного зрения
Глаза ИИ: что видят системы компьютерного зрения сегодня и что разглядят завтра
Глаза ИИ: что видят системы компьютерного зрения сегодня и что разглядят завтра?
Робототехника
- Роботы (робототехника)
- Робототехника (мировой рынок)
- Обзор: Российский рынок промышленной робототехники 2019
- Карта российского рынка промышленной робототехники
- Промышленные роботы в России
- Каталог систем и проектов Роботы Промышленные
- Топ-30 интеграторов промышленных роботов в России
- Карта российского рынка промышленной робототехники: 4 ключевых сегмента, 170 компаний
- Технологические тенденции развития промышленных роботов
- В промышленности, медицине, боевые (Кибервойны)
- Сервисные роботы
- Каталог систем и проектов Роботы Сервисные
- Collaborative robot, cobot (Коллаборативный робот, кобот)
- IoT - IIoT - Цифровой двойник (Digital Twin)
- Компьютерное зрение (машинное зрение)
- Компьютерное зрение: технологии, рынок, перспективы
- Как роботы заменяют людей
- Секс-роботы
- Роботы-пылесосы
- Искусственный интеллект (ИИ, Artificial intelligence, AI)
- Обзор: Искусственный интеллект 2018
- Искусственный интеллект (рынок России)
- Искусственный интеллект (мировой рынок)
- Искусственный интеллект (рынок Украины)
- В банках, медицине, радиологии, ритейле, ВПК, производственной сфере, образовании, Автопилот, транспорте, логистике, спорте, СМИ и литература, видео (DeepFake, FakeApp), музыке
- Национальная стратегия развития искусственного интеллекта
- Национальная Ассоциация участников рынка робототехники (НАУРР)
- Российская ассоциация искусственного интеллекта
- Национальный центр развития технологий и базовых элементов робототехники
- Международный Центр по робототехнике (IRC) на базе НИТУ МИСиС
- Машинное обучение, Вредоносное машинное обучение, Разметка данных (data labeling)
- RPA - Роботизированная автоматизация процессов
- Видеоаналитика (машинное зрение)
- Машинный интеллект
- Когнитивный компьютинг
- Наука о данных (Data Science)
- DataLake (Озеро данных)
- BigData
- Нейросети
- Чатботы
- Умные колонки Голосовые помощники
- Безэкипажное судовождение (БЭС)
- Автопилот (беспилотный автомобиль)
- Беспилотные грузовики
- Беспилотные грузовики в России
- В мире и России
- Летающие автомобили
- Электромобили
Примечания
- ↑ Что такое машинное зрение?
- ↑ Компьютер разглядит: российские предприятия активно внедряют машинное зрение
- ↑ Эксперты по компьютерному зрению закрывают проекты из-за нехватки обучающих данных
- ↑ Companies bet on AI cameras to track social distancing, limit liability
- ↑ Machine Vision and Vision-Guided Robotics Market Research