Интервью TAdviser: Георгий Зуев, «Биорг» - об инновационных подходах к цифровизации государства
В августе 2020 года интеллектуальная платформа Beorg Smart Vision, предназначенная для распознавания объектов и данных с помощью технологий искусственного интеллекта, признана важной и достойной для тиражирования по стране. Такую оценку разработка компании «Биорг» получила от Агентства стратегических инициатив (АСИ) в рамках конкурса Smart.AI&Data. В беседе с TAdviser основатель «Биорг» Георгий Зуев рассказал о том, как сфера госинформатизации становится площадкой, где массово внедряются самые передовые технологические и организационные решения.
Георгий, рынок знает компанию «Биорг»[1], в первую очередь, как провайдера масштабной оцифровки информации с бумажных документов. Но конкурс АСИ Smart.AI&Data – про другое: про отбор лучших практик в части антикризисных мер с применением технологий искусственного интеллекта (ИИ). С чем Ваша компания вышла на конкурс?
Георгий Зуев:
Уточню, что главной задачей конкурса Smart.AI&Data был отбор самых эффективных ИТ-продуктов для быстрого улучшения социально-экономической ситуации в регионах в посткризисный период. И это наше поле деятельности.
Мы в течение многих лет занимаемся обработкой документированной информации, как в виде архивов, так и в форме потоков документов в реальном масштабе времени. Возможности для применения ИИ здесь очевидны: ИТ-решения помогают обрабатывать огромные объемы в миллионы информационных записей и сокращают стоимость таких работ для конечного заказчика. Когда на рынке появилась задача наполнения единого государственного реестра (ЕГР) ЗАГС по всей стране, мы попробовали себя в ней. И оказалось, что с определенной адаптацией наша платформа идеально для нее подходит: она обеспечивает высокое качество получаемых данных и однозначно конкурентоспособна.Как с помощью EvaProject и EvaWiki построить прозрачную бесшовную среду для успешной работы крупного холдинга
Проекты ЗАГС стали отличной основой для развития бизнеса на новом рынке. Мы разобрались, как работать с государственными заказчиками, какие у них боли и потребности. Параллельно освоили несколько новых типов нейросетей. В частности, обучили их распознаванию рукописного текста на, пожалуй, самом большом обучающем датасете объемом примерно 1 млрд сведений. Развили краудсорсинговую часть платформы, в которой операторы проводят разметку данных для обучения нейросетей и верифицируют информацию перед передачей заказчику.
Сейчас мы видим явный интерес к нашей технологии именно как к платформенному решению, способному преобразовать разнородные информационные потоки в набор однозначно достоверных и полных данных для загрузки в ГИС или регистр.
Можете привести примеры актуальных потребностей такого плана в госорганах?
Георгий Зуев: В настоящее время в стране идет ряд масштабных государственных проектов, связанных с развитием цифровых ресурсов органов власти. Это платформа «ГосТех». Это Национальная Система Управления Данными – один из ключевых элементов цифрового государственного управления РФ, который призван структурировать и задать единые правила работы с данными.
Не удивительно, что практически в каждом ведомстве сейчас есть задачи по переходу от документированной информации к структурированным и связанным наборам данных.
Так, в Росреестре давно существуют планы распознавать с помощью ИИ документы, загружаемые пользователями в ЕГРН, для того чтобы, в том числе, «убить» мошеннические схемы. В лицензирующих и контрольно-надзорных ведомствах есть предоставляемые заявителями комплекты документов, которые желательно обрабатывать в режиме реального времени. Такие потребности есть у Росгвардии, где в новую систему централизованного учета оружия неплохо бы добавить сведения из журналов учета лицензий и разрешений, которые велись еще в МВД. И у Пенсионного фонда России с его миллионами действующих выплатных дел, на хранение которых тратятся огромные средства.
Возьмите практически любую сложную государственную услугу. Например, некоторому товару первой необходимости надо срочно попасть в страну — на полки магазинов или аптек. И в соответствующее ведомство приходит комплект электронных копий от заявителя, которые уже прошли стандартные проверки МВД, ФНС буквально «на лету». Но можно ли в таком же режиме – «на лету» – дать ответ по остальным документам, которых около полутора десятков? Убедиться, что не загрузили «мусор» вместо настоящего документа или подложные сведения? Проверить актуальность свидетельств, подтвердить юридическую корректность упоминания одних документов в текстах других внутри комплекта? Отвечу: можно!
Как это можно сделать? Поясните, пожалуйста, чуть подробнее.
Георгий Зуев: Как это сделать организационно? Обучаем нейросеть на пилотном массиве, показывая ей типы документов и проводя разметку данных. Ставим в контуре заказчика механизм, ответственный за предобработку, разметку и передачу комплектов в платформу, в основном, в виде «нарезанных», не связанных между собой блоков. В платформе распознаем данные нейросетями, наиболее подходящими для данного набора. Все, что обработалось с уровнем точности, который меньше порогового, мгновенно отправляем операторам в соответствии с их специализацией. На выходе, в зависимости от сложности начального датасета, проводим дополнительные проверки или повторную обработку для подтверждения достоверности. Передаем данные обратно, собираем в полные записи и загружаем в ИС в контуре заказчика.
Остальные моменты – сугубо технические. Важно, что наша технология рассчитана на экстремальные условия: цифровизация миллионов записей в неделю или с интенсивностью обработки на уровне 2 — 20 минут на один комплект в потоке.
К тому, что Вы рассказали, возникает ряд дополнительных вопросов. В частности, задачи потокового сканирования документов, их автоматической классификации, извлечения мета-данных и т.д. – это известное поле, где работает немало российских компаний. В чем заключается специфика решения «Биорг»?
Георгий Зуев: Во-первых, мы предоставляем полноценный сервис – быстрый старт проектов без необходимости закупки софта и без требований к оборудованию на стороне заказчика. Во-вторых, обеспечивается возможность масштабирования решения по всей территории страны, включая самые отдаленные уголки. Это означает гарантированное единообразие результата, где бы мы технологию ни применяли. Представляете, какую «головную боль» мы снимаем территориально-распределенному ведомству, если оно обязано соблюсти жесткие времени рамки, установленные Правительством РФ? А сегодня, как вы знаете, такие сроки устанавливаются с завидной регулярностью.
Вопрос о точности работы алгоритмов платформы Beorg Smart Vision. У любого нейросетевого алгоритма есть порог распознавания, и совсем не здорово, если какие-то данные государственной системы окажутся в зоне «погрешности алгоритма».
Георгий Зуев: Начнем с «азов». Широко используемые программы оптического распознавания текста (OCR) тоже не идеальны, они дают 97 — 98% качества на современных текстах. При таких параметрах на 1 миллион записей базы данных вы получите 20 — 30 тысяч некорректных: и при оцифровке архива, и при обработке документов в потоке. Такой результат неприемлем ни для банков, ни для бухгалтерий, ни для ведомств, которым нужно загружать сведения в ГИС, а информация в них является официальной и по определению точной и достоверной.
Мы сразу поставили цель — создать такой сервис, который будет давать максимальное качество данных и на обычных тестах, и на рукописных сведениях, и на аудио контенте. Сейчас у нас подготовлен десяток обученных нейронных сетей на архитектуре глубокого машинного обучения Faster-RCNN, которые реально хорошо справляются даже с рукописным текстом, если он написан адекватным почерком. Именно это помогло нашему решению завоевать рынок ЗАГС. Но и эти данные необходимо проверять. Как еще повысить эффективность распознавания с одновременным повышением точности?
Решение, которое лежит на поверхности, – использовать в качестве третьей стороны, арбитра, верификатора, мощный ресурс — человеческий мозг. Традиционный подход – нанять на работу необходимое количество операторов, предоставить им помещение и нужную технику – мы отмели как неэффективный. У этого ресурса есть чисто бытовые ограничения производительности – поесть, поспать, отвлечься. А если нужно каждый день проверять и подтверждать, скажем, по 4 миллиона записей, то мы физически не сможем 10 тысяч человек разместить в помещении организации. Или такая ручная проверка сделает «умную» оцифровку «золотой» по стоимости.
Для снижения издержек мы применили другой подход – создали краудсорсинговую онлайн-платформу. На начальном этапе операторы – краудсорсеры размечают документы для обучения нейросети, на финише — проверяют то, с чем она не справилась. Кто-то их работает из дома, кто-то через Telegram-бот, используя свободное время в дороге. Есть практика создания «закрытых» групп операторов для работы с корпоративной информацией. Технология обеспечивает достоверность, качество данных не ниже 99% по умолчанию, с возможностью дальнейшего повышения за счет повторных циклов обработки.
Краудсорсинг на службе цифровизации официальных документов? Идея яркая и нетривиальная. И она сработала?
Георгий Зуев: Знаете, госзаказчикам нравится идея, что к решению стратегических государственных задач напрямую привлечены жители страны. Поэтому мы постоянно расширяем операторский пул платформы и привлекаем людей с конкретной специализацией.
Скажем, для образовательных проектов – бывших учителей, для проектов в БТИ – специалистов с пониманием кадастровых работ, для предприятий – инженеров. А также лингвистов, бухгалтеров, делопроизводителей и т.д. Всех трудоустраиваем официально, как только они приступают к работе.
Платформа признана «Лучшим социальным сервисом 2020» в рамках соответствующего федерального конкурса. И сегодня, когда в условиях пандемии все больше людей нуждается в поддержке и ищет возможность подработки из дома, такие возможности для населения становятся особенно актуальными.
Есть реальные примеры такой помощи в трудоустройстве?
Георгий Зуев: Конечно! Есть, например, отличный пример того, как региональные органы власти вместе с населением своей области решили задачу оцифровки своих же сведений в ЗАГС на несколько месяцев раньше запланированного срока. Речь о Тамбове – нашем «нашумевшем» кейсе, который широко освещался в общественно-популярных СМИ. Он, кстати, включен в «Библиотеку ИИ», которую недавно презентовала команда VK (ранее Mail.ru Group).
В рамках этого проекта более 500 жителей Тамбовской области подключились к нашей краудсорсинговой платформе, прошли необходимое обучение в режиме онлайн, помогли своему краю летом 2020 года выполнить проект досрочно, одновременно улучшив свое материальное положение. Это не единичный, но самый свежий и наглядный пример того, как работает наша платформа в интересах ускоренного решения задач госинформатизации.
С общечеловеческой точки зрения звучит очень привлекательно. Но давайте вспомним, что речь идет об оцифровке официальных документов государственных органов. Насколько адекватен ситуации механизм аутсорсинга с привлечением буквально людей с улицы?
Георгий Зуев: Вопрос доверия – это вопрос понимания той технологии, которая будет использована. Понимания, каким образом обеспечивается конфиденциальность на каждом из этапов.
Первый страх – что документы «покинут помещение». Этот страх лечится с помощью организации VPN-канала связи, защищенного российской криптографией по ГОСТ, который организуется между нашей платформой и ведомством, которому услуги оказываются. Это дает возможность обмениваться сведениями с платформой в шифрованном виде в режиме реального времени. Это не каменный век. Материальные носители иногда нужны по закону. Не представляю, как бы мы способствовали цифровой трансформации, пересылая данные на магнитных или оптических носителях.
К тому же, добавлю, что операторы – это не «люди с улицы», как вы сказали. Все они официально трудоустроены и несут ответственность.
Первый период удаленки продемонстрировал, что VPN – это не панацея, так как не известно, кто именно находится на том конце защищенного VPN-туннеля и каковы его намерения. Может быть, он фотографирует данные и потом продает мошенникам?
Георгий Зуев: Да, второй страх – это про то, что люди-операторы или даже сам ИИ используют получаемые сведения в своих корыстных целях. Здесь применено очень изящное решение: фактически мы развернули в обратную сторону механизм разметки данных на документе, с помощью которых нейросеть обучается. Иными словами, мы научили нейросеть самостоятельно определять вид документа и разделять электронный образ документа на маленькие блоки, причем делать это в контуре заказчика. Это одновременно помогает механизмам распознавания данных и исключает риски прочтения конфиденциальной информации оператором, потому что он видит на экране только маленький, единичный фрагмент документа.
Законодательство о персональных данных в данном случае соблюдается?
Георгий Зуев: Соблюдается, конечно! Во-первых, мы оказываем услугу госоргану, который осуществляет обработку ПДн в соответствии со своим Положением. Во-вторых, мы сами — в реестре операторов, осуществляющих обработку персональных данных. В-третьих, наша платформа расположена в ИТ-инфраструктуре, аттестованной по 152-ФЗ «О персональных данных».
Есть кейсы большего уровня конфиденциальности, когда, например, приходится всю технологическую цепочку развернуть на территории заказчика. Мы к такому готовы, но на практике это встречается редко.
Вы упоминали, что технологии «Биорг» умеют обрабатывать также аудио- и видео-записи. Эти решения тоже находят спрос у госзаказчиков?
Георгий Зуев: Да, такие потребности у госсектора есть. Самая очевидная – обработка обращений граждан по телефону или с помощью видеосвязи. Файл аудиозаписи – это ведь тот же самый электронный документ, со своими реквизитами и информацией внутри. Извлекая из него смысловые сущности, мы получаем быстрый, абсолютно точный и полный срез данных о работе с потребителями госуслуг.
Решения такого класса имеются на рынке. Но преимущества платформы Beorg Smart Vision здесь — те же самые, что и при обработке текстовых документов, то есть качество, достоверность распознанной информации. Представьте только, сколько жалоб ежедневно поступает по телефонам муниципалитетов, районной, областной власти. Какие проблемы насущны и как они решаются? Из какого дома и как часто жалуются на холодные отопительные батареи? Есть ли проблемы с доступностью лекарств или работой соцслужб? Вот где KPI любого руководителя – от муниципалитета до высшего уровня. Также умение мгновенно переключаться между нейросетью и операторами в краудсорсинговой платформе идеально подходит к сфере записи на прием — человек гарантированно получит услугу, если вдруг возникают трудности при общении с виртуальным сотрудником или ботом.
Все органы госвласти находятся на том или ином этапе цифровой трансформации — начинают переходить в Гособлако, развивается НСУД. Как платформа «Биорг» будет чувствовать себя в новой, трансформированной ИТ-инфраструктуре страны?
Георгий Зуев: Что касается «ГосТех» и давней истории про миграцию государственных систем в единую облачную инфраструктуру, то технологически никаких проблем нет. Более того, наше решение, априори предназначенное для работы в облаке, получает все больше запросов на то, чтобы стать именно единой платформой, типовым набором тиражируемых сервисов, закрывающим сразу несколько документных «болей» органа власти и готовым быстро предоставить тот же набор сервисов другому ведомству.
Мы в этом направлении сейчас очень плотно работаем. Первоочередным шагом, который откроет дорогу к тиражированию, будет включение платформы Beorg Smart Vision в Реестр решений ИИ, который поручено создать Минцифры. Что касается НСУД, то у нескольких наших заказчиков были вопросы о том, в каком виде готовить цифровой ресурс, чтобы потом он легко, без существенных вложений, интегрировался в общую систему управления данными. Для ответа мы прибегли к помощи экспертов из Аналитического центра при Правительстве РФ, которые помогли скорректировать требования к составу и форматам данных. Но там на самом деле больше задач в нормативной плоскости, чем технологической.
Сервисный подход очень полезен для реализации быстрых изменений. Можно ли сказать, что в этом качестве платформа «Биорг» способна помочь организациям осуществлять реальную цифровую трансформацию, взяв на себя рутинные вопросы поддержки изменений на уровне документов и документированной информации?
Георгий Зуев: Beorg Smart Vision помогает создавать цифровую экосистему для отдельно взятых компаний и государственных ведомств уже несколько лет. Мы видим, как меняется отношение к ИИ, появляется больше доверия, как растут объемы данных и потребности наших клиентов. Начиная с одной задачи, например, перевода в электронный вид бумажных архивов, организации переходят к автоматизации и других процессов, но уже в текущей деятельности. Сейчас мы нацелены на популяризацию наших сервисов на базе Beorg Smart Vision в образовательной среде, системе здравоохранения, силовых ведомствах. Это не только огромный потенциал и масштаб работы для нас, как исполнителя и проводника цифровой трансформации, но и необходимые данные для повышения качества жизни наших граждан.
Задачу того или иного масштаба для трансформации деятельности с помощью ИИ можно найти в любом ведомстве. Главное — смело смотреть на эту трансформацию, видеть плоды, которые она принесет не по итогам ближайшего квартала, а в перспективе нескольких лет. Это и есть задача CDTO (Chief Digital Transformation Officer), то есть руководителей цифровой трансформации, которые приступают к активной работе во всех регионах и ведомствах нашей страны. С ними нам легко удается найти общий язык, потому что трансформация, которую мы предлагаем – комплексная и технологичная, с реально осязаемым результатом.