Баннер в шапке 1

Баннер в шапке 2

Конференции ИТ-инфраструктура Новости Аналитика Подкасты Отрасли ИТ-системы

Реклама на этой странице

2011/05/18 17:04:00

OCR - Optical Character Recognition

OCR (Optical Character Recognition), оптическое распознавание символов – класс программного обеспечения, транслирующего изображение напечатанных или написанных от руки текстов в машино-читаемые (или машино-редактируемые) тексты.

Основой для построения алгоритмов оптического распознавания служат методы напрямую пришедшие из таких областей как Компьютерное зрение и Распознавание шаблонов. Однако большинство современных OCR-программ для повышения качества распознавания используют встроенные лингвистические модули, которые могут включать в себя словари общей лексики или специализированные предметные словари (например, словари имен и фамилий, или названий городов), а также морфологические правила для построения форм слов, или, если слово совсем отсутствует в словаре, для проверки допустимых правил словообразования. Языки, для которых реализованы подобные модули носят названия языков со словарной поддержкой.

Помимо распознавания собственно символов, большинство промышленных OCR-систем позволяют воспроизводить элементы форматирования исходного текста, такие как картинки, колонки, начертание шрифта и другие не текстовые компоненты максимально близко к оригиналу.

СЭД - Системы потокового распознавания

Основная статья: СЭД - Системы потокового распознавания

Источник — «https://finance.tadviser.ru/index.php/%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F:OCR_-_Optical_Character_Recognition»

Править

Read in English | Короткая ссылка | Просмотров: 8739

Мировой рынок ПЭТ-исследований сердца за год достиг $1,91 млрд

Российский разработчик протезов Steplife заключил контракт на поставки изделий в Судан на ₽1 млрд

В Сеченовском университете развернули систему измерения температуры внутри тела без разрезов и МРТ

Объем мирового рынка устройств для хирургических операций с минимальными разрезами за год достиг $19,07 млрд

больше новостей

Экономические вызовы цифровизации не помеха. Стратегии и эффекты цифровой трансформации на TAdviser SummIT

Экономические вызовы цифровизации не помеха. Стратегии и эффекты цифровой трансформации на TAdviser SummIT

«Кузбассразрезуголь» управляет всеми видами проектов в Directum Projects

«Кузбассразрезуголь» управляет всеми видами проектов в Directum Projects 3.8 т

Противоположные подходы к цифровой трансформации ИТ-директора обсудили на TAdviser Digital Transformation Day

Противоположные подходы к цифровой трансформации ИТ-директора обсудили на TAdviser Digital Transformation Day

Positive Technologies и Группа Rubytech будут решать задачу импортозамещения на объектах КИИ

Positive Technologies и Группа Rubytech будут решать задачу импортозамещения на объектах КИИ 2.2 т

«Электронный бюджет» будущего. Какой будет эта госсистема, рассказали Минфин и Казначейство на TAdviser SummIT

«Электронный бюджет» будущего. Какой будет эта госсистема, рассказали Минфин и Казначейство на TAdviser SummIT 77.8 т

От счетов до межведомственных отчетов: как Sprinter упрощает создание любых документов

От счетов до межведомственных отчетов: как Sprinter упрощает создание любых документов 3.1 т

РСХБ расширяет применение ИИ. Об основных направлениях CIO Сергей Субачев рассказал на TAdviser SummIT

РСХБ расширяет применение ИИ. Об основных направлениях CIO Сергей Субачев рассказал на TAdviser SummIT 80.3 т

Кто и откуда атакует Россию? TAdviser выпустил карту кибергруппировок и их целей

Кто и откуда атакует Россию? TAdviser выпустил карту кибергруппировок и их целей 3.3 т

Артем Хижний, TIKITRIK: Service Desk должен помогать сотрудникам, а не усложнять их жизнь

Артем Хижний, TIKITRIK: Service Desk должен помогать сотрудникам, а не усложнять их жизнь 6.7 т

Глава Минцифры Максут Шадаев на TAdviser SummIT 2025 — о новых рисках и мощных стимулах развития ИТ-отрасли

Глава Минцифры Максут Шадаев на TAdviser SummIT 2025 — о новых рисках и мощных стимулах развития ИТ-отрасли 3.9 т

«Ашан Россия» на TAdviser SummIT: Автономизация ИТ — это долго, сложно и дорого

«Ашан Россия» на TAdviser SummIT: Автономизация ИТ — это долго, сложно и дорого 2.6 т

Как развиваются российские системы кадрового электронного документооборота. Обзор TAdviser

Как развиваются российские системы кадрового электронного документооборота. Обзор TAdviser 3.6 т

Как «Почта России» заменяет TMS-систему Oracle - Дмитрий Чудинов на TAdviser SummIT

Как «Почта России» заменяет TMS-систему Oracle - Дмитрий Чудинов на TAdviser SummIT 105.6 т

Что общего у автопроизводства и цифровизации в «ТехноНиколь»? CIO Владислав Уткин поделился подходами на TAdviser SummIT

Что общего у автопроизводства и цифровизации в «ТехноНиколь»? CIO Владислав Уткин поделился подходами на TAdviser SummIT 2.2 т

«Базис» и «Береста РК» объединят решения для резервного копирования и восстановления данных

«Базис» и «Береста РК» объединят решения для резервного копирования и восстановления данных 5.4 т

Рустам Гуломов, «Митра Софт»: Vaulterix используют для безопасного обмена чувствительными документами

Рустам Гуломов, «Митра Софт»: Vaulterix используют для безопасного обмена чувствительными документами 8.7 т

Работа с договорами в 2025 году: как CLM-системы меняют российский бизнес

Работа с договорами в 2025 году: как CLM-системы меняют российский бизнес 6 т

Группа Rubytech обновила сайт Референсной модели импортонезависимого ИТ-ландшафта и представила Аналитический бюллетень 4.1

Группа Rubytech обновила сайт Референсной модели импортонезависимого ИТ-ландшафта и представила Аналитический бюллетень 4.1 6.5 т

Как МИС и ИИ меняют правила игры в здравоохранении: итоги qConference 2025

Как МИС и ИИ меняют правила игры в здравоохранении: итоги qConference 2025 9.3 т

Ключ к достижениям: как CRM -система помогает решать главные задачи бизнеса

Ключ к достижениям: как CRM -система помогает решать главные задачи бизнеса 10.4 т

Когда защита распадается: что мешает ИБ-решениям справляться поодиночке

Когда защита распадается: что мешает ИБ-решениям справляться поодиночке 9.8 т

Как мы тестируем платформу роботизации Primo RPA — и почему перешли на НТБот

Как мы тестируем платформу роботизации Primo RPA — и почему перешли на НТБот 8.1 т

Антон Балицкий, НИИ «Масштаб»: Экосистема виртуализации VeiL — это не просто продуктовая линейка

Антон Балицкий, НИИ «Масштаб»: Экосистема виртуализации VeiL — это не просто продуктовая линейка 8.4 т

800 тысяч зрителей и ведущие ИИ-эксперты на True Tech Day 2025

800 тысяч зрителей и ведущие ИИ-эксперты на True Tech Day 2025 6.7 т

Алексей Курочка, YDB СУБД Яндекса: К 2030 году 40% выручки на рынке СУБД будет приходиться на отраслевые ПАК

Алексей Курочка, YDB СУБД Яндекса: К 2030 году 40% выручки на рынке СУБД будет приходиться на отраслевые ПАК 8.3 т

YADRO и билайн продемонстрировали работу отечественной базовой станции

YADRO и билайн продемонстрировали работу отечественной базовой станции 3.2 т

«Базис» и Татарстан создадут импортонезависимую облачную инфраструктуру для госсервисов и бизнеса республики

«Базис» и Татарстан создадут импортонезависимую облачную инфраструктуру для госсервисов и бизнеса республики 7 т

ИИ-вирус, поразивший связь, транспорт, энергетику и банки в США – правда и вымысел в кибер-триллере Zero Day

ИИ-вирус, поразивший связь, транспорт, энергетику и банки в США – правда и вымысел в кибер-триллере Zero Day 11 т

Как корпорации и госструктуры внедряют ИИ: первые результаты исследования TAdviser

Как корпорации и госструктуры внедряют ИИ: первые результаты исследования TAdviser 2 т

Технологии интеллектуальной обработки документов: тенденции и перспективы. Обзор TAdviser

Технологии интеллектуальной обработки документов: тенденции и перспективы. Обзор TAdviser 5.3 т