Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter

23-й Форум «Информационные технологии в финсекторе»

 
 
IX Форум Auto-ID & Mobility - решения для бизнеса

Smart Engines представила OCR для распознавания текста на 102 языках со скоростью 15 страниц в секунду

27.12.2022 Smart Engines

Российская компания Smart Engines объявляет о выпуске системы распознавания текста нового поколения. Она умеет находить документ на фотографии или скане и распознавать все текстовые данные на 102 языках. Решение является частью продукта Smart Document Engine, включенного в реестр российских программ. Собственная технология распознавания символов GreenOCR®, используемая во всех продуктах компании, позволяет достигать высочайшей точности даже на некачественных фотографиях. ПО предназначено для замещения продуктов ABBYY и созданных на их основе решений, предлагаемых в России, а также другого иностранного ПО в корпоративном и государственном секторе. 

Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах. От скорости и точности извлечения данных напрямую зависит трудоемкость и возможная глубина автоматизации процесса обработки документов. 

Разработанная система обеспечивает технологический суверенитет, так как в продукте для распознавания и обработки изображений не используется код Open Source и иностранные программные компоненты. На современном смартфоне весь процесс от фотографии до текста занимает 3-4 секунды, что делает планшетный сканер ненужным. Кроме распознавания система, автоматически обрезает, разглаживает сложенные документы и улучшает его изображение превращая телефон в мгновенный сканер. В серверных решениях на 32-х ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.

“Ранее в подобных задачах многие компании полагались на OCR решения компании ABBYY, но в начале 2022 года после 30 лет работы в стране она неожиданно покинула РФ, исключив ряд продуктов из реестра российских программ. Это событие стало “черным лебедем” для отечественного рынка, создав существенные риски при реализации проектов цифровой трансформации, - сообщил генеральный директор Smart Engines кандидат технических наук Владимир Арлазаров. - Сейчас мы представили последний недостающий элемент и теперь в России есть все необходимые бизнесу технологии для распознавания документов”

Разработчикам и заказчикам технология распознавания текстовых документов доступна для встраивания в серверные, мобильные, десктопные и веб-приложения в составе программного продукта Smart Document Engine. Система функционирует без подключения к сторонним сервисам и внешним ресурсам, не требует GPU. Для распознавания не нужно наличие сети Интернет, все вычисления выполняются на центральном процессоре устройства и не требуют использования видеокарт.

Кроме привычных языков, базирующихся на кириллических и латинских алфавитах, распознает арабский, армянский, греческий, грузинский, иврит, китайский, корейский и японский. Smart Document Engine поддерживает ALT Linux, Astra Linux, “Ред ОС” и другие ОС семейства Linux, Windows, macOS, iOS, Android, ОС Аврора.



 
IX Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Международная промышленная выставка «EXPO EURASIA KAZAKHSTAN 2024»
Вторая международная промышленная выставка «EXPO-RUSSIA IRAN 2024»

Опрос


Цифровая индустрия промышленной России - ЦИПР



Комментарии