Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter


 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Smart Engines научилась распознавать рукописную “шиншиллу” из мемов про русский курсив

21.03.2025

Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы

Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как “шиншилла”, без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями.

Слово “Шиншилла” – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы. По этой причине слово “шиншилла” неоднократно упоминалось в мемах про сложность русского языка.

Нейросетевая архитектура «Да Винчи» не использует лингвистические механизмы — рекуррентные схемы, триграммы и словари. За счет этого она работает быстрее аналогов и занимает меньше места в памяти устройства. Но даже это не гарантирует переобучения языковому контексту. Для радикального сокращения риска галлюцинаций «Да Винчи» обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв.

“Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка”, – комментирует генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

Выход новой технологии приурочен к десятилетию выпуска первой системы распознавания паспорта РФ в видеопотоке на смартфоне. 17 марта 2015 года ученые Smart Engines первыми в мире реализовали возможность распознавания страниц основного разворота паспорта на мобильном телефоне в видеопотоке в режиме реального времени. Целевыми моделями в то время были iPhone 4S и Samsung Galaxy S3.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert

Читайте нас на VK: https://vk.com/idexpert_ru

Источник:  Пресс-служба Smart Engines


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

Chainway UR4
Chainway UR4
4-портовый стационарный UHF RFID считыватель
Chainway MC62
Chainway MC62
Высокопроизводительный мобильный компьютер промышленного класса
DASCOM DP-641
DASCOM DP-641
Мобильный принтер этикеток
RST-SPEEDWARE
RST-SPEEDWARE
ПО для сбора информации со считывателей и сохранения ее в базе данных
UHF RFID метка TwinTag
UHF RFID метка TwinTag
UHF RFID метка для маркировки широкого спектра товаров в розничной торговле
DASCOM DC-7600
DASCOM DC-7600
Карточный принтер с технологией ретрансферной печати
Тау Платформа
Тау Платформа
Кроссплатформенное решение для быстрой разработки мобильных и десктоп приложений
RST-GN-001
RST-GN-001
Портальный RFID-считыватель для регистрации RFID-меток в контролируемых проходах
Chainway URA4
Chainway URA4
4-портовый стационарный UHF RFID-считыватель на базе ОС Android 9.0

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии