16+


Неразборчивый почерк не помеха для российского ИИ

Российские ученые из Smart Engines разработали искусственный интеллект, способный распознавать трудночитаемые рукописные слова, такие как «шиншилла». Это значительно снижает вероятность ошибок нейросетей в распознавании редких слов и имен собственных.

Новая модель анализирует только особенности соединения букв на изображении, не опираясь на знания о языке. Разработка позволит усовершенствовать системы распознавания документов, в том числе паспортов РФ, используемые в банках, телекоммуникационных компаниях и других организациях.

Слово «шиншилла» стало своего рода тестом для систем распознавания рукописного текста, так как при небрежном почерке буквы «ш», «л» и «и» становятся трудноразличимыми.

Нейросеть «Да Винчи» была обучена на 1,2 миллиона строк синтезированного рукописного текста с равномерным распределением сочетаний букв. По словам генерального директора Smart Engines Владимира Арлазарова, такой подход необходим для точного распознавания документов, где важна каждая буква, а не соответствие языковым правилам, сообщает РИА Новости.

21.03.2025
Арина Вершинина
Фото: FLUX

Мы рекомендуем: