Результаты оказались неожиданными — из 26 протестированных языков самым понятным для искусственного интеллекта стал польский. Точность обработки запросов на нем составила 88%. Второе место занял русский язык с точностью отклика 87%. В пятерку лидеров вошли французский (86%), итальянский (85%) и испанский (85%). Английский, несмотря на широкое распространение и статус международного языка, занял шестое место с показателем 84%. На заключительных позициях — китайский, хинди, иврит.
Результаты исследования связаны с особенностями грамматической структуры языков. Превосходство русского и польского объясняется их разнообразной грамматикой и богатой морфологией. Сложная система падежей и строгие правила согласования минимизируют неоднозначность запросов. Это значительно облегчает искусственному интеллекту интерпретацию обращений и формирование ответов.
Упрощенная грамматическая структура английского языка, напротив, дает больше пространства для неоднозначных и неверных трактовок. Китайский язык оказался для ИИ самым трудным из-за зависимости от контекста и тонов.
Преимущество русского и польского языков заключается в более четком выражении смысловых и логических связей. Поэтому русскоязычные пользователи могут общаться с чат-ботами и другими ИИ-системами на родном языке. В большинстве случаев он обеспечит более точную коммуникацию, чем английский.
Особое внимание в исследовании уделялось обработке длинных и сложных запросов. Ученые выявили, что в целом при работе с большими текстами эффективность языковых моделей снижается. Однако славянские языки, включая русский и польский, сохраняют высокую точность даже при увеличении объема входных данных. Качество интерпретации длинных запросов показало высокую адаптивность ИИ-систем к особенностям морфологически богатых языков.
Авторы работы отметили важность сбалансированного и разнообразного корпуса обучающих данных. Большое количество текстов на сложных, грамматически насыщенных языках способствует развитию универсальных ИИ-моделей, которые смогут работать в мультиязычной среде.
Русский сегодня является одним из лучших языков для эффективного взаимодействия с современными нейросетями. При этом поддержка и развитие языкового разнообразия становятся ключевыми факторами дальнейшего прогресса в области искусственного интеллекта и робототехники в многоязычном цифровом мире.
