16+


Китай и Россия успешно развивают большие языковые модели

В начале 2025 года мир больших языковых моделей пережил настоящий перелом — на рынок вышли два амбициозных проекта из Китая. Речь идет о DeepSeek и QWEN — моделях, разработанных с акцентом на эффективность, экономичность и доступность. Не остаются в стороне и российские разработки — YandexGPT и GigaChat продолжают демонстрировать, что локальные решения способны успешно конкурировать на мировом уровне.

DeepSeek

Главная особенность DeepSeek R1 — это возможность проследить цепочку рассуждений модели, что позволяет понять, как именно она приходит к ответу. Разработчики также гордятся тем, что заметно снизили затраты на обучение по сравнению с западными аналогами, что делает эту технологию особенно привлекательной для бизнеса.

Более того, открытый исходный код модели открывает огромные возможности для исследователей и разработчиков, желающих адаптировать эту технологию под свои нужды.

QWEN

Немного позже от Alibaba на свет появилась модель QWEN 2.5–Max. Эта универсальная система способна справляться с широким спектром задач — от генерации текстов до работы с мультимедийными данными. Одним из ее главных преимуществ является поддержка нескольких языков и оптимизация для работы с большими объемами информации.

Несмотря на то, что QWEN не демонстрирует подробную цепочку рассуждений, ее алгоритмы обеспечивают высокую скорость и качество ответов. Доступность этих решений без жестких ограничений делает их интересными для бизнеса, который ценит возможность внедрения передовых технологий при умеренных расходах.

YandexGPT

На фоне глобального тренда не отстают и отечественные специалисты. YandexGPT — продукт, созданный с учетом особенностей русского языка, — показывает отличные результаты в решении задач генерации текстов, анализа информации и даже программирования.


Независимые тесты и внутренние исследования свидетельствуют о том, что модель стабильно работает на уровне 85–95% от показателей ведущих мировых аналогов. Это дает ей значительные преимущества в прикладных сценариях, востребованных российским рынком.

GigaChat

Еще один интересный представитель российского ИИ — GigaChat. Эта модель, ориентированная на создание удобного чат-бота, демонстрирует конкурентоспособное качество ответов при обработке текстовой информации.

Независимые эксперты отмечают, что GigaChat успешно справляется с контекстуальными задачами, что особенно важно для бизнес-приложений. GigaChat постоянно совершенствуется и уже нашел применение в ряде коммерческих проектов.

Результаты тестов

Одним из ключевых показателей эффективности языковых моделей являются результаты независимых тестов:

  • DeepSeek R1 на тесте MATH‑500 показала 97,3% (по сравнению с 96,4% у OpenAI o1). Программные тесты, такие как Codeforces и SWE‑bench, подтвердили стабильность модели при решении задач по кодированию и алгоритмическому мышлению.

  • QWEN 2.5–Max. Внутренние тесты Alibaba демонстрируют, что QWEN по ряду задач — от логических рассуждений до математических вычислений — показывает улучшение на 5–8% по сравнению с предыдущими версиями и некоторыми зарубежными моделями.

  • YandexGPT регулярно проходит независимые тесты на платформах типа LLM Arena, демонстрируя результаты, сопоставимые с мировыми стандартами, что подтверждает ее высокую точность.

  • GigaChat показывает, что даже модели с меньшим числом параметров, чем у лидеров отрасли, могут давать адекватные и стабильные ответы, что делает GigaChat привлекательной для задач, связанных с обработкой текстовой информации.

Выводы и перспективы

Запуск DeepSeek и QWEN — яркий пример того, как современные технологии позволяют создавать эффективные и экономичные языковые модели. Китайские проекты доказали, что можно достичь высокого уровня математического и логического рассуждения при относительно низких затратах.


Отечественные разработки, такие как YandexGPT и GigaChat, демонстрируют, что адаптация к специфике местного рынка играет не менее важную роль в достижении конкурентоспособности. Регулярное тестирование и объективное сравнение через независимые бенчмарки позволяют бизнесу делать выбор, опираясь на проверенные данные, а не на громкие заявления и яркий пиар.

25.03.2025
Кристина Волкова
Фото: Midjourney

Мы рекомендуем: