Top.Mail.Ru

«Сбер» анонсировал создание самой сильной продакшен-модели для GigaChat

23.11.202314:59
Фото: Сбер Фото: Сбер

«Сбер» анонсировал создание новой версии GigaChat, в основу которой ляжет одна из самых продвинутых продакшен-моделей для русского языка. Она будет учитывать 29 миллиардов параметров.

Об этом компания рассказала на международной конференции по искусственному интеллекту AI Journey. Отмечается, что интеграция нового решения позволит GigaChat сравняться с популярными зарубежными решениями.

По словам разработчиков, доступ к API новинки скоро получат бизнес-клиенты «Сбера». Они смогут использовать ИИ для реализации собственных решений. Пользоваться новой версией GigaChat позволят и участникам академического сообщества. Им сервис пригодится для проведения исследований.

Интеграция новой LLM позволяет GigaChat лучше следовать инструкциям и выполнять более сложные задания. У сервиса улучшилось качество рерайтинга и редактирования текстов, суммаризации и формулирования ответов на различные вопросы. По оценке команды «Сбера», новая модель превосходит предыдущую по качеству на 23%. Внутренняя оценка показала, что новая языковая модель в GigaChat превосходит самый популярный открытый аналог LLaMA 2 34B.

Обучение моделей, лежащих в основе нейросети — масштабный и сложный вычислительный проект, заявил старший вице-президент, СТО, руководитель блока «Технологии» Сбербанка Андрей Белевцев. Прежде ничего подобного компания не делала.

«Специально для GigaChat мы собрали и развиваем уникальный датасет, над которым работают сотни сотрудников "Сбера", помогая развивать и улучшать качество ответов в самых разных доменах. Благодаря этим усилиям пользователи с каждым новым релизом GigaChat получают максимум от сервиса для решения своих задач», — подчеркнул Белевцев.

В разработке GigaChat участвуют команды SberDevices и Sber AI. Поддержку оказывают Института искусственного интеллекта AIRI и различные отраслевые эксперты. Узнать подробнее о возможностях нейросети и ознакомиться с примерами удачных запросов можно в базе знаний о сервисе.