«Сбер» представил новую версию нейросети Kandinsky 2.1

«Сбер» представил нейросеть Kandinsky 2.1. Новая генеративная модель может за несколько секунд создавать высококачественные изображения по их текстовому описанию, смешивать несколько рисунков, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и т. д.
Разработкой и обучением нейросети занимались исследователи Sber AI. Партнерами проекта выступили ученые из Института искусственного интеллекта AIRI. Об этом сообщает пресс-служба Сбербанка.
Отмечается, что Kandinsky 2.1 сохранила навыки предыдущей версии, обученной на одном миллиарде пар «текст — изображение». Ее дополнительно обучили на 170 миллионах таких пар.
Еще один этап обучения новой генеративной модели — специально собранный датасет из двух миллионов пар качественных изображений с описаниями, затрагивающими сложные для нейросети области (например, лица людей).
Kandinsky 2.1 понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях. Она использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP.
В новой модели улучшена генерация изображений в высоком разрешении, таких как лица, сложные объекты и т. д. Применять нейросеть можно в различных отраслях.
«Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это еще один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдется задача для Kandinsky 2.1, и поэтому улучшенная модель, как и ее предыдущая версия, находится в открытом доступе: протестировать ее может любой желающий, причем бесплатно», — заявил первый зампред правления Сбербанка Александр Ведяхин.
Нейросеть доступна на промостранице модели. Ее можно запустить при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении «Салют», а также на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Доступен Kandinsky 2.1 для использования на платформе Fusion Brain и в Telegram-боте.