Top.Mail.Ru

Китайская ByteDance представила модель ИИ OmniHuman для реалистичных видео

05.02.202518:55

Китайская компания ByteDance, владеющая соцсетью TikTok, представила свою модель искусственного интеллекта (ИИ) OmniHuman-1. Она может генерировать видео с изображением людей из фотографии и аудио.

Об этом говорится в заявлении разработчиков ByteDance, размещенном на платформе GitHub. «Мы предлагаем сквозную платформу… для генерации видео с изображением людей под названием OmniHuman, которая может генерировать видео на основе одного изображения и сигналов движения (например, только аудио, только видео или комбинация из аудио и видео)», — заверили разработчики.

OmniHuman способна генерировать «чрезвычайно реалистичные видео» с изображением людей на основе слабых входных сигналов. Также она поддерживает различные визуальные и звуковые стили, может генерировать видео с любым соотношением сторон и пропорциями тела. Отмечается, что в OmniHuman улучшено отображение жестов, что являлось проблемой для других подобных ИИ.

В качестве примера приводятся образцы сгенерированных видео, на одном из которых «оживший» Эйнштейн рассказывает о науке в течении 23 секунд. ByteDance официально данную модель пока не выпустила.

Ранее сообщалось, что компания OpenAI представила новый агент ИИ deep research для проведения более комплексных исследований в чат-боте ChatGPT. Он позволит проводить многоэтапные исследования в интернете для решения комплексных задач. Новый агент ИИ позволяет за десятки минут выполнить ту работу, на которую у человека ушло бы несколько часов.