Будущее наступило: топ-5 самых «талантливых» нейросетей мира
Нейросети до 2020-х годов были на передовой научных разработок. Тогда никто не мог предположить, что однажды они станут важной частью интернет-развлечений. И это дает рынку нейросетей немалый финансовый буст — только за прошлый год в приложения по генерации контента с помощью ИИ инвесторы вложили не меньше $1,37 млрд — это больше, чем за последние пять лет. Сейчас нейросети умеют создавать изображения по текстовому запросу и даже писать музыку с текстами. Разбираем самые влиятельные нейросети интернета и их основных бенефициаров.
DALL-E 2 и ChatGPT
Два трендовых ИИ-продукта запустила некоммерческая организация OpenAI, основанная Илоном Маском и экс-президентом венчурного фонда Сэмом Олтменом. Основная цель НКО — разработать безопасный для человечества ИИ и противостоять крупным корпорациям. На старте, в 2015 году, OpenAI получила $1 млрд на развитие от основателей и бизнес-ангелов из LinkedIn, Y Combinator, PayPal, Amazon Web Services и других.
Иронично, что самая крупная корпорация из тех, кому обязалась противостоять OpenAI, стала ее главным инвестором: в 2019 году компания получила от Microsoft $1 млрд. В январе пошли слухи, что корпорация собирается вложить в OpenAI еще $10 млрд.
Из двух флагманских проектов OpenAI пока монетизирует только генеративную сеть DALL-E 2, создающую изображения по текстовому запросу. В первый месяц пользователи получают бесплатно 50 кредитов, после действует лимит в 15 бесплатных кредитов в месяц. Если пользователь превышает ограничение, то должен заплатить $15. Сервисом на ноябрь 2022 года воспользовались более 3 млн человек. Сейчас OpenAI ищет возможность заработать и на ChatGPT, генерирующей текст. Есть вариант ввести премиум-версию более чем для миллиона ее пользователей с рабочим названием ChatGPT Professional.
Доходы OpenAI неизвестны, потому что она не публикует финансовую отчетность. По данным Forbes, компания оценивается в $29 млрд. Она планирует получить минимум $200 млн выручки в 2023-м и в пять раз больше — в 2030-м, писал Reuters. Амбициозные планы подтверждает и Олтмен, не раскрывая источников предполагаемого дохода.
Stable Diffusion
Эту «убийцу» DALL-E 2 в августе прошлого года запустила британская Stability AI. Так же, как и детище OpenAI, Stable Diffusion генерирует изображения, подстраиваясь под текстовый запрос. В отличие от модели OpenAI, в программе Stable Diffusion нет открытого исходного кода. Однако нейросеть стала главным источником прибыли проекта: каждый день Stable Diffusion используют 10 млн человек — больше, чем любую другую модель на основе ИИ.
Быстрой популярности проекта Stability AI, возглавляемой 39-летним Эмадом Мостаком, было достаточно, чтобы инвесторы, в числе которых Amazon, предложили ему оценку в $1 млрд и финансирование в $100 млн. И это произошло в течение двух недель после запуска.
Midjourney
Еще одна невероятно популярная нейросеть, создающая изображения на основе текстовых запросов. За проектом, основанным в феврале 2022 года, стоит 33-летний ученый и бизнесмен Дэвид Хольц. По его словам, у проекта нет инвесторов, а деньги не главная мотивация. «Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, которые будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе», — говорил он. На сайте проекта отмечено, что Midjourney — независимая исследовательская лаборатория с самофинансируемой командой в 11 человек. Среди консультантов проекта — специалисты Apple, AMD, Tesla, Intel и Github.
Впрочем, следование идее не мешает разработчикам монетизировать свой продукт. У пользователей есть 25 бесплатных попыток создать изображение, для продолжения экспериментов по генерации нужно оформить платную подписку, состоящую из трех тарифных планов (одна — корпоративная, две — для частных лиц). Базовая подписка обойдется в $10 в месяц для создания 200 изображений, а за $30 пользователи могут работать без ограничений по числу запросов.
Точное число пользователей и платных подписчиков Midjourney не раскрывает, как и свою финансовую отчетность.
Imagen, Imagen Video, LaMDA
В гонку интеллектов включилась и корпорация Google. В мае она представила собственный аналог нейросети, генерирующей изображения по описанию — Imagen. В компании уверяют, что изображения на выходе получаются в более высоком разрешении, чем в DALL-E 2. Следующей разработкой стала Imagen Video, умеющая создавать видео по описанию.
LaMDA стала ответом корпорации на ChatGPT. Это чат-бот, который способен вести диалог на любую тему и отвечать на вопросы пользователя. Модель содержит 540 млрд параметров, что втрое больше, чем у популярного конкурента. Google еще не запустил нейросеть в открытый доступ, но уже открыл предварительную регистрацию.
Между тем амбиции Google превосходят навыки ее нейросетей. В рекламе своей нейросети Apprentice Bard, основанной на механизмах LaMDA, модели задали вопрос об открытиях космического телескопа Джеймса Уэбба. И искусственный интеллект заявил, что аппарат использовался для первых снимков Земли за пределами Солнечной системы. Но это очевидная ошибка, поскольку эти снимки были сделаны телескопом VLT.
Впрочем, Google не унывает и продолжает инвестировать в ИИ: за последние 14 лет компания вложила в эту технологию почти $4 млрд, что в разы больше инвестиций конкурентов.
StyleGAN, GauGAN2 и Instant NeRF
В 2018 году свою первую нейросеть предоставила Nvidia. Отличие модели от других «генераторов» состоит в реалистичном создании человеческих лиц. Через год компания открыла исходный код, а на основе нейросети начали появляться сервисы-генераторы. Один из самых известных — This Person Does Not Exist, или «Этого человека не существует».
В январе 2022 года Nvidia обновила другую свою нейросеть GauGAN2, которая рисует реалистичные пейзажи в высоком разрешении на основе схематичных рисунков и текстовых описаний. Модель обучена на 10 млн высококачественных изображений пейзажей с использованием суперкомпьютера Nvidia Selene, занимающего по мощности шестое место в мировом рейтинге. Компания оказалась плодовита на технологии и уже в конце марта прошлого года показала нейросеть Instant NeRF, создающую 3D-объекты и целые трехмерные пространства из нескольких десятков снимков.
Аналитики Precedence Research включили Nvidia в список важнейших игроков рынка нейросетей наряду с Intel, Microsoft, IBM, Google, Amazon Web Services и другими. По их прогнозам, рынок будет расти на 38,1% год к году и увеличится до $1,59 млрд к 2030-му. В течение прошлого года, по данным PitchBook, были заключены 78 сделок по инвестициям в разработчиков генеративных ИИ-приложений, а эксперты Sequoia Capital утверждают, что генеративный ИИ в скором будущем «может создать триллионы долларов экономической ценности».