Пятое лето ИИ
В начале этого года казалось, что весь 2023‑й пройдет под знаком революции искусственного интеллекта. ChatGPT, генераторы изображений Midjourney и DALL-E взорвали общественное сознание. Еще бы — впервые за всю историю человечества не только загадочные айтишники, а абсолютно все получили доступ к нейросетям, которые не просто анализируют информацию, но и пишут за нас тексты и рисуют картины.
Весь мир с головой увяз в ChatGPT, котрый побил мировой рекорд по скорости прироста пользовательской базы. Всерьез пошли разговоры о том, что ремесленникам творческих профессий — дизайнерам, 3D-моделлерам, копирайтерам, писателям и даже программистам — стоит опасаться за свои рабочие места. Революция ИИ сотрет их как класс с лица земли. Как в свое время ткацкий станок в Британии уничтожил вековой уклад жизни деревни, породив движение луддитов — людей, которые разрушали эти самые станки, уничтожавшие привычный образ жизни.
Но к концу года о восьмом чуде света в лице популярных нейронных сетей как-то подзабыли. В СМИ о них уже почти не пишут, динамика роста ChatGPT уже не впечатляет.
Так что же произошло? Где сломался тренд и был ли он вообще? А может, это козни неолуддитов?
Чтобы правильно ответить на эти вопросы, необходимо сперва понять, что любое техническое открытие серьезного масштаба в процессе своей эволюции проходит несколько «сезонов». Лето сменяется зимой, между которыми есть подобие «межсезонья».
Это легко понять на примере железных дорог. В середине XIX века британцы и в целом европейцы носились с ними так же, как мы сейчас с ИИ. Еще бы — если до их появления все крупные транспортные артерии проходили по рекам, то железные дороги позволили связать территории, где были ресурсы, но не было подходящих водных артерий. Это открывало огромные возможности для индустриализации. Все деньги потекли туда. Но первое «лето» железных дорог закончилось спекулятивным финансовым пузырем, чередой мошенничеств и всеобщим разочарованием.
Первая железная дорога — между городами Стоктон и Дарлингтон — была открыта в 1825 году, спустя шесть лет поезда начали ходить между Ливерпулем и Манчестером.
Компания Liverpool & Manchester Railway объявила о десятипроцентных дивидендах, ее акции удвоились в цене, рост котировок подхлестнул лихорадку. В середине 1830‑х было запущено 59 проектов с общими инвестициями в £3,6 млрд (в современных ценах). С учетом того что мировая экономика в то время была несравнимо меньше современной, это означало, что абсолютно все свободные деньги Европы были вложены в железные дороги — и в первую очередь именно британские. Масштабы этого инвестиционного пылесоса можно сравнить разве что с 1950–1960‑ми и их космическо-ракетной гонкой. Где одни и те же технологии шли и в стратегические ядерные ракеты, и на полеты в космос.
Через 20 лет после строительства первой железнодорожной ветки, в 1845 году, было зарегистрировано 1428 компаний. А денег для реализации их проектов требовалось уже более £100 млрд в современных ценах. Это новые инвестиции плюс старые долги. ВВП Британии на тот момент был вдвое меньше. Железнодорожных веток банально построили слишком много. Вернее сказать — чрезвычайно много. На одном направлении могли работать сразу три параллельных маршрута. Что уничтожало былую прибыль и делало функционирование всех трех убыточным. Так пузырь схлопнулся. Компания — первооткрыватель рынка Liverpool & Manchester Railway — в 1845 году, почти на пике пузыря, была продана одному из своих конкурентов — Grand Junction Railway. А уже через год, в свою очередь, GJR была продана London and North Western Railway — самой крупной акционерной компании XIX века. Аналог Apple для нас. Уже в начале XX века компания успешно провела электрификацию своей железнодорожной сети внутри Лондона. В 1922-м она была поглощена еще более крупным конгломератом, а тот уже в середине XX века национализирован правительством. Часть веток XIX века была закрыта, а наиболее актуальные, наоборот, расширены. Железнодорожная ветка Ливерпуль — Манчестер существует до сих пор.
Основатель Liverpool & Manchester Railway Генри Бут планомерно, раз за разом становился директором компаний, в которые вливалось его детище. Он проработал CEO крупнейших железнодорожных компаний Британии до 70 лет, после чего успешно ушел на пенсию с солидным капиталом. Фактически он создал индустрию (ему даже принадлежит ряд технических изобретений), разогнал ее до величайшего мирового пузыря на тот момент, а затем провел через кризисные годы.
Лопнувший пузырь привел к следующим, вполне логичным в той ситуации выводам:
-
Безусловно, уголь, паровой котел и железная дорога предоставляют в перспективе неограниченные возможности экономического роста. Фактически человечество в XIX веке впервые смогло уйти от модели, где на определенное количество едоков обязательно было иметь минимальный объем плодородной пахотной земли. Население планеты смогло расти за счет индустриализации. И не просто расти, а еще и повышать качество жизни и ее продолжительность.
-
Несмотря на все возможности, которые предоставляла инфраструктура железных дорог, они не могли выполнять работу за людей. Они лишь делали ее более эффективной. Осознание этого факта является ключевой точкой наступления очередной «осени» любого крупного технического прорыва человечества.
-
Если технологическая новинка не делает работу за человека, то у нее есть очевидные пределы роста той самой производительности труда привлекаемых людей. А значит, долгосрочно она не может давать возврат на вложенный капитал, исчисляемый сотнями процентов. А если ограниченность доходности капитала становится очевидна для всех, это также стимулирует разочарование и наступление «осени» в сознании инвесторов. Неизвестность пределов роста новой технологии всегда бесконечно соблазнительнее для спекуляций, чем четкая и понятная схема получения добавленной стоимости.
Естественно, железные дороги еще не раз переживали «зиму» и «лето» в своей истории. Позже они стали массовым явлением, подешевели, благодаря чему стали удобным и дешевым средством перевозки людей. В конечном счете они переросли в метро — кровеносную систему любого мегаполиса. С приходом электрификации они были трансформированы с паровых на электродвигатели, а в последнее «лето» доставляющих пассажиров за 1000 километров всего за пять часов.
Ровно та же история была с гидроэлектростанциями. Невероятный прорыв первого «лета» сменился «зимой» из-за влияния на экологию, необходимости затоплять целые города и в целом — крайней ограниченности полноводных рек, пригодных для установки ГЭС. Тот же самый цикл прошли и угольные, а затем и атомные станции, где Чернобыль, а позже Фукусима показали, что технология в очередной раз не является волшебной палочкой, которая позволит работать гораздо меньше, а получать гораздо больше.
А что же с искусственным интеллектом или, как мы его называем, ИИ?
Официально в этом году мы пережили уже пятое «лето» ИИ. За последние 60 лет почти каждое десятилетие мы проходили полный цикл — от головокружительных надежд и миллиардных инвестиций до полного разочарования, уныния и потери денег.
Первый цикл ИИ пришелся на 1960‑е годы. Американцы активно пытаются использовать первые алгоритмы искусственного интеллекта в целях мгновенного перевода перехваченных русских документов и докладов. Идея была хорошей, но всплыла проблема многозначности языка. Алгоритму был необходим контекст, и без него он не проходил даже банальной проверки обратным переводом. Сделав перевод с русского на английский и обратно, пионеры ИИ получали хаотичный набор слов в любом мало-мальски сложном предложении. К слову, машинный перевод до сих пор остается задачей нерешенной — он и сегодня не умеет переводить сложную литературу и речь, в которых активно используется контекст.
1970‑е ознаменовались появлением «перцептрона» — прообраза всех современных нейросетей. Как оказалось, это было прорывным решением, которое в будущем будет двигать всю отрасль вперед. Но тогдашние технические ограничения просто не позволяли хоть сколько-нибудь качественно обучать нейросети. На это не хватало ни вычислительных мощностей, ни данных, ни места для их хранения. Но главное — не хватало денег.
Все понимали, что за нейросетями будущее, но инвестировать миллиарды в технологию без просматриваемого результата в обозримом будущем желающих не было. Государство и оборонка, которые были главными заказчиками и одновременно инвесторами, не только не дали денег, но и выпустили ряд разгромных докладов о том, что весь ИИ — это полнейшая профанация, где нет цели, а есть только путь.
Пожалуй, самой заметной и чуть ли не единственной попыткой практического применения ИИ в тот период стало голосовое управление — замечу, еще одна задача, которая до сих пор не решена на качественном уровне. Пентагон заказывал системы распознавания голосовых команд пилотов. Пробный проект полностью провалился — технология не работала. К концу цикла ИИ оказался в технологическом тупике — более экономичные алгоритмы уже, очевидно, не справлялись, а на развитие новых никто не был готов давать деньги.
В 1980‑е про нейросети уже никто не вспоминал — на первый план вышли гораздо более простые с точки зрения реализации «экспертные системы». Бум на них прокатился по всему миру, в том числе и в СССР, где на их разработку также тратились серьезные ресурсы. Это был прообраз современных поисковиков. Только поиск проводился по строго определенному набору информации.
Кризис экспертных систем наступил по простой причине: они были слишком «глупыми». Привычный нам поиск по неточному вхождению работал плохо. Они были «хрупкими», плохо отрабатывали ввод нестандартных для себя данных и стоили астрономических денег. Но их настоящим убийцей стал персональный компьютер Apple — появление персональных компьютеров у массового пользователя сделало всю технологию так называемых LISP-машин, на базе которых работали коммерческие решения экспертных систем, экономически нецелесообразной. В итоге произошло естественное схлопывание всей цепочки компаний, работавших на этом рынке, — как со стороны аппаратной, так и со стороны программной части. Крышку гроба заколотили японцы.
В 1981 году, на пике своего технологического и финансового превосходства, они анонсировали программу по запуску компьютера пятого поколения. Он должен был делать уже знакомый нам машинный перевод, предоставлять голосовое управление, использовать машинное зрение, а также выдавать человеку ответы в том виде, что сейчас реализовал ChatGPT. Когда спустя 10 лет японский экономический пузырь лопнул, а этот компьютер так и не был доведен до рабочего состояния, наступила третья по счету глубокая «зима» ИИ. Из индустрии опять сбежали все деньги.
«Зима», начавшаяся в начале 90‑х, была самой затяжной и продлилась практически 15 лет. Ее еще принято называть «ядерной». В этот период стало очевидно, что нейросети — это будущее, но проблема была в том, что по-прежнему крайне не хватало вычислительных ресурсов, чтобы с их помощью добиться первых заметных результатов.
В девяностые и начале нулевых ИИ фактически стал ругательством. Ученые и инженеры старались всячески обходить его и использовать более прикладное «машинное обучение», не претендующее уже в своем названии на какое-либо сознание и выполнение сложных комплексных и разнообразных задач. Основным драйвером в этот период стала промышленная робототехника. Начало широкой автоматизации производств требовало огромного спектра прикладных технологий ИИ.
Кроме того, разного рода «умные» алгоритмы стали просачиваться во все сферы промышленного производства — от автомобильных автоматических коробок передач до стиральных машин и телевизоров. В начале 2000‑х высокотехнологичные компании по всему миру возвращаются к попыткам решить задачу машинного перевода, зрения, голосового управления, автопилота и т. д. Никто из них не достиг значимых результатов, но стало понятно главное — путь через нейросети верный. Вопрос лишь в достаточном объеме аппаратных ресурсов для окончательного решения задачи. Принято считать, что «зима» в этот период наступает вместе с финансовым кризисом 2008 года. Проекты из области ИИ получают обвальное сокращение финансирования по всему миру.
В 2010‑х ИИ перезапускается вместе с мировой экономикой, где американский IT-сектор — Силиконовая долина — начинает занимать главенствующую роль в мировом интернете. Рост вычислительных мощностей, увеличение объема и, самое главное, качества этой информации в Интернете позволяют наконец начать применять нейросети на полную катушку. Соцсети и мобильные приложения становятся главными драйверами рынка. Машинное зрение впервые добивается значимых успехов и начинает выполнять широкий спектр практических задач. Огромный спрос эта технология получает благодаря соцсетям, которым из-за жесткого законодательства почти всех стран мира приходится контролировать весь контент, публикуемый в их системе.
«Макушкой лета» этого «сезона» становится ноябрь 2022 года, когда свет увидел ChatGPT, а вместе с ним и «умные генераторы картинок». Человечество впервые увидело продукт, который отдаленно похож на ИИ, да еще и может генерировать вполне сносные изображения как настоящий живой иллюстратор.
Впервые машинный перевод, зрение, речь, голосовое управление, автопилот вышли на уровень, когда ими можно начать пользоваться без боли. Закономерно, что это произвело фурор. Чтобы довести технологию нейросети до «вау-эффекта», человечеству понадобилось 50 лет.
СМИ взорвались ИИ-хайпом. В индустрию хлынули огромные деньги. На фоне мирового экономического спада, увеличения уровня долгов и снижения темпов прироста производительности труда американскому рынку нужна была именно такая палочка-выручалочка, которая не только решит все экономические проблемы, но и поможет и дальше зарабатывать на фондовом рынке, как это делали IT-компании в 2020 году.
На протяжении всех пяти «сезонов» ИИ инженеры сталкивались с одинаковыми ограничителями роста
-
Дефицит вычислительных мощностей. Из раза в раз для все более сложных задач инженерам не хватало вычислительных мощностей.
-
Дефицит валидных и очищенных данных, в идеале получаемых в реальном времени. В XX веке жесткие диски были маленькими и дорогими, хранить на них терабайты информации, ценность которой крайне низкая, было нереально. Опять же, интернет, каким мы его знаем, появился лишь в 2000‑е. Именно он позволил собирать, очищать и децентрализованно/удаленно хранить огромные объемы информации. До этого инженеры ничего подобного позволить себе не могли. Информация в основном собиралась и оцифровывалась вручную. Хранить большой объем ≪грязных≫ данных для дальнейшей работы с ними нейросетей было невозможно. О передаче сколько-нибудь крупных объемов данных в режиме реального времени не было и речи.
-
Ограниченность в вычислительных мощностях и качественных данных приводила к использованию инженерами и учеными крайне ≪экономичных≫ алгоритмов, которые не позволяли в действительности приближаться к уровню обработки информации человеком. Дефицит ресурсов был сильнейшим ограничителем математической мысли с точки зрения развития алгоритмов.
-
Проблемы первых трех пунктов выливались в крайне ограниченную применимость технологии как для бизнеса, так и для армии/спецслужб. В конечном счете раз за разом оказывалось дешевле выполнять бóльшую часть задач «по старинке», с использованием человека. Следовательно, цикл за циклом отрасль недополучала финансирование во время «зимовок». Отсутствие финансирования естественным образом провоцировало вымывание квалифицированных кадров. Все это делало общий процесс развития крайне нестабильным.
Что же пошло не так? Почему ИИ также резко пропал из инфополя, а объем инвестиций в ИИ-стартапы месяц от месяца сокращается? Ответ на этот вопрос — во всех предыдущих циклах. Текущие успехи нейросетей, если присмотреться, очень похожи на ситуативный успех экспертных систем. Они давали поистине огромный прирост эффективности, но в сильно ограниченном спектре областей применения. Кроме того, современные нейросети подвержены все тем же болезням, что и экспертные системы:
Хрупкость данных. Нельзя на 100 % доверять тому, что выдает ChatGPT. Алгоритм в любой момент может дать сбой и предоставить неточный исторический или научный факт.
Стремительная потеря актуальности. Информация в ChatGPT до недавнего времени доступна была лишь по 2021 год. А нейросеть, не обладающая актуальным набором данных, не может дать корректного ответа на вопрос. Совсем недавно разработчики сообщили, что эта проблема решена и нейросеть получает актуальные данные, но качество ее ответов еще предстоит проверить. Стриминг актуальных данных в нейросеть является одной из сложнейших задач ИИ — на уровне с автопилотированием автомобиля.
Финансовый пузырь. По аналогии с япон-ским компьютером пятого поколения огромное желание рынка найти палочку-выручалочку привело к раздуванию рынка до размеров монструозного пузыря. Фондовый рынок двигали лишь американские бигтехи, а остальные топтались на месте или падали в цене. Применение новых технологий, безусловно, повышает норму прибыли Google, Microsoft и Apple и даже, пусть и крайне ограниченно, повышает производительность труда. Но есть ощущение, что предел этой производительности недалек.
Экономическая сходимость. Это причина, по которой наступала каждая ИИ-«осень». Нейросети пожирают устрашающие объемы вычислений и памяти для хранения информации. При этом способы их применения чаще носят развлекательный характер с не до конца понятной монетизацией. Пока все создатели нейросетей высокого уровня получают неограниченное финансирование, которого хватит на пару лет вперед. Но что будет после и смогут ли они демонстрировать прибыль, остается загадкой.
Из раза в раз отрасль ИИ разбивалась о свою экономическую неэффективность. Решать задачи в итоге оказывалось дешевле другим набором технологий. Объективно сейчас ChatGPT стал чем-то вроде продвинутого поисковика. Умение его использовать, безусловно, повышает производительность труда и скорость обучения любого, кто работает с информацией. Но он по-прежнему не выполняет работу за человека, а лишь повышает ее производительность. Точно так же, как в 2000‑е повышали производительность обычный «Яндекс» или Google.
Коллективное бессознательное это уже заметило и свои восторги по поводу ИИ поумерило. За ним притихли и глобальные медиа. Большие деньги тоже настроились на отлив.
Чтобы это понять, достаточно посмотреть на следующие два примера. Китайская компания SenseTime, ответственная за знаменитую китайскую систему распознавания лиц, в 2018 году стала самой дорогой ИИ-компанией в мире. Она привлекла $600 млн при оценке в $3 млрд. Уже через год компанию внесли в черный список США за нарушение прав человека, в первую очередь уйгуров (мусульман, проживающих на территории Китая). На новый 2021–2022 год компания привлекла еще $700 млн через IPO, получив оценку уже в $16 млрд. Это стало пиком ее цены. К октябрю 2022 года цена акций компании упала в три раза на фоне общемировых энергетического и инфляционного кризисов. Интерес к акциям компании на время вернуло появление ChatGPT в конце__ 2022 года, они выросли на 35 %. Но в настоящее время они упали до минимального уровня с момента публичного размещения компании на бирже. Сейчас SenseTime стоит около $5 млрд. C 2018 года компания не смогла продемонстрировать хоть сколько-нибудь заметного роста к текущему моменту. Основной причиной стали, конечно же, американские санкции, конфликт основных продуктов компании с западными представлениями о свободах индивида и, как следствие, серьезное ограничение для выхода на внекитайские рынки.
Главный создатель ИИ-хайпа в лице OpenAI, которая создала ChatGPT, сложнее для финансового анализа, так как это некоммерческая организация.
Ряд инвесторов, в том числе Илон Маск и Amazon, обещали вложить в нее миллиард долларов. Но к 2019 году организация фактически получила лишь $130 млн. Львиная доля расходов уходила на облачные вычисления, остальное — на зарплату сотрудникам. В 2019‑м OpenAI становится «ограниченно коммерческой», жестко ограничив свою возможную прибыль. Это было сделано для легального привлечения уже не грантов (по сути, пожертвований), а настоящих инвестиций и возможности раздать опционы своим ключевым сотрудникам, которые бы компенсировали более низкие, чем в бигтехе, зарплаты. В этот же год компания получает $1 млрд инвестиций от Microsoft и доступ к их инфраструктуре облачных вычислений. В тот же год компания переходит от открытых патентов к коммерческим. Фактически некогда НКО превращается почти в классический коммерческий стартап.
На пике популярности, в январе 2023 года, Microsoft говорила об оценке OpenAI в $29 млрд, что вдвое больше оценки 2021 года. Также Microsoft упоминала инвестиции в проект в $10 млрд (видимо, выкуп большей доли компании). В обмен на которые предполагалось, что Microsoft может получать 75 % прибыли OpenAI до тех пор, пока она не обеспечит возврат инвестиций, а также 49 % акций компании. Говорить об актуальной капитализации OpenAI в данный момент крайне сложно. Это частная компания, которая не торгуется на бирже и является по факту филиалом Microsoft. Учитывая общее охлаждение рынка, а также информацию об огромных затратах OpenAI на серверные мощности (что ограничивает потенциал будущей прибыли), маловероятно, что капитализация с пика января 2023‑го выросла.
Какие основные выводы можно сделать на примере этих двух очень разных компаний, к тому же представляющих два враждующих геополитических блока? Основных выводов три.
-
Первый — перспективы компаний сектора ИИ крайне чувствительны ко всему, что связано с конфиденциальностью, обработкой персональных данных и гостайной. Любой скандал может похоронить бизнес.
-
Второй — так же, как по всем перспективным технологиям (5G, электротранспорт, современные микрочипы), наблюдается экономический разлом, что ограничивает всем компаниям в сфере ИИ потенциальные рынки сбыта, а также сбор информации для обучения.
-
Третий — с учетом колоссальных затрат на серверные мощности абсолютно любого ИИ-стартапа доступ к платежеспособным рынкам становится ключевым вопросом его будущей сходимости в экономике.
Вот так, абсолютно прогнозируемо и закономерно, прошли самые жаркие деньки «лета» ИИ 2010–2020‑х — уже пятого цикла несбывшихся надежд человечества. Ждем «зимы», а за ней — следующего «лета». Интересно, каким оно будет?