Агенты ИИ: миссия по внедрению в бизнес выполнима
Искусственный интеллект начал свой трудовой путь с очень узкой специализации и много лет успешно решает отдельные задачи лучше человека: предсказывает выход оборудования из строя по показаниям датчиков, выявляет нарушения техники безопасности по изображениям с камер наблюдения, прогнозирует погоду или курс акций на основе больших данных, а также определяет, какие публикации в социальных сетях будут интересны аудитории. Как эффективно «нанять» нейросеть, рассказывает Андрей Беляев, руководитель направления консалтинга в области данных и аналитики «Рексофт».
По мере развития генеративных моделей машинного обучения (ИИ, способного создавать текст, изображения, видео) и с появлением больших языковых и мультимодальных моделей, таких как ChatGPT и GPT-4o, способных в т.ч. выполнять инструкции на естественном языке, возможности ИИ приблизились к человеческим, особенно в плане универсальности. Теперь одна и та же базовая модель может придумать сказку для ребенка и проанализировать бизнес-отчет. Однако такая «модель-оркестр» не всегда является оптимальным исполнителем для каждой из задач и может требовать больших вычислительных ресурсов.
Здесь на помощь приходит опыт человеческой деятельности: разделение задачи на подзадачи и поручение их профильным специалистам приводит к более эффективным решениям.
Использование агентов на базе больших языковых и мультимодальных моделей дополняет способности этих моделей крайне практичными умениями выполнять сложную задачу в несколько этапов, планировать, запоминать информацию, интегрироваться с внешними инструментами и данными, взаимодействовать с другими агентами и людьми.
Если ИИ-агента можно сравнить с отдельным сотрудником, то мультиагентные системы — это целая команда, где каждый отвечает за свою часть работы. Такие системы позволяют выполнять сложные задачи быстрее и качественнее. При этом отдельные ИИ-агенты могут:
базироваться на различных исходных моделях;
снабжаться специализированными инструкциями, что позволит ИИ сфокусироваться на нужных аспектах своей задачи, не отвлекаясь на остальные;
иметь собственную долгосрочную и краткосрочную память;
оснащаться специализированными инструментами, например, для выполнения вычислений, поиска в Интернете, обращения к корпоративным и внешним информационным системам;
подключаться к доменным и корпоративным базам знаний по теме их специализации (например, к справочникам с внешними и внутренними регуляциями);
при решении своей задачи ИИ-агенты способны коммуницировать друг с другом, с человеком, с внешними и внутренними информационными системами. Например, ИИ-агент, отвечающий за продажи, может обратиться к ИИ-агенту, анализирующему складские запасы, чтобы уточнить наличие товара и сроки доставки.
Теперь можно поручить решение конечной задачи не «универсальной модели-одиночке», а команде профессионалов, снабженных всеми необходимыми инструментами. Они разделят задачу на подзадачи, каждая из которых будет поручена оптимальному исполнителю.
На данном этапе развития генеративных моделей мы не всегда сможем полностью понять, какая «магия» происходит в «голове» у отдельного агента искусственного интеллекта, зато сможем отслеживать, как он использовал базовую модель, что хранил в памяти, какие инструменты и как использовал. Кроме того, мы сможем контролировать все коммуникации ИИ-экспертов и вмешиваться при необходимости.
Уже сегодня ИИ-помощники на основе больших языковых моделей выполняют часть функций различных подразделений/ролей в организациях, повышая продуктивность:
быстро отвечают на частые вопросы клиентов и решают типовые проблемы, улучшая качество обслуживания;
помогают в проведении аудитов, отслеживании расходов и составлении финансовой отчётности;
генерируют контент для блогов, email-рассылок и социальных сетей, а также анализируют отзывы потребителей и рыночные тренды;
консультируют новых сотрудников, облегчая процесс адаптации и разгружая HR-отдел;
помогают писать, проверять и оптимизировать код программ, тесты и документацию к ним.
Однако для решения более сложных и многоаспектных задач требуется подход, который объединяет специализированные возможности различных ИИ-агентов. Мультиагентные сценарии уже успешно применяются:
в разработке ПО: агенты могут имитировать различные роли в команде, такие как менеджер по продукту, аналитик, программист и тестировщик и позволяют быстро создать работающий прототип, не требуя кросс-функциональной команды разработки. На одном из наших проектов сейчас пилотируются ИИ-аналитик и ИИ-тестировщик, которые решают отдельные задачи в рамках своей специализации, помогая команде разработке.
в поддержке принятия решений: ИИ-агенты в разных ролях позволяют быстро проанализировать ситуацию/информацию с самых разных точек зрений, обратить внимание на неочевидные нюансы, риски и возможности. Так, например, в бизнес-процесс проверки и согласование договоров мы внедряем ИИ-ассистентов юриста и делопроизводителя, которые на разных этапах анализируют документ, проверяют его по заданным чек-листам, делают краткое резюме по ключевым пунктам документа и делятся с участниками бизнес-процесса своими комментариями и предложениями, повышая скорость разработки документа и его качество.
в социальных науках: агенты могут моделировать социальное поведение, изучать динамику социальных процессов и проверять теории социальных наук. Недавно несколько американских университетов и Google DeepMind поделились результатами своих экспериментов, когда более 1000 ИИ-агентов на базе больших языковых моделей, основываясь на двухчасовом разговоре реальных людей с ИИ-интервьюером, смогли предсказать ответы этих людей на опрос с точностью 85%. Теперь таких «цифровых двойников» можно использовать для проверки множества гипотез, не требуя участия самих людей, что существенно ускорит и удешевит будущие исследования.
Для успешного онбординга ИИ-агентов в организацию, также, как и для людей, необходимо:
оборудовать «рабочее место»: создать корпоративную экосистему решений на базе генеративного ИИ, где можно удобно и безопасно разрабатывать, тестировать и эксплуатировать различные ИИ-решения, включая ИИ-агентов, компоненты и инструменты для них, где ИИ-агенты смогут эффективно и безопасно взаимодействовать между собой, с организацией и внешней средой;
проинструктировать: предоставить инструкции и данные, которые потребуются ИИ-агенту для выполнения его функций;
предоставить необходимые доступы к различным корпоративным данным и информационным системам, чтобы ИИ-агенты могли учитывать контекст организации;
включить в рабочие процессы: внедрить ИИ-агентов в существующие бизнес-процессы или создать новые, учитывающие сильные стороны ИИ и его ограничения;
организовать эффективное взаимодействие: научить сотрудников эффективно взаимодействовать с ИИ-агентами, учитывать их ограничения и риски, например, возможность галлюцинаций (выдумывания фактов) в ответах, встроить ИИ-агентов в существующие информационные системы организации там, где это целесообразно;
контролировать: протоколировать работу и коммуникации всех ИИ-агентов, автоматически фиксировать значение метрик качества, анализировать обратную связь пользователей;
улучшать: минимизировать нежелательные аспекты, распространять лучшие практики, совершенствовать как сами ИИ-агенты, так и бизнес-процессы организации, а также корпоративную экосистему решений на базе генеративного ИИ.
Необходимо уже сейчас организовывать рабочие места для ИИ-агентов и создавать смешанные команды, которые будут сочетать людей и искусственный интеллект. Мультиагентный подход позволяет эффективно передавать рутинные задачи ИИ-системам, что ускоряет трансформацию организаций на основе генеративного ИИ и повышает их конкурентоспособность в условиях текущей научно-технической революции. Таким путем, например, идет и группа «Рексофт».