Image generated with OpenAI

Думка: Чому AI-агенти – майбутнє повсякденного AI

Час читання: 6 хв.

Востаннє оновлено: Apr 29, 2025

Написано Andrea Miliani Експерт з технологічних новин
Переклад Команда з локалізації та перекладу Послуги локалізації та перекладу

2025 рік, здається, належить агентському штучному інтелекту. OpenAI, Microsoft, Anthropic та інші великі технологічні компанії випустили свої найбільш продвинуті моделі AI, здатні виконувати складні завдання, які були неможливі тільки минулого року. Але що таке AI-агенти і яка частина цієї технології є реальною, а яка лише рекламним гіпом?

Слідкувати за трендами штучного інтелекту в останні роки може бути виснажливим. Ми перейшли від базового AI до генеративного AI, потім до AI, здатного до розуміння, і зараз, AI-агенти домінують у дискусії. За останні кілька місяців кілька технологічних компаній представили нові AI-агенти та висвітлили, як робочі процеси, що їх об’єднують, стають все більш привабливими.

У січні, OpenAI запустила свого першого AI агента, Operator, здатного виконувати задачі автономно, такі як перегляд веб-сайтів, бронювання ресторану або забезпечення концертних квитків для вас, заснованих на ваших уподобаннях та критеріях.

Через два місяці, китайський AI стартап Zhipu випустив AutoGLM Rumination, безкоштовного AI агента, який може діяти незалежно та планувати подорожі для користувачів. І лише кілька днів тому, Microsoft представила “Computer Use” для Copilot Studio, додаючи більше автономних можливостей до AI агентів, включаючи можливість контролювати робочий стіл користувача.

Але цей тренд не лише про компанії, що запускають круті нові продукти – це про складне та еволюційне поле, яке поєднує різні форми ШІ з людською взаємодією. Технологічні ентузіасти та експерти подібно висловлюють сильний оптимізм щодо Agentic AI.

“Тренд, яким я також захоплююся, – це робочий процес агентів ШІ,” сказав експерт з ШІ та співзасновник Coursera та DeepLearning Ендрю Нг, на конференції Snowflake’s BUILD 2024 у листопаді. “Якби ви запитали, на яку найважливішу технологію ШІ варто звернути увагу? Я б сказала, що це Agentic AI.”

Отже, що таке агенти AI? Чи вони дійсно так ефективно виконують свої задачі, як це заявляють експерти? Ось короткий огляд найважливіших аспектів цієї нової технології та останніх розробок.

Що таке агенти AI?

Як показали такі компанії, як OpenAI та Microsoft, агенти AI – це технології, здатні виконувати складні завдання, самостійно комбінуючи різні додатки та програмне забезпечення.

В основному, це “традиційні” AI чат-боти, але більш продвинуті, здатні виконувати завдання, що виходять за рамки того, до чого ми звикли протягом останніх двох років. Вони включають в себе планування, перегляд веб-сторінок, запам’ятовування ваших інтересів, а навіть можуть робити покупки продуктів без поетапного керівництва, адже вони самі розбираються в речах.

Google Cloud визначає AI агентів як “системи програмного забезпечення, що використовують AI для досягнення цілей та виконання завдань від імені користувачів.”

Те, що робить ці AI моделі дійсно особливими, це їхні розширені можливості розуміння, які дозволяють їм обробляти кілька типів інформації – аудіо, текст, відео, код та зображення – одночасно. Вони можуть розуміти складні ситуації так, як би це робили люди, приймати рішення та взаємодіяти з програмним забезпеченням та платформами.

Багато технологічних компаній зараз активно розвивають свої AI моделі до цього нового рівня.

Лише кілька днів тому OpenAI оголосила, що його AI моделі o3 та o4-mini можуть “мислити” зображеннями та маніпулювати ними – наприклад, обрізаючи їх чи трансформуючи. Тим часом нова функція “Використання комп’ютера” від Microsoft дозволяє їхнім AI агентам розпізнавати графічні користувацькі інтерфейси.

“Якщо людина може використовувати додаток, агент теж може,” – сказав Чарльз Ламанна, корпоративний віце-президент по роботі з бізнесом та промисловістю у Microsoft, в оголошенні.

Наступний рівень: технологія AI агента

Хоча багато технологічних компаній розробляють надінтелектуальні AI чат-боти, агентський AI йде кроком далі. Ця технологія зосереджується на створенні систем, в яких кілька таких AI агентів можуть взаємодіяти та виконувати різні завдання, щоб надавати більш точні та повні результати.

Під час свого виступу на тему “Сила AI агентів” на недавньому заході Tech Talk, на якому я була присутня, організованому eDreams, експерт з AI Патрісія Гутьєррес Факсас пояснила, що ці системи можуть мати різні структури. Мультиагентні системи можуть розбивати складні завдання на простіші, призначати їх спеціалізованим агентам і формувати різні типи мереж.

AI-агент може взяти на себе роль “Супервайзера”, делегуючи менші завдання іншим спеціалізованим агентам, або декілька агентів можуть одночасно працювати над окремими завданнями та координувати свої дії, щоб надати кінцевий результат. До переваг цих систем входить підвищення точності, збільшення конфіденційності та зменшення помилок.

Ендрю Нг погоджується з цим підходом. Під час свого виступу на BUILD 2024 він наголосив на важливості робочих процесів Agentic AI для обробки складних завдань з набагато кращими результатами. Скок у продуктивності від моделей, як GPT-3.5 до GPT-4 — і їх сильніші результати на бенчмарках кодування — в більшій мірі є результатом робочих процесів Agentic та агентного мислення.

Як штучний інтелект вплине на наше життя?

Технологічні компанії використовують різні підходи до агентного штучного інтелекту. OpenAI зосереджується на ідеях для щоденного користувача. Під час запуску Operator, команда пояснила в відео, що людина просто може подумати про страву, яку хотіла би приготувати, попросити ChatGPT знайти найкращий рецепт, а навіть замовити необхідні інгредієнти в онлайн-супермаркеті.

AI-модель може задавати додаткові питання та зупинятися перед виконанням критичних завдань, наприклад, завершення покупки за допомогою кредитної картки користувача. Користувачі можуть встановлювати ліміти витрат або вимагати, щоб асистент попередньо запитував про підтвердження перед покупкою чогось.

Можливості використання AI-агентів звичайними людьми здаються безмежними, але найпопулярніші випадки використання на сьогодні включають функції туристичних агентів, персональних шоперів та адміністративних асистентів. Адже хто б не хотів мати персоналізовану технологію, яка відправляє електронні листи, пам’ятає важливі дні народження і займається податками?

Microsoft обрав більш корпоративний підхід. Компанія продемонструвала, як маркетингові агентства можуть використовувати AI-агентів для автоматизації збору ринкових даних та генерації аналізу, заснованого на цінних висновках, або як великі підприємства можуть використовувати їх для обробки рахунків-фактур в межах своїх систем.

Але, хоча всі ці сценарії використання звучать революційно, експерти згодні, що попереду ще довгий шлях. Більшість людей ще не можуть використовувати AI-агентів для поліпшення свого повсякденного життя, оскільки багато з цих функцій, таких як Operator, доступні лише для користувачів Pro, підписка на яку коштує $200 на місяць.

Отже, чи відповідає Agentic AI очікуванням?

Багато заголовків у медіа обіцяють нову революцію AI під проводом Agentic AI. Безумовно, у цій галузі є багато хайпу – і реальність, можливо, не за горами. Недавній звіт, опублікований IBM, показав, що багато розробників активно досліджують і розробляють цю технологію.

«IBM та Morning Consult провели опитування серед 1000 розробників, які створюють AI-додатки для підприємств, і 99% з них сказали, що вони досліджують або розробляють AI-агентів», – пояснила PhD Мар’ям Ашурі, директор з управління продуктами в IBM watsonx.ai. «Так що так, відповідь на питання – 2025 рік буде роком агента».

Однак, експерти зазначають, що існує багато трактувань того, що ж таке AI агенти насправді, та як вони повинні функціонувати. Внаслідок цього, прогрес та ефективність сучасних AI агентів часто залежать від погляду та стандартів людини, яка оцінює цю технологію.

Те, що точно відомо, це те, що багато експертів та приймаючих рішення глибоко вірять в цю технологію та інтенсивно інвестують у її розвиток. Нещодавнє дослідження показало, що 84% лідерів IT довіряють AI агентам так само, як і людям, та OpenAI очікує приблизно $125 мільярдів доходу до 2029 року.

Хоча технологія Agentic AI ще не повністю розроблена і її впровадження не настільки поширене, як чат-ботів, в більшій мірі через високу вартість, очевидно, що непереборний оптимізм та ентузіазм навколо цього тренду достатньо потужні, щоб викликати значні зміни в найближчі місяці.