Оператор заснований на новій моделі, яку розробники називають «агентом, що використовує комп’ютер» (CUA).
CUA поєднує в собі можливості зору GPT-4o з просунутими міркуваннями завдяки навчанню з підкріпленням. Він навчений керувати комп’ютером так само як це робить людина — дивиться на екран, користується мишею та клавіатурою.
Модель все ще має обмеження і буде продовжувати розвиватися на основі зворотного зв’язку. Незабаром ми плануємо додати CUA до API для розробників.
Operator is one of our first agents, which are AIs capable of doing work for you independently—you give it a task and it will execute it.
— OpenAI (@OpenAI) January 23, 2025
«Уперше наші моделі можуть виконувати дії в Інтернеті, тому ми провели багато внутрішніх тестувань і залучили зовнішніх експертів, щоб переконатися, що Оператор безпечний у використанні», — зазначили в OpenAI.
Operator «бачить» інтерфейси через скриншоти, натискає кнопки, вводить текст і може сам виправляти помилки. Якщо завдання складне, агент передає контроль користувачеві. Перед важливими діями, наприклад, введенням паролів, Operator завжди запитує підтвердження. Він також блокує шкідливі запити та заборонений контент.
Агент вже співпрацює з популярними сервісами, такими як DoorDash, Instacart, OpenTable та Uber. Він може замовляти їжу чи бронювати столики у ресторанах.
Operator вже доступний для Pro-користувачів у США за адресою за $200 на місяць.
Згодом він стане частиною ChatGPT і буде доступний ширшому колу користувачів, включаючи підписки Plus, Team та Enterprise, інтегрувавши агента в ChatGPT.
Нагадаємо, днями користувач ChatGPT помітив оновлення в коді клієнта чатбота, які вказують, що ШІ-агент Operator буде доступний в попередній дослідницькій версії для підписників рівня Pro. За чутками, Operator зможе виконувати низку завдань у браузері замість користувача.
Видання The Information повідомило, що OpenAI може запустити Operator вже цього тижня.
У листопаді минулого року стало відомо, що OpenAI готується запустити нового агента штучного інтелекту під кодовою назвою Operator уже на початку 2025 року. ШІ-агент OpenAI може використовувати комп’ютер для виконання дій від імені людини, наприклад, написати код або забронювати квитки.
Senior Engineering Manager та IT-блогер Діма Малєєв оцінив перспективи запуску компанією OpenAI Operator AI Agent.