В останні роки штучний інтелект (AI) став практичним інструментом для сприяння інноваціям у галузях. На передньому плані цього прогресу знаходяться великі мовні моделі (LLM), відомі своєю здатністю розуміти та генерувати людську мову. Хоча LLM добре виконують такі завдання, як розмовний ШІ та створення контенту, вони часто борються зі складними проблемами в реальному світі, що вимагають структурованих міркувань та планування.
Наприклад, якщо ви попросите LLMS спланувати багатосторонню ділову поїздку, яка передбачає координацію графіків польотів, терміни зустрічей, бюджетні обмеження та адекватний відпочинок, вони можуть надати пропозиції щодо окремих аспектів. Однак вони часто стикаються з проблемами при інтеграції цих аспектів, щоб ефективно збалансувати конкурентні пріоритети. Це обмеження стає ще більш очевидним, оскільки LLM все частіше використовуються для побудови агентів ШІ, здатних автономно вирішувати проблеми з реальним світом.
Google DeepMind нещодавно розробив рішення для вирішення цієї проблеми. Натхненний природним відбором, таким підходом, відомим як Еволюція розумууточнює стратегії вирішення проблем за допомогою ітеративної адаптації. Направляючи LLM в режимі реального часу, це дозволяє їм ефективно вирішувати складні завдання в реальному світі та адаптуватися до динамічних сценаріїв. У цій статті ми вивчимо, як працює цей інноваційний метод, його потенційні програми та що це означає для майбутнього вирішення проблем, орієнтованих на AI.
Чому LLM борються зі складними міркуваннями та плануванням
LLM навчаються прогнозувати наступне слово у реченні, аналізуючи шаблони у великих наборах даних тексту, таких як книги, статті та вміст в Інтернеті. Це дозволяє їм генерувати відповіді, які здаються логічними та контекстуально доцільними. Однак ця підготовка базується на розпізнаванні моделей, а не на розумінні сенсу. Як результат, LLM можуть створювати текст, який видається логічним, але боротися з завданнями, які потребують більш глибоких міркувань або структурованого планування.
Основне обмеження полягає в тому, як LLMS обробляє інформацію. Вони зосереджуються на ймовірностях або моделях, а не на логіці, а це означає, що вони можуть вирішити ізольовані завдання – як, наприклад, пропонувати варіанти польоту або рекомендації в готелі – але провалюватися, коли ці завдання потрібно інтегрувати в згуртований план. Це також ускладнює підтримку контексту з часом. Складні завдання часто вимагають відстеження попередніх рішень та адаптації, коли виникає нова інформація. Однак LLM, як правило, втрачають фокус у розширених взаємодій, що призводить до роздроблених або непослідовних результатів.
Як працює еволюція розуму
Еволюція розуму DeepMind вирішує ці недоліки шляхом прийняття принципів природної еволюції. Замість того, щоб створити єдину відповідь на складний запит, цей підхід генерує кілька потенційних рішень, ітеративно уточнює їх та вибирає найкращий результат за допомогою структурованого процесу оцінки. Наприклад, розгляньте ідеї мозкового штурму команди для проекту. Деякі ідеї чудові, інші – менше. Команда оцінює всі ідеї, зберігаючи найкращі та відкидаючи решту. Потім вони вдосконалюють найкращі ідеї, вводять нові варіанти та повторюють процес, поки не досягнуть найкращого рішення. Еволюція розуму застосовує цей принцип до LLMS.
Ось розбиття того, як це працює:
- Покоління: Процес починається з того, що LLM створює кілька відповідей на задану проблему. Наприклад, у завданнях планування подорожей модель може розробити різні маршрути на основі бюджету, часу та налаштувань користувачів.
- Оцінка: Кожне рішення оцінюється на фітнес -функції, міра того, наскільки добре він відповідає вимогам завдань. Низькоякісні відповіді відкидаються, тоді як найбільш перспективні кандидати просуваються до наступного етапу.
- Вдосконалення: Унікальною інновацією еволюції розуму є діалог між двома персонями в межах LLM: автором та критиком. Автор пропонує рішення, тоді як критик визначає недоліки та пропонує зворотній зв’язок. Цей структурований діалог відображає те, як люди вдосконалюють ідеї за допомогою критики та перегляду. Наприклад, якщо автор пропонує план подорожей, який включає відвідування ресторану, що перевищує бюджет, критик вказує на це. Потім автор переглядає план щодо вирішення проблем критика. Цей процес дозволяє LLM виконувати глибокий аналіз, який він не міг виконувати раніше, використовуючи інші методи підказки.
- Ітеративна оптимізація: Удосконалені рішення проходять подальшу оцінку та рекомбінацію для виготовлення вдосконалених рішень.
Повторюючи цей цикл, еволюція розуму ітераційно покращує якість рішень, що дозволяє LLM більш ефективно вирішувати складні проблеми.
Еволюція розуму в дії
Deepmind перевірив цей підхід орієнтири як Мандрівник і Природний план. Використовуючи цей підхід, Gemini Gemini досяг успіху в 95,2% на TravelPlanner, що є непогашеним поліпшенням від базової лінії 5,6%. З більш розвиненим Gemini Pro показник успішності збільшився майже до 99,9%. Ця трансформаційна ефективність показує ефективність еволюції розуму у вирішенні практичних викликів.
Цікаво, що ефективність моделі зростає зі складністю завдань. Наприклад, хоча однопрохідні методи боролися з багатоденними маршрутами, що включають багато міст, еволюція розуму послідовно перевищувала, підтримуючи високий рівень успішності, навіть у міру збільшення кількості обмежень.
Виклики та майбутні вказівки
Незважаючи на свій успіх, еволюція розуму не без обмежень. Підхід вимагає значних обчислювальних ресурсів через ітеративні процеси оцінювання та вдосконалення. Наприклад, вирішення завдання подорожей з еволюцією розуму споживало три мільйони жетонів та 167 дзвінків API – певно, більше, ніж звичайні методи. Однак підхід залишається більш ефективним, ніж стратегії грубої сили, такі як вичерпний пошук.
Крім того, проектування ефективних функцій фітнесу для певних завдань може бути складним завданням. Майбутні дослідження можуть зосередитись на оптимізації обчислювальної ефективності та розширенні застосовності техніки до більш широкого спектру проблем, таких як творче письмо або складне прийняття рішень.
Ще одна цікава сфера для розвідки-інтеграція оцінювачів, що стосуються домену. Наприклад, в медичній діагностиці включення експертних знань у фітнес -функцію може ще більше підвищити точність та надійність моделі.
Заявки поза плануванням
Хоча еволюція розуму в основному оцінюється за завданнями планування, вона може бути застосована до різних областей, включаючи творче письмо, наукове відкриття та навіть генерацію коду. Наприклад, дослідники представили орієнтир під назвою Stegpoet, який кидає виклик моделі кодувати приховані повідомлення в віршах. Хоча це завдання залишається важким, еволюція розуму перевищує традиційні методи, досягаючи рівня успішності до 79,2%.
Здатність адаптувати та розвивати рішення природною мовою відкриває нові можливості для вирішення проблем, які важко формалізувати, такі як вдосконалення робочих процесів або генерування інноваційних конструкцій продуктів. Використовуючи силу еволюційних алгоритмів, Evolution Mind забезпечує гнучку та масштабовану основу для підвищення можливостей вирішення проблем LLM.
Підсумок
Еволюція розуму DeepMind вводить практичний та ефективний спосіб подолання ключових обмежень у LLMS. Використовуючи ітеративне вдосконалення, натхнене природним вибором, це підвищує здатність цих моделей обробляти складні багатоетапні завдання, які потребують структурованих міркувань та планування. Цей підхід вже показав значний успіх у складних сценаріях, таких як планування подорожей та демонструє обіцянку в різних областях, включаючи творче письмо, наукові дослідження та генерацію коду. Незважаючи на те, що такі проблеми, як високі обчислювальні витрати та потреба у добре розроблених фітнес-функціях, залишаються, підхід забезпечує масштабовану основу для покращення можливостей ШІ. Mind Evolution створює підґрунтя для більш потужних систем AI, здатних міркувати та планувати вирішити проблеми в реальному світі.