ШІ-модель Nvidia перевершила в тестах топові моделі OpenAI та Anthropic


Модель Llama-3.1-Nemotron-70B-Instruct від Nvidia з’явилася на популярній ШІ-платформі Hugging Face без зайвого галасу, але швидко привернула увагу своїми результатами в бенчмарках, які обійшли показники GPT-4o (OpenAI) та Claude 3.5 Sonnet (Anthropic).

Nvidia вказує, що їхня нова модель досягає найвищих балів у ключових оцінках, включаючи 85.0 у бенчмарку Arena Hard, 57.6 в AlpacaEval 2 LC та 8.98 у GPT-4-Turbo MT-Bench. Про це пише VentureBeat.

Ці результати перевершують показники таких відомих моделей, як GPT-4o від OpenAI та Claude 3.5 Sonnet від Anthropic, що виводить Nvidia на передові позиції в створенні великих мовних моделей ШІ.

Підхід Nvidia до створення Llama-3.1-Nemotron-70B-Instruct полягав у вдосконаленні моделі Llama 3.1 з відкритим вихідним кодом від Meta з використанням передових методів навчання, включаючи навчання з підкріпленням на основі зворотного зв’язку з людиною (RLHF). Цей метод дозволяє ШІ вчитися на людських уподобаннях, що потенційно призводить до більш природних і контекстуально відповідних відповідей.

Завдяки своїй продуктивності модель може запропонувати бізнесу більш ефективну та економічно вигідну альтернативу деяким із найсучасніших моделей на ринку. Здатність моделі обробляти складні запити без додаткових підказок або спеціалізованих токенів вигідно відрізняє її від інших. Для підприємств це означає меншу кількість помилок, більш корисні відповіді й, зрештою, кращу задоволеність клієнтів.

Як нова модель Nvidia може змінити бізнес і дослідження
Для підприємств та організацій, які досліджують рішення зі штучного інтелекту, модель Nvidia пропонує новий привабливий варіант. Компанія пропонує безплатний хостинг висновків через свою платформу build.nvidia.com, доповнену інтерфейсом API, сумісним з OpenAI.

Проте, як і будь-яка система штучного інтелекту, Llama-3.1-Nemotron-70B-Instruct не застрахована від ризиків. Nvidia попереджає, що модель не була налаштована для спеціалізованих областей, таких як математика або юридична сфера, де точність має вирішальне значення. Підприємствам потрібно буде переконатися, що вони використовують модель належним чином і впроваджують засоби захисту для запобігання помилкам або зловживанням.

Хоча довгостроковий вплив Llama-3.1-Nemotron-70B-Instruct залишається невизначеним, її показники можуть вказувати на точку перелому в перегонах створення найсучасніших систем ШІ.

Nvidia змушує інших гравців переглянути свої стратегії та прискорити власні дослідження і розробки. Це відбувається після того, як компанія представила сімейство мультимодальних моделей NVLM 1.0, включаючи 72-мільярдну модель NVLM-D-72B.

Нещодавно CEO Nvidia Дженсен Хуанг висловив сподівання, що одного дня в його компанії працюватиме 50 000 співробітників і 100 млн асистентів зі штучним інтелектом.

У липні компанія Meta анонсувала Llama 3.1 405B, велику мовну модель, яка має конкурувати з найбільшими моделями від Anthropic, Google та OpenAI. Цей реліз є найбільшою текстовою мовною моделлю Meta.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *