Що DeepSeek може навчити нас щодо витрат та ефективності ШІ


З його милим логотипом кита, нещодавній випуск DeepSeek міг скласти не що інше, як ще один Strockoff. Що зробило його таким новинним – і те, що направило акції конкурентів у хвостик – – це те, як мало коштувало створити. Він фактично кинув гайковий ключ у поняття США про інвестицію, необхідну для підготовки високофункціональної моделі великої мови (LLM).

DeepSeek нібито витратив лише 6 мільйонів доларів на навчання моделі AI. Утримуючи, що з повідомленнями про 80 ​​до 100 мільйонів доларів, які витратив на чат GPT-4 або 1 мільярд доларів, які вони відняли для GPT-5. DeepSeek ставить під сумнів цей рівень інвестицій і залишає великих гравців, таких як -вартість акцій за один день занурила 600 мільярдів доларів-TSMC та про довгострокову фінансову життєздатність AI. Якщо можна навчити моделі AI значно менше, ніж передбачалося раніше, що це сприяє витратам AI в цілому?

Хоча зрив DeepSeek призвело до важливих дискусій, деякі ключові моменти, здається, втрачаються в переміщеннях. Однак те, що новини проводять, є більшою увагою до того, наскільки інноваційні витрати та можливий економічний вплив . Ось три важливі відомості, що виникають із цієї новини:

1. Ціна на 6 мільйонів доларів Deepseek вводить в оману

Компанії повинні зрозуміти загальну вартість власності своєї інфраструктури (TCO). Хоча ціна Deepseek на 6 мільйонів доларів була викинута багато, це, мабуть, вартість лише його попереднього тренування, а не вся його інвестиція. Загальна вартість – не тільки бігу, але і на будівництво та навчання DeepSeek – ймовірно, набагато вища. Фірма промисловості Напівзавантаження виявив, що компанія, що стоїть за Deepseek, витратила на апаратне забезпечення 1,6 мільярда доларів, щоб зробити свою реальність LLM. Отже, ймовірна вартість десь посередині.

Якою б не була справжня вартість, поява DeepSeek створила фокус на економічно ефективних інноваціях, які можуть бути трансформаційними. Інновації часто стимулюються обмеженнями, а успіх DeepSeek підкреслює те, як інновації можуть відбуватися, коли інженерні команди оптимізують свої ресурси в умовах обмежень у реальному світі.

2. Висновок – це те, що робить AI цінним, а не тренуванням

Важливо звернути увагу на те, скільки витрат на навчання моделі AI, але навчання являє собою невелику частину загальної вартості будівництва та запуску моделі ШІ. Висновок – Колекторний шлях AI змінює те, як люди працюють, взаємодіють і живуть – там, де AI стає справді цінним.

Це виводить парадокс Jevons, економічну теорію, що дозволяє припустити, що як технологічний прогрес робить використання ресурсу більш ефективним, загальне споживання цього ресурсу може фактично збільшуватися. Іншими словами, в міру зменшення витрат на навчання зростатимуть висновок та споживання агента, а загальні витрати підуть за цим.

Ефективність AI може насправді призвести до зростання витрат AI, які повинні підняти всі човни, а не лише китайці. Якщо припустити, що вони їздять на хвилі ефективності, такі компанії, як OpenAI та NVIDIA, також отримають користь.

3. Що залишається правдою, це те, що економіка одиниці найбільше має значення

Зробити AI більш ефективним – це не лише зниження витрат; Йдеться також про оптимізацію економіки одиниці. Мотлі дурня прогнозує, що цього року буде Рік ефективності ШІ. Якщо вони мають рацію, компанії повинні звернути увагу на зниження витрат на навчання AI, а також витрати на споживання AI.

Організації, які будують або використовують ШІ, повинні знати свою економіку підрозділу, а не виділяти вражаючі цифри, такі як вартість навчання Deepseek на 6 мільйонів доларів. Реальна ефективність тягне за собою розподіл усіх витрат, відстеження попиту, керованого AI, та дотримання постійних вкладок на вартість вартості.

Економіка хмарних одиниць (CUE) пов’язана з вимірюванням та максимізацією прибутку, керованим хмарою. Cue порівнює ва хмарні витрати з показниками доходу та попиту, розкриваючи, наскільки ефективні ваші хмарні витрати, як це змінилося з часом, і (якщо у вас є правильна платформа) найкращі способи підвищити цю ефективність.

Розуміння киї має ще більшу корисність у контексті AI, враховуючи, що вживати вживати дорожче, ніж традиційні хмарні послуги, що продаються гіперсалерами. Компанії, які будують агентські програми, можуть обчислити свої витрати за транзакцію (наприклад, витрати за рахунок, вартість за доставку, вартість за торгівлю тощо) та використовувати це для оцінки рентабельності інвестицій конкретних послуг, продуктів та функцій, керованих AI. Зі збільшенням витрат AI, компанії будуть змушені це робити; Жодна компанія не може назавжди кидати нескінченні долари на експериментальні інновації. Врешті -решт, це має мати діловий сенс.

До більшої ефективності

Однак змістовна цифра в розмірі 6 мільйонів доларів, DeepSeek, можливо, забезпечила переломний момент, який прокидає технологічну галузь до неминучої важливості ефективності. Будемо сподіватися, що це відкриє шлюзи для економічно вигідних підготовки, висновку та агентських додатків, які розблокують справжній потенціал та рентабельність ШІ.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *