Витрати DeepSeek на ШІ значно більші за заявлені $5,5 млн: аналітики називають зовсім іншу цифру, яка перевищує $1 млрд


Нещодавно китайська компанія DeepSeek кинула багатомільярдну індустрію штучного інтелекту в хаос, випустивши свою модель R1 вартістю лише за $5,576 млн. Однак аналітична компанія SemiAnalysis підрахувала, що справжні витрати DeepSeek сягнули далеко за $1 млрд.

Заява про те, що DeepSeek змогла навчити R1, використовуючи лише частину ресурсів, необхідних великим технологічним компаніям, які інвестують у , за один день знизила ціну акцій на рекордні  $600 млрд. Якщо китайський стартап зміг створити настільки потужну модель, не витрачаючи мільярди на найпотужні графічні процесори, то що завадить зробити це всім іншим?

Але чи дійсно DeepSeek створила свою модель, яка досі очолює чарти , за таку низьку ціну? Аналітична компанія SemiAnalysis стверджує, що ні.

Згідно з її аналізом, DeepSeek має доступ до близько 50 000 графічних процесорів Hopper, включаючи 10 000 H800 і 10 000 H100. У неї також є замовлення на багато інших H20, призначених для Китаю. Графічні процесори розподілені між High-Flyer, хедж-фондом, що стоїть за DeepSeek, і стартапом. Вони розподілені по декількох географічних точках і використовуються для торгівлі, висновків, навчання та досліджень, пише TechSpot.

SemiAnalysis пише, що DeepSeek інвестувала набагато більше, ніж заявлені $5,5 млн. Це витрати на попереднє навчання ШІ, які складають лише частину від загальної суми. Загальні інвестиції компанії в сервери становлять близько $1,6 млрд, із яких близько $944 млн витрачено на операційні витрати. Інвестиції в графічні процесори, тим часом становлять понад $500 млн.

Зазначається, що DeepSeek залучає всі свої таланти виключно з Китаю. Це контрастує з повідомленнями про те, що інші китайські технологічні компанії, такі як , намагаються переманити працівників з-за кордону, причому тайванські працівники TSMC є найбільш потрібними цілями. DeepSeek нібито пропонує зарплату понад $1,3 млн перспективним кандидатам, що набагато більше, ніж платять конкурентні китайські компанії, що займаються розробкою штучного інтелекту.

DeepSeek також має перевагу в тому, що здебільшого використовує власні дата-центри, а не покладається на зовнішніх хмарних провайдерів. Це дозволяє більше експериментувати та впроваджувати інновації в стек продуктів ШІ. SemiAnalysis пише, що це найкраща лабораторія у цій «відкритій ваговій категорії» на сьогодні, випередивши Llama від , Mistral та інші.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *