Нещодавно китайська компанія DeepSeek кинула багатомільярдну індустрію штучного інтелекту в хаос, випустивши свою модель R1 вартістю лише за $5,576 млн. Однак аналітична компанія SemiAnalysis підрахувала, що справжні витрати DeepSeek сягнули далеко за $1 млрд.
Заява про те, що DeepSeek змогла навчити R1, використовуючи лише частину ресурсів, необхідних великим технологічним компаніям, які інвестують у ШІ, за один день знизила ціну акцій Nvidia на рекордні $600 млрд. Якщо китайський стартап зміг створити настільки потужну модель, не витрачаючи мільярди на найпотужніші графічні процесори, то що завадить зробити це всім іншим?
Але чи дійсно DeepSeek створила свою модель, яка досі очолює чарти Apple App Store, за таку низьку ціну? Аналітична компанія SemiAnalysis стверджує, що ні.
Згідно з її аналізом, DeepSeek має доступ до близько 50 000 графічних процесорів Hopper, включаючи 10 000 H800 і 10 000 H100. У неї також є замовлення на багато інших H20, призначених для Китаю. Графічні процесори розподілені між High-Flyer, хедж-фондом, що стоїть за DeepSeek, і стартапом. Вони розподілені по декількох географічних точках і використовуються для торгівлі, висновків, навчання та досліджень, пише TechSpot.
SemiAnalysis пише, що DeepSeek інвестувала набагато більше, ніж заявлені $5,5 млн. Це витрати на попереднє навчання ШІ, які складають лише частину від загальної суми. Загальні інвестиції компанії в сервери становлять близько $1,6 млрд, із яких близько $944 млн витрачено на операційні витрати. Інвестиції в графічні процесори, тим часом становлять понад $500 млн.
Зазначається, що DeepSeek залучає всі свої таланти виключно з Китаю. Це контрастує з повідомленнями про те, що інші китайські технологічні компанії, такі як Huawei, намагаються переманити працівників з-за кордону, причому тайванські працівники TSMC є найбільш потрібними цілями. DeepSeek нібито пропонує зарплату понад $1,3 млн перспективним кандидатам, що набагато більше, ніж платять конкурентні китайські компанії, що займаються розробкою штучного інтелекту.
DeepSeek також має перевагу в тому, що здебільшого використовує власні дата-центри, а не покладається на зовнішніх хмарних провайдерів. Це дозволяє більше експериментувати та впроваджувати інновації в стек продуктів ШІ. SemiAnalysis пише, що це найкраща лабораторія у цій «відкритій ваговій категорії» на сьогодні, випередивши Llama від Meta, Mistral та інші.