Зокрема, оновлена версія Qwen 2.5 Max у різних тестах показала кращі результати, ніж Llama від Meta Platforms Inc. і модель V3 від іншої китайської компанії DeepSeek, повідомляє Bloomberg.
Разом із Tencent Holdings Ltd. і Baidu Inc. Alibaba вклала значні ресурси у свій сегмент хмарних сервісів і бере участь у наборі китайських розробників ШІ для використання своїх інструментів.
Як відзначає Reuters, Alibaba вибрала цікавий час для свого гучного релізу — перший день Нового року за місячним календарем, коли більшість китайців не працюють, а відпочивають із сім’ями. Це вказує на те, що тиск, який спричинило стрімке зростання китайського ШІ-стартапу DeepSeek, впливає не лише на західних конкурентів, але й на внутрішню конкуренцію.
Лише 10 січня DeepSeek випустила ШІ-асистента на базі моделі DeepSeek-V3, а вже за 10 представила модель R1, яка шокувала Кремнієву долину своєю нібито низькою вартістю навчання та призвели до падіння акцій технологічних компаній. Це змусило інвесторів поставити під сумнів величезні плани витрат провідних ШІ-компаній в США.
Успіх DeepSeek також призвів до того, що його китайські конкуренти також поспішають вдосконалити власні моделі штучного інтелекту.
Через два дні після виходу DeepSeek-R1 власник TikTok, компанія ByteDance, випустила оновлення своєї флагманської моделі ШІ, яка, як вона стверджує, перевершила o1 від OpenAI, що підтримується Microsoft, в AIME — еталонному тесті, який вимірює, наскільки добре моделі ШІ розуміють і реагують на складні інструкції.
У той час як великі китайські технологічні компанії, такі як Alibaba, мають сотні тисяч співробітників, DeepSeek працює як дослідницька лабораторія, укомплектована переважно молодими випускниками та докторантами провідних китайських університетів.
У липні загадковий засновник DeepSeek Лян Венфенг сказав, що, на його думку, найбільші технологічні компанії Китаю не дуже добре підходять для майбутнього індустрії ШІ, через їхні високі витрати й вертикальні структури управління. Натомість робота DeepSeek базується на ощадливості й вільному стилю управління. «Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі», — сказав він.
Нагадаємо, що компанія OpenAI заявила, що китайські компанії «постійно» намагаються використати американських конкурентів, щоб удосконалити свої моделі ШІ. Раніше очільник OpenAI Сем Альтман прокоментував хайп довкола моделей штучного інтелекту від китайської DeepSeek. Він назвав їх «дивовижними», але впевнений, що його компанія, може зробити кращі.