Китайська Alibaba випустила нову модель ШІ, яка нібито перевершує V3 від DeepSeek та Llama від Meta


Alibaba Group опублікувала результати тестів моделі Qwen 2.5 Max і заявила, що вона демонструє провідні світові показники.

Зокрема, оновлена версія Qwen 2.5 Max у різних тестах показала кращі результати, ніж Llama від Platforms Inc. і модель V3 від іншої китайської компанії DeepSeek, повідомляє Bloomberg.

Разом із Tencent Holdings Ltd. і Baidu Inc. Alibaba вклала значні ресурси у свій сегмент хмарних сервісів і бере участь у наборі китайських розробників ШІ для використання своїх інструментів.

Як відзначає Reuters, Alibaba вибрала цікавий час для свого гучного релізу — перший день Нового року за місячним календарем, коли більсть китайців не працюють, а відпочивають із сім’ями. Це вказує на те, що тиск, який спричинило стрімке зростання китайського ШІ-стартапу DeepSeek, впливає не лише на західних конкурентів, але й на внутрішню конкуренцію.

Лише 10 січня DeepSeek випустила ШІ-асистента на базі моделі DeepSeek-V3, а вже за 10 представила модель R1, яка шокувала Кремнієву долину своєю нібито низькою вартістю навчання та призвели до падіння акцій технологічних компаній. Це змусило інвесторів поставити під сумнів величезні плани витрат провідних ШІ-компаній в США.

Успіх DeepSeek також призвів до того, що його китайські конкуренти також поспішають вдосконалити власні моделі штучного інтелекту.
Через два дні після виходу DeepSeek-R1 власник TikTok, компанія ByteDance, випустила оновлення своєї флагманської моделі ШІ, яка, як вона стверджує, перевершила o1 від , що підтримується , в AIME — еталонному тесті, який вимірює, наскільки добре моделі ШІ розуміють і реагують на складні інструкції.

У той час як великі китайські технологічні компанії, такі як Alibaba, мають сотні тисяч співробітників, DeepSeek працює як дослідницька лабораторія, укомплектована переважно молодими випускниками та докторантами провідних китайських університетів.

У липні загадковий засновник DeepSeek Лян Венфенг сказав, що, на його думку, найбільші технологічні компанії Китаю не дуже добре підходять для майбутнього індустрії ШІ, через їхні високі витрати й вертикальні структури управління. Натомість робота DeepSeek базується на ощадливості й вільному стилю управління. «Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі», — сказав він.

Нагадаємо, що компанія OpenAI заявила, що китайські компанії «постійно» намагаються використати американських конкурентів, щоб удосконалити свої моделі ШІ. Раніше очільник OpenAI Сем Альтман прокоментував хайп довкола моделей штучного інтелекту від китайської DeepSeek. Він назвав їх «дивовижними», але впевнений, що його компанія, може зробити кращі.

Хайп довкола китайських ШІ

DeepSeek, китайська лабораторія штучного інтелекту, що фінансується в основному компанією High-Flyer Capital Management, нещодавно стала популярною після того, як її чатбот піднявся на вершину чартів .

Мовні моделі DeepSeek, які були навчені за допомогою ефективних обчислювальних методів, змусили багатьох аналітиків і технологів на Заході замислитися над тим, чи зможуть США утримати лідерство в перегонах ШІ й чи збережеться попит на ШІ-чіпи.

Це хвилювання спровокувало падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів , а Марк Цукерберг поспішив із заявою, що Meta планує вкласти $60 млрд у 2025 році в розвиток ШІ.

Хайп довкола DeepSeek став таким великим, що навіть співзасновник  Олег Гороховський та очільник Мінцифри Михайло Федоров написали, загадкові лаконічні пости про стартап. Останній згодом опублікував розгорнутіший допис в .

dev.ua зробив детальний розбір того, як DeepSeek вдалося перевершити конкурентів.

DeepSeek також випустила новий набір мультимодальних моделей штучного інтелекту. У китайській компанії стверджують, що вони можуть перевершити генератор зображень DALL-E 3 від OpenAI.

ChatGPT знижує вартість користування Plus-версією на тлі популярності китайського DeepSeek.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *