Китайська Alibaba Qwen випустила конкурента ШІ-агента Operator від OpenAI, який може керувати ПК і телефоном


-підрозділ Qwen китайської компанії Alibaba, який є головним внутрішнім конкурентом DeepSeek, випустив нове сімейство моделей штучного інтелекту Qwen2.5-VL. Ці моделі можуть аналізувати файли, розуміти відео, рахувати об’єкти на зображеннях, а також керувати комп’ютером — подібно до ШІ-агента Operator від  . Звісно, ШІ має певні обмеження щодо тем, які йому дозволено обговорювати.

За результатами порівняльного аналізу, проведеного командою Qwen, найкраща модель Qwen2.5-VL перевершує GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic і Gemini 2.0 Flash від за різними показниками розуміння відео, математики, аналізу документів і оцінювання відповідей на запитання, пише TechCrunch.

Джерело: TechCrunch

Qwen2.5-VL доступний для тестування в програмі Alibaba Qwen Chat і для завантаження з платформи розробників штучного інтелекту Hugging Face. Може аналізувати діаграми та графіки, витягувати дані зі сканованих рахунків-фактур і форм, а також «осягати» багатогодинне відео, каже команда Qwen. Також може розпізнавати «IP-адреси з фільмів і серіалів, а також широкий спектр продуктів», за словами команди, що свідчить про те, що моделі могли частково навчатися на роботах, захищених рським правом.

Qwen2.5-VL, як будь-який китайський ШІ, має певні обмеження щодо тем, які він може обговорюватиме. Коли журналіст TechCrunch попросив найбільшу та найпотужнішу модель із сімейства, Qwen2.5-VL-72B, розповісти про «помилки Сі Цзіньпіна», Qwen Chat видав повідомлення про помилку.

Однією з найцікавіших особливостей Qwen2.5-VL є його здатність взаємодіяти з програмним забезпеченням — як на ПК, так і на мобільних пристроях. Відео, опубліковане на X Філіпом Шмідом, технічним керівником Hugging Face, показало, як Qwen2.5-VL запускає додаток Booking.com для і бронює рейс з Чунціна до Пекіна.

На відео нижче модель Qwen2.5-VL керує програмами на робочому столі Linux, але, схоже, не робить нічого, окрім перемикання вкладок. Можливо, показовим є те, що за результатами бенчмаркінгу Qwen, Qwen2.5-VL отримала низькі бали в OSWorld, тесті, який намагається імітувати реальне комп’ютерне середовище.

Дві менш складні моделі серії Qwen2.5-VL, Qwen2.5-VL-3B і Qwen2.5-VL-7B, доступні за дозвільною ліцензією. Флагманська модель Qwen2.5-VL-72B, має спеціальну ліцензію Alibaba, яка вимагає, щоб компанії та розробники з більш ніж 100 млн активних користувачів щомісяця запитували дозвіл у Qwen/Alibaba, перш ніж розгортати модель на комерційній основі.

Нагадаємо, що китайська лабораторія ШІ DeepSeek привернула до себе купи уваги після того, як її чатбот піднявся на вершину чартів . Це хвилювання спровокувало падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів , а Марк Цукерберг поспішив із заявою, що  планує вкласти $60 млрд у 2025 році в розвиток ШІ.

Станом на вечір понеділка акції технологічних компаній втратили приблизно $1 трлн після прогресу китайського ШІ-стартапу DeepSeek.

Раніше dev.ua зробив детальний розбір того, як DeepSeek вдалося перевершити конкурентів.





Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *