Alibaba кинула виклик DeepSeek, випустивши нову модель ШІ

12 години назад

105 1 хвилина прочитана

Китайська технологічна компанія Alibaba випустила нову версію своєї моделі штучного інтелекту Qwen 2.5-Max, яка, за її заявою, перевершує розробку DeepSeek-V3.

Цікаво, що реліз відбувся у перший день святкування Китайського Нового року, коли більшість жителів країни відпочивають. Це може свідчити про тиск, який спричинив стрімкий успіх DeepSeek за останні три тижні, змушуючи Alibaba та інших китайських розробників пришвидшувати оновлення своїх моделей.

Qwen 2.5-Max від Alibaba – що відомо

За даними хмарного підрозділу Alibaba, модель Qwen 2.5-Max “майже за всіма показниками” перевершує GPT-4o, DeepSeek-V3 та Llama-3.1-405B – найсучасніші моделі від OpenAI та Meta.

Останнім часом китайський стартап DeepSeek викликав ажіотаж у світі технологій. Його модель DeepSeek-V3, представлена 10 січня, а також випущена 20 січня R1, сколихнули ринок і викликали занепокоєння у Кремнієвій долині. Інвестори почали сумніватися у необхідності багатомільярдних вкладень у розробку штучного інтелекту, оскільки DeepSeek пропонує значно дешевші рішення.

На тлі успіху DeepSeek конкуренти намагаються покращити власні моделі. ByteDance, власник TikTok, всього через два дні після запуску DeepSeek-R1 випустила оновлення до своєї флагманської моделі штучного інтелекту. За словами компанії, її модель перевершила OpenAI o1 у тесті AIME, який оцінює здатність ШІ виконувати складні завдання.

Вплив DeepSeek на сегмент ШІ в Китаї

Раніше, у травні 2023 року, DeepSeek випустила DeepSeek-V2, що стало причиною цінової війни у Китаї. Завдяки відкритому коду та безпрецедентно низькій вартості – лише 1 юань ($0,14) за 1 млн токенів – інші китайські компанії, включаючи Alibaba, Baidu та Tencent, були змушені значно знизити ціни на свої моделі.

Засновник DeepSeek Лян Веньфен у рідкісному інтерв’ю китайському медіа Waves у липні заявив, що компанія не переймається ціновими війнами, оскільки її основна мета – досягнення AGI (штучного загального інтелекту). На відміну від технологічних гігантів із їхніми складними управлінськими структурами, DeepSeek працює як дослідницька лабораторія з невеликою командою молодих випускників та докторантів.

Хочете отримувати цікаві новини найпершими? Підписуйтесь на наш Telegram

Лян також зазначив, що великі корпорації можуть бути не найкращими гравцями у майбутньому розвитку штучного інтелекту, адже їхні витрати високі, а інновації мають обмеження.

Джерело ФАКТИ. ICTV
2025-01-30 08:53:00