DeepSeek-R1 ИИ-модель

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: DeepSeek
Дата премьеры системы: 2023
Дата последнего релиза: 2025/01/20

Основные статьи:

2025: Версия «рассуждающей» ИИ-модели, по производительности превосходящая o1 от OpenAI

Китайская компания DeepSeek выпустила модель искусственного интеллекта DeepSeek-R1, которая, по утверждению разработчиков, демонстрирует производительность, сопоставимую с моделью o1 от OpenAI. При этом ее код открыт, а еще она работает в России без ограничений.

1 млн выходящих токенов (output tokens) в ИИ-модель DeepSeek стоят $2.19 долларов по сравнению с $60 у модели ChatGPT от OpenAI. Акции Nvidia рухнули. Михаил Белошапка, «Далее»: Тенденция укрупнения IT-рынка продолжится 4.8 т Трейдеры Nvidia с тройным кредитным плечом получили однодневный 52%-ный убыток.

Nvidia Corp заявила, что модель ИИ DeepSeek - это «превосходное достижение ИИ», которое соответствует требованиям контроля за экспортом технологий в США.

DeepSeek-R1 способна к самопроверке, рефлексии и генерации длинных цепочек рассуждений. Компания поделилась результатами модели в различных тестах, оценивающих способности ИИ, сообщил Hi-Tech Mail 20 января 2025 года со ссылкой на DeepSeek.

Оценка математических способностей DeepSeek-R1 проводилась на двух различных бенчмарках: MATH-500 и AIME 2024. В первом модель достигла показателя 97.3%, чуть больше, чем у o1 от OpenAI (96.4%). Во втором DeepSeek-R1 набрал 79.8%, а o1 — 79.2% В тесте на логическое мышление и общие знания (MMLU) DeepSeek-R1 показала результат 90.8%, что близко к показателю OpenAI-o1-1217 (91.8%).

Результаты ИИ-моделей в различных тестах.

Оценка DeepSeek-R1 в задачах, требующих навыков программирования, проводилась с использованием бенчмарков SWE-bench Verified, Codeforces и GPQA Diamond. В первом DeepSeek-R1 демонстрирует результат 49.2%. Этот показатель незначительно выше, чем у o1 (48.9%). На платформе Codeforces китайская модель достигла 96.3%, что чуть ниже результата o1 (96.6%). В тесте GPQA Diamond результат DeepSeek-R1 составил 71.5% а o1 — 75.7%. При этом R1 обошла o1-mini во всех бенчмарках.

R1 сопоставима по производительности с моделью OpenAI, но, в отличие от нее, является полностью открытой и доступна для свободного использования и коммерциализации по лицензии MIT. Оценить возможности DeepSeek-R1 можно бесплатно. Для разработчиков доступен исходный код на GitHub.

Нейросеть DeepSeek впервые появилась в 2023 году, и за два года ИИ-модель обновилась трижды. До R1 пользователям была доступна версия DeepSeek V3, которую называли «одной из самых мощных на рынке». В некоторых тестах DeepSeek V3 демонстрировала результаты выше, чем модели Llama 3.1 и OpenAI GPT-4o. В середине января 2025 года разработчики чат-бота выпустили официальное мобильное приложение для Android и iOS — его можно скачать и в России[1].

Примечания