Интресное и непознанное

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле

Published

27.12.2024

Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие.

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле

DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta✴ Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов.

Модель была обучена на наборе данных в 14,8 трлн проектов; будучи развёрнутой на платформе Hugging Face, DeepSeek V3 показала размер в 685 млрд параметров — примерно в 1,6 раза больше, чем Llama 3.1 405B, у которой, как можно догадаться, 405 млрд параметров. Как правило, число параметров, то есть внутренних переменных, которые используются моделями для прогнозирования ответов и принятия решений, коррелирует с навыками моделей: чем больше параметров, тем она способнее. Но для запуска таких систем ИИ требуется больше вычислительных ресурсов.

DeepSeek V3 была обучена за два месяца в центре обработки данных на ускорителях Nvidia H800 — сейчас их поставки в Китай запрещены американскими санкциями. Стоимость обучения модели, утверждает разработчик, составила $5,5 млн, что значительно ниже расходов OpenAI на те же цели. При этом DeepSeek V3 политически выверена — она отказывается отвечать на вопросы, которые официальный Пекин считает щекотливыми.

В ноябре тот же разработчик представил модель DeepSeek-R1 — аналог «рассуждающей» OpenAI o1. Одним из инвесторов DeepSeek является китайский хедж-фонд High-Flyer Capital Management, который принимает решения с использованием ИИ. В его распоряжении есть несколько собственных кластеров для обучения моделей. Один из последних, по некоторым сведениям, содержит 10 000 ускорителей Nvidia A100, а его стоимость составила 1 млрд юаней ($138 млн). High-Flyer стремится помочь DeepSeek в разработке «сверхразумного» ИИ, который превзойдёт человека.

In this article:

Авто-мото

В России подешевели некоторые импортные иномарки — «Автоновости»

В текущем месяце автомобильные дилеры пересмотрели стоимость новых легковых автомобилей, ввезенных в нашу страну путем параллельного импорта. Фото: «CAR.RU» Пересмотр стоимости новых иностранных автомобилей...

radiovostok08.07.2024

В Свердловской области автомобилист сбил 11-летнего мальчика на велосипеде — «ГИБДД»

Авто-мото

В Свердловской области автомобилист сбил 11-летнего мальчика на велосипеде — «ГИБДД»

В ГАИ по Свердловской области рассказали о наезде автомобилиста на 11-летнего ребёнка на велосипеде. Об этом сообщает URA.RU со ссылкой на пресс-службу ведомства. «Водитель...

radiovostok08.07.2024

Названы все новинки, вышедшие на российский авторынок в июне — «Автоновости»

Авто-мото

Названы все новинки, вышедшие на российский авторынок в июне — «Автоновости»

По итогам прошедшего месяца, на российском автомобильном рынке появилось более десяти новых моделей легковых автомобилей. Главным событием прошедшего месяца стало то, что отечественный автомобильный...

radiovostok08.07.2024

Toshiba представила новые аккумуляторы для электрических автобусов — «Автоновости»

Авто-мото

Toshiba представила новые аккумуляторы для электрических автобусов — «Автоновости»

Корпорация Toshiba в сотрудничестве с японским брендом Sojitz и ведущим мировым производителем ниобия, фирмой CBMM, представила в Бразилии электрический автобус-прототип с установленным аккумулятором Toshiba...

radiovostok08.07.2024

RADIOVOSTOK

Интресное и непознанное

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле

В тренде

Авто-мото

В России подешевели некоторые импортные иномарки — «Автоновости»

Авто-мото

В Свердловской области автомобилист сбил 11-летнего мальчика на велосипеде — «ГИБДД»

Авто-мото

Названы все новинки, вышедшие на российский авторынок в июне — «Автоновости»

Авто-мото

Toshiba представила новые аккумуляторы для электрических автобусов — «Автоновости»

Интресное и непознанное

Топ-10 лучших мест для рыбалки на Волге, где вы найдете истинное удовольствие от ловли

You May Also Like

Авто-мото

В России подешевели некоторые импортные иномарки — «Автоновости»

Авто-мото

В Свердловской области автомобилист сбил 11-летнего мальчика на велосипеде — «ГИБДД»

Авто-мото

Названы все новинки, вышедшие на российский авторынок в июне — «Автоновости»

Авто-мото

Toshiba представила новые аккумуляторы для электрических автобусов — «Автоновости»