Connect with us

Hi, what are you looking for?

Интресное и непознанное

AMD выпустила свою первую малую языковую модель ИИ — AMD-135M

AMD выпустила свою первую малую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

AMD выпустила свою первую малую языковую модель ИИ — AMD-135M

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

You May Also Like

Авто-мото

В настоящее время самыми продаваемыми моделями легковых автомобилей на российском рынке являются кроссоверы. На российском вторичном рынке представлено большое количество моделей легковых автомобилей, которые...

Интресное и непознанное

C приходом интернета символ @, так называемая «собачка», стал известен всем. Он есть на каждом компьютере и смартфоне. Самое распространённое применение этому знаку появляется...

Интресное и непознанное

Сегодня я хочу поделиться с вами топ-10 самых популярных и интересных мест для рыбалки на великолепной реке Волге. Итак, хватайте рыболовные снасти и давайте...

Авто-мото

Корпорация Toshiba в сотрудничестве с японским брендом Sojitz и ведущим мировым производителем ниобия, фирмой CBMM, представила в Бразилии электрический автобус-прототип с установленным аккумулятором Toshiba...