Tencent выложила открытую модель — Hunyuan-A13B-Instruct на Hugging Face

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Особенности:

• 13 млрд параметров

• Поддержка длинного контекста — до 32,000 токенов

• Заточена на диалоги, код и reasoning

• Использует архитектуру SwiGLU, Multi-Query Attention, RoPE и другие современные оптимизации

Хорошие показатели на бенчмарках:

CMATH, GSM8k, MATH — >91 балла

MBPP (код): 83.86 — топ-1

EvalPlus (code reasoning): 78.64 — топ-2

Модель слаба на:

SuperGPQA: 41.32

GPQA: 49.12

MultiPL-E: 69.33

Модель Hunyuan-A13B-Instruct:

Конкурирует с Qwen3-A22B и DeepSeek R1 в большинстве задач

Особенно сильна в reasoning, математике, кодировании и агентных задачах

Слаба в General QA (GPQA, SuperGPQA)

По ряду метрик лучше моделей большего размера (Qwen2.5-72B)

Лицензия: Hunyuan Community License Agreement

Модель доступна на Hugging Face: https://huggingface.co/tencent/Hunyuan-A13B-Instruct


Источник: huggingface.co

Комментарии: