Tencent выложила открытую модель — Hunyuan-A13B-Instruct на Hugging Face |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-06-28 11:41 Особенности: • 13 млрд параметров • Поддержка длинного контекста — до 32,000 токенов • Заточена на диалоги, код и reasoning • Использует архитектуру SwiGLU, Multi-Query Attention, RoPE и другие современные оптимизации Хорошие показатели на бенчмарках: CMATH, GSM8k, MATH — >91 балла MBPP (код): 83.86 — топ-1 EvalPlus (code reasoning): 78.64 — топ-2 Модель слаба на: SuperGPQA: 41.32 GPQA: 49.12 MultiPL-E: 69.33 Модель Hunyuan-A13B-Instruct: Конкурирует с Qwen3-A22B и DeepSeek R1 в большинстве задач Особенно сильна в reasoning, математике, кодировании и агентных задачах Слаба в General QA (GPQA, SuperGPQA) По ряду метрик лучше моделей большего размера (Qwen2.5-72B) Лицензия: Hunyuan Community License Agreement Модель доступна на Hugging Face: https://huggingface.co/tencent/Hunyuan-A13B-Instruct Источник: huggingface.co Комментарии: |
|