Релиз Qwen 3 от Alibaba |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-04-29 13:13 В релиз вошли 2 MoE-модели и 6 Dense models (плотные модели), размером от 0.6B до 235B параметров. Флагманская модель Qwen3-235B-A22B демонстрирует конкурентные результаты в задачах Кодина, математики и общих способностей, уверенно соперничая с передовыми моделями, такими как DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro. Небольшая MoE-модель Qwen3-30B-A3B превосходит QwQ-32B, использую в 10 раз меньше параметров. Компактная модель Qwen3-4B сопоставима по производительности с Qwen2.5-72B-Instruct. Поддерживает гибридный режим мышления Режим размышления активируется при обработке сложных задач, обеспечивая пошаговый анализ запроса и формирование комплексных, глубоких ответов. Базовый режим используется для повседневных вопросов, позволяя выдавать быстрые и точные ответы с минимальной задержкой. Процесс обучения модели устроен похожим образом на то, как это сделано в DeepSeek R1. Поддерживает 119 языков, включая русский. Лицензирование: Apache 2.0 ? Blog: https://qwenlm.github.io/blog/qwen3/ GitHub: https://github.com/QwenLM/Qwen3 Hugging Face: https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48 Источник: modelscope.cn Комментарии: |
|