Alibaba выпустила семейство Qwen 3.5 Medium |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-02-28 11:12 Команда Qwen опубликовала серию моделей Qwen 3.5 Medium, в которую вошли: Qwen3.5-Flash Qwen3.5-35B-A3B (https://huggingface.co/Qwen/Qwen3.5-35B-A3B) Qwen3.5-122B-A10B (https://huggingface.co/Qwen/Qwen3.5-122B-A10B) Qwen3.5-27B. (https://huggingface.co/Qwen/Qwen3.5-27B) Сюрприз серии - Qwen3.5-35B-A3B. По бенчмаркам она превосходит Qwen3-235B-A22B-2507, у которого активных параметров было 22B то есть разница в эффективности больше чем в 7 раз. Qwen3.5-Flash - это продакшен-версия 35B-A3B, заточенная под агентные сценарии. Из коробки доступны контекстное окно в 1 млн. токенов и нативная поддержка fвызова функций. Миллионный контекст снимает необходимость строить RAG при работе с большими кодовыми базами или объемными документами, модель удерживает все в контексте. Старшие модели Qwen3.5-122B-A10B и Qwen3.5-27B ориентированы на сложные многошаговые задачи: планирование, цепочки рассуждений, долгосрочное выполнение инструкций. Для них применялся четырехэтапный пайплайн дообучения с холодным стартом через длинный СoT и RL на основе hbpjybyu-сигналов. 122B-A10B при 10B активных параметров по логической связности конкурирует с заметно более тяжелыми dense-моделями. Веса доступны на Hugging Face, Flash - только через Model Studio (https://modelstudio.console.alibabacloud.com/ap-southeast-1/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.5-flash-2026-02-23) от Alibaba Cloud по цене примерно 10 центов за млн. входных и 40 центов за млн. выходных токенов Лицензирование: Apache 2.0 License. Набор моделей (https://huggingface.co/collections/Qwen/qwen35) Источник: huggingface.co Комментарии: |
|