Новая версия нейросети Qwen обошла Gemini и DeepSeek

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2026-01-28 12:00

ИИ проекты

Главная особенность Qwen3-Max Thinking — отход от стандартных методов логического вывода. Вместо линейной генерации токенов Qwen3 использует «тяжёлый режим» — то есть не просто генерирует множество ответов и выбирает лучший, а использует накопительную многоэтапную стратегию.

Такой метод имитирует процесс решения задач человеком. Например, модель проводит итеративный самоанализ: учитывает свой опыт, чтобы извлекать информацию из предыдущих этапов рассуждений. Благодаря этому Qwen3-Max Thinking может выходить из тупиковых ситуаций и направлять ресурсы на решение «неразрешённых неопределённостей», а не на повторное получение уже известных выводов. Другое преимущество модели — она объединяет режим размышления с обычным, причём умеет работать с ними одновременно. 

В бенчмарке GPQA нейросеть набрала 92,8 балла, а в LiveCodeBench v6 — 91,4 балла. При тестировании на логическое мышление (HMMT) её результат составит 98 баллов, против 97,5 у Gemini 3 Pro и 92,5 у DeepSeek V3.2. Заодно Qwen3-Max Thinking проверили в тесте Humanity’s Last Exam (HLE), где ИИ получил оценку в 49,8 балла (45,8 у Gemini 3 Pro и 45,5 у GPT-5.2-Thinking). В Arena-Hard v2 результат составил 90,2 балла против 76,7 у Claude-Opus-4.5.

По стоимости токенов Qwen3-Max Thinking находится между Claude Haiku 4.5 и Gemini 3 Pro: 1 млн токенов на входные данные стоит $1,2, на выходные — $6. Опробовать возможности нейросети можно в чат-боте Qwen Chat или по API.


Источник: 4pda.to

Комментарии: