DeepSeek интересен не тем, что делает чат-боты дешевле

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



2026-05-26 11:49

ИИ проекты

Интереснее другое: они последовательно перестраивают архитектуру моделей под реальность, где доступ к HBM, топовым GPU и масштабным кластерам ограничен.

Почти все последние решения DeepSeek бьют в одну точку - снизить зависимость фронтирного ИИ от дорогого GPU-стека. MoE не гоняет всю модель на каждый запрос, а активирует только нужные эксперты. DSA уменьшает стоимость long context. В карточке V4-Pro заявлено, что CSA/HCA снижает FLOPs для 1M-token single-token inference до 27% от V3.2, а KV cache - до 10%.

Отдельно интересен Engram. Идея в том, чтобы вынести часть статических знаний в масштабируемую lookup-память и доставать их предсказуемо из host memory, а не каждый раз проталкивать факты через плотные вычисления. Это уже не просто оптимизация ради красивого графика, а попытка изменить экономику инференса.

Если модели требуют меньше HBM и меньше brute-force compute, меняется вся логика железа. Чипы, которые раньше выглядели компромиссом, LPDDR, NAND и кастомные ASIC начинают играть совсем другую роль. Не как замена Nvidia один к одному, а как база для собственной архитектуры ИИ.

Reuters уже писал о постоянном снижении цен DeepSeek V4-Pro на 75%, одновременно упоминая ограничения поставок Huawei Ascend и ожидание supernode-инфраструктуры. В этом и видно направление: DeepSeek не просто снижает цену API, а подгоняет модель, память, ускорители и системный слой друг к другу.

Самый сильный ход здесь не в app layer и не в очередной гонке бенчмарков. DeepSeek показывает, как можно программировать дефицит: не ждать идеального железа, а менять архитектуру так, чтобы доступное железо стало пригодным для фронтирного ИИ.


Телеграм: t.me/ainewsline

Источник: vk.com

Комментарии: