DeepSeek V4 ударил по фронтиру: открытая модель на 1.6 трлн параметров, которая может перекроить рынок ИИ

2026-04-27 11:33

Прошлой ночью DeepSeek выкатил V4. Открытый исходник, открытые веса, фронтирный уровень и цена в разы ниже, чем у Opus 4.7 или GPT-5.5. Это куда более серьёзная история, чем релиз R1, после которого фондовый рынок просел почти на 20% буквально за ночь.

Что под капотом. DeepSeek V4 Pro это MoE-модель с 1,6 триллиона параметров, из которых активны 49 миллиардов, а контекстное окно дотягивает до 1 миллиона токенов. V4 Flash попроще и заточен под массовые задачи: 284 миллиарда параметров суммарно и 13 миллиардов активных. Обе модели обучены примерно на 33 триллионах токенов. По бенчмаркам на агентный кодинг, MMLU Pro, GPQA Diamond и SWE-bench Verified V4 идёт ноздря в ноздрю с Opus 4.7 и GPT-5.5. Чуть позади, но именно чуть.

И вот тут начинается интересное. Большинству реальных задач не нужен абсолютный фронтир. Подавляющая часть компаний не занимается передовой наукой и не пытается решить самые сложные алгоритмические головоломки в мире. Они просто ведут бизнес. Представьте, что вы CEO. Смотрите на GPT-5.5 по 30 долларов за миллион выходных токенов. Смотрите на Opus 4.7 примерно с такой же ценой. А потом видите DeepSeek в разы дешевле, причём он закрывает почти всё, что вам нужно. Открытый код, можно дофайнтюнить под себя, развернуть на своих серверах, контролировать поведение. Математика становится очевидной, и вопрос лишь один: зачем платить больше.

Дальше начинается геополитика. Дженсен Хуанг неоднократно говорил, что Китай всё равно построит свои чипы и свои модели, так пусть лучше делают это на американском железе. Логика понятна. Но она работает и в обратную сторону. Если корпоративный сектор США строит ИИ-стратегию поверх китайских опенсорс-моделей, это уже серьёзный риск национальной безопасности. Поменяют архитектуру, выкатят жёсткую лицензию или просто перекроют доступ, и компания окажется в неприятной точке.

Отдельная история про экспортный контроль. Работает он или нет. И да, и нет. Да, потому что DeepSeek сам признаёт дефицит вычислений: в их же whitepaper написано, что Pro-сервис будет ограничен по мощности до второй половины года, пока не развернут новые суперноды. Они физически не могут раздавать модель так, как хотели бы. Но и нет, потому что именно это ограничение заставило их вкладываться в алгоритмические оптимизации. В итоге появились трюки, которые позволяют тренировать и инферить V4 за долю обычной стоимости даже на урезанных GPU.

Ещё одна тема это так называемый distillation hacking. Anthropic пару недель назад выпустил отчёт, а вчера подтянулось правительство США: они говорят про индустриальные масштабы дистилляции американских моделей со стороны зарубежных игроков, прежде всего Китая. Опасения справедливые. Но если вчитаться в сам отчёт Anthropic, у DeepSeek там зафиксировано 150 тысяч обменов. У Moonshot 3,4 миллиона. У MiniMax 13 миллионов. 150 тысяч это просто несопоставимо с тем уровнем качества, который выдаёт V4. Плюс ребята выложили подробный whitepaper, в котором по шагам расписали, как именно они дошли до такого результата. Версия про чистое воровство тут плохо стыкуется с фактами.

Теперь общая картинка. В американский ИИ заливаются триллионы долларов. Это самая быстрая инфраструктурная стройка в истории. Под такие капексы нужен возврат. Если глобальный корпоративный спрос обходит закрытые американские модели стороной, потому что китайский опенсорс достаточно хорош и в разы дешевле, возврата не будет. А ставка фактически сделана на всю экономику.

Есть и культурный слой. Соцсети в своё время изменили мир, и пришли они в основном из США. Это давало возможность задавать рамку дискуссии во многих странах. Теперь представьте обратную картину: половина мира работает поверх китайских моделей, и именно они определяют, что можно говорить, а что нельзя. Да, веса открыты, можно дообучить, но культурные особенности и встроенные приоритеты никуда не денутся, они уйдут в продакшн вместе с моделью. Это вопросы, на которые отрасли скоро придётся отвечать всерьёз.

Что из этого следует. Первое, США нужно гораздо жёстче ставить на опенсорс. Фронтирные лаборатории к открытому коду относятся прохладно, исключение по сути только Google, и даже он выкладывает небольшие модели, не уровня DeepSeek V4. Второе, даже если ставка остаётся на закрытый код, OpenAI и Anthropic должны очень быстро дешеветь. Потому что американский корпоративный сектор уже считает экономику, и пока цифры не на их стороне.

DeepSeek не догнал Америку по самому верху. Но они сделали достаточно хорошее, отдали бесплатно, и значительная часть американского бизнеса этим воспользуется.

Телеграм: t.me/ainewsline

Источник: x.com



		DeepSeek V4 ударил по фронтиру: открытая модель на 1.6 трлн параметров, которая может перекроить рынок ИИ
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2026-04-27 11:33 ИИ проекты Прошлой ночью DeepSeek выкатил V4. Открытый исходник, открытые веса, фронтирный уровень и цена в разы ниже, чем у Opus 4.7 или GPT-5.5. Это куда более серьёзная история, чем релиз R1, после которого фондовый рынок просел почти на 20% буквально за ночь. Что под капотом. DeepSeek V4 Pro это MoE-модель с 1,6 триллиона параметров, из которых активны 49 миллиардов, а контекстное окно дотягивает до 1 миллиона токенов. V4 Flash попроще и заточен под массовые задачи: 284 миллиарда параметров суммарно и 13 миллиардов активных. Обе модели обучены примерно на 33 триллионах токенов. По бенчмаркам на агентный кодинг, MMLU Pro, GPQA Diamond и SWE-bench Verified V4 идёт ноздря в ноздрю с Opus 4.7 и GPT-5.5. Чуть позади, но именно чуть. И вот тут начинается интересное. Большинству реальных задач не нужен абсолютный фронтир. Подавляющая часть компаний не занимается передовой наукой и не пытается решить самые сложные алгоритмические головоломки в мире. Они просто ведут бизнес. Представьте, что вы CEO. Смотрите на GPT-5.5 по 30 долларов за миллион выходных токенов. Смотрите на Opus 4.7 примерно с такой же ценой. А потом видите DeepSeek в разы дешевле, причём он закрывает почти всё, что вам нужно. Открытый код, можно дофайнтюнить под себя, развернуть на своих серверах, контролировать поведение. Математика становится очевидной, и вопрос лишь один: зачем платить больше. Дальше начинается геополитика. Дженсен Хуанг неоднократно говорил, что Китай всё равно построит свои чипы и свои модели, так пусть лучше делают это на американском железе. Логика понятна. Но она работает и в обратную сторону. Если корпоративный сектор США строит ИИ-стратегию поверх китайских опенсорс-моделей, это уже серьёзный риск национальной безопасности. Поменяют архитектуру, выкатят жёсткую лицензию или просто перекроют доступ, и компания окажется в неприятной точке. Отдельная история про экспортный контроль. Работает он или нет. И да, и нет. Да, потому что DeepSeek сам признаёт дефицит вычислений: в их же whitepaper написано, что Pro-сервис будет ограничен по мощности до второй половины года, пока не развернут новые суперноды. Они физически не могут раздавать модель так, как хотели бы. Но и нет, потому что именно это ограничение заставило их вкладываться в алгоритмические оптимизации. В итоге появились трюки, которые позволяют тренировать и инферить V4 за долю обычной стоимости даже на урезанных GPU. Ещё одна тема это так называемый distillation hacking. Anthropic пару недель назад выпустил отчёт, а вчера подтянулось правительство США: они говорят про индустриальные масштабы дистилляции американских моделей со стороны зарубежных игроков, прежде всего Китая. Опасения справедливые. Но если вчитаться в сам отчёт Anthropic, у DeepSeek там зафиксировано 150 тысяч обменов. У Moonshot 3,4 миллиона. У MiniMax 13 миллионов. 150 тысяч это просто несопоставимо с тем уровнем качества, который выдаёт V4. Плюс ребята выложили подробный whitepaper, в котором по шагам расписали, как именно они дошли до такого результата. Версия про чистое воровство тут плохо стыкуется с фактами. Теперь общая картинка. В американский ИИ заливаются триллионы долларов. Это самая быстрая инфраструктурная стройка в истории. Под такие капексы нужен возврат. Если глобальный корпоративный спрос обходит закрытые американские модели стороной, потому что китайский опенсорс достаточно хорош и в разы дешевле, возврата не будет. А ставка фактически сделана на всю экономику. Есть и культурный слой. Соцсети в своё время изменили мир, и пришли они в основном из США. Это давало возможность задавать рамку дискуссии во многих странах. Теперь представьте обратную картину: половина мира работает поверх китайских моделей, и именно они определяют, что можно говорить, а что нельзя. Да, веса открыты, можно дообучить, но культурные особенности и встроенные приоритеты никуда не денутся, они уйдут в продакшн вместе с моделью. Это вопросы, на которые отрасли скоро придётся отвечать всерьёз. Что из этого следует. Первое, США нужно гораздо жёстче ставить на опенсорс. Фронтирные лаборатории к открытому коду относятся прохладно, исключение по сути только Google, и даже он выкладывает небольшие модели, не уровня DeepSeek V4. Второе, даже если ставка остаётся на закрытый код, OpenAI и Anthropic должны очень быстро дешеветь. Потому что американский корпоративный сектор уже считает экономику, и пока цифры не на их стороне. DeepSeek не догнал Америку по самому верху. Но они сделали достаточно хорошее, отдали бесплатно, и значительная часть американского бизнеса этим воспользуется. Телеграм: t.me/ainewsline Источник: x.com Комментарии:

DeepSeek V4 ударил по фронтиру: открытая модель на 1.6 трлн параметров, которая может перекроить рынок ИИ

Комментарии: