Момент DeepSeek: ИИ с китайской спецификой

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-12-31 12:51

ИИ проекты

В начале года стартап DeepSeek неожиданно выпустил мощную, но недорогую модель, продемонстрировав, что США не так сильно опережают китайских экспертов в области ИИ. За этим «сенсационным заявлением» стоял 40-летний бывший финансовый аналитик Лян Вэньфэн (???). Заработав миллионы долларов благодаря применению алгоритмов искусственного интеллекта (ИИ) на фондовом рынке, в 2023 году в Ханчжоу провинции Чжэцзян он основал DeepSeek.

DeepSeek — чат-бот на базе ИИ, который работает на двух моделях: генеративной V3 и «рассуждающей» R1. Важное их отличие — открытый код, что означает, что модель можно бесплатно скачать и адаптировать под свои нужды. Успех DeepSeek побудил другие компании в Китае и США последовать его примеру, выпустив собственные открытые модели. В январе 2025 года компания представила модель DeepSeek-R1 — рассуждающий ИИ на 671 млрд параметров, который назвали «убийцей ChatGPT». Разработчики опубликовали подробный технический документ, объясняющий архитектуру и методологию обучения ИИ. На тот момент модель превосходила o1 от компании OpenAI по ряду ключевых показателей в тестах AIME, MATH-500 и SWE-bench Verified.

При этом затраты на ее обучение были значительно ниже американских аналогов. Разработчики заявляли, что на это ушло около $6 млн (новая модель ChatGPT стоила не менее $100 млн). В рецензируемой статье, опубликованной в сентябре в журнале Nature, сообщается о еще меньшей сумме. Модель обучалась на 512 чипах Nvidia H800 в течение 80 часов, что обошлось в $294 тыс. В статье также признается, что данные для следующей версии модели — DeepSeek V3 — включали страницы с ответами, сгенерированными другими ИИ, в том числе OpenAI. Однако, как утверждает компания, это произошло «неумышленно».

Хотя некоторые аналитики назвали озвученные цифры обманчивыми, они отметили, что DeepSeek поставил под сомнение доминирование США в сфере ИИ и эффективность экспортных ограничений на чипы. Президент США Дональд Трамп назвал успех китайского сервиса «звонком» для американской промышленности. Другие эксперты сравнили выпуск DeepSeek с «моментом спутника» для Китая (выражение возникло после того, как Советский Союз запустил первый искусственный спутник Земли, чем удивил США — прим. ЭКД).

Спустя месяц Лян, выросший в деревне в провинции Гуандун, уже был в числе китайских технологических магнатов, приглашенных на встречу с председателем КНР Си Цзиньпином. Результаты, правда, впечатляли. DeepSeek вышел на первую строчку App Store США, обогнав ChatGPT от Open AI. В январе 2025 года он стал самым загружаемым приложением в 140 странах, включая США. Это спровоцировало рост инвестиций в фондовый рынок Китая, особенно в технологическом секторе.

Успех DeepSeek в мировых рейтингах загрузок привел к падению акций технологических гигантов. Упали акции Microsoft, Tesla и Broadcom, снизился индейс Nasdaq. Рыночная капитализация компаний снизилась более чем на $1 трлн, только американская Nvidia потеряла почти $500 млрд. В результате состояние 500 самых богатых людей мира сократилось в январе на $108 млрд.

Китайские города стали активно использовать DeepSeek в государственном управлении. Его внедрили в систему администрации Пекина, Шанхая, Чэнду (провинция Сычуань), Шэньчжэня (провинция Гуандун) и других мегаполисов. ИИ автоматизирует обработку документов и запросов и ускоряют реагирование на чрезвычайные ситуации. Банки КНР стали использовать DeepSeek для обслуживания клиентов и оценки эффективности. Ряд китайских автопроизводителей, включая BYD, Geely, Great Wall Motor, Dongfeng Motor, а также BMW заключили соглашение с компанией на интеграцию в собственные системы. Компания более 150 раз упоминается в тендерах Народно-освободительной армии Китая и сотрудничает с оборонными научно-исследовательскими институтами. DeepSeek даже спрогнозировал кассовые сборы «Нэчжа 2» на уровне 15,2-17,3 млрд юаней ($2,2-2,5 млрд).

Однако некоторые страны и регионы запретили использование DeepSeek из-за опасений по поводу утечек данных и влияния китайского правительства. В Италии и Германии ведомства защиты персональных данных заблокировали DeepSeek за якобы передачу данных пользователей в Китай. Приложение запретили использовать конгрессменам США и сотрудникам Пентагона, опасаясь угрозы национальной безопасности. По той же причине сервис запретили госведомствам в Австралии, а также на Тайване. Нидерланды начали расследование по поводу передачи данных в КНР.

Весной 2025 года Лян Вэньфэн попал в рейтинг IT-миллиардеров по версии Forbes, в настоящее время его состояние оценивается в $11,5 млрд. Журнал Time включил его в ежегодный список 100 самых влиятельных людей в категории «Пионеры». Компанию внесли в 6 «маленьких драконов» — самых быстрорастущих из Ханчжоу. В августе журнал Fortune China поставил DeepSeek на второе место (после Huawei) в список 50 крупнейших технологических компаний Китая. Сервис насчитывал 163 млн активных пользователей в месяц и вошел в топ-10 мира по скачиваниям открытых моделей. По итогам года журнал Nature отметил Ляна среди десяти выдающихся ученых мира за развитие открытых и доступных по стоимости моделей искусственного интеллекта.

«Мы не стремимся к быстрой прибыли. Китайские компании годами использовали инновации, созданные за рубежом, и монетизировали их в виде приложений. Но такой подход не может быть устойчивым. В этот раз наша цель — не быстрая прибыль, а развитие технологического фундамента, который подтолкнет всю экосистему вперед», — поделился Лян в одном из немногочисленных интервью китайским СМИ. Пожалуй, этот момент DeepSeek уже на подходе.

ЭКД


Источник: vk.com

Комментарии: