Момент DeepSeek: ИИ с китайской спецификой |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-12-31 12:51 В начале года стартап DeepSeek неожиданно выпустил мощную, но недорогую модель, продемонстрировав, что США не так сильно опережают китайских экспертов в области ИИ. За этим «сенсационным заявлением» стоял 40-летний бывший финансовый аналитик Лян Вэньфэн (???). Заработав миллионы долларов благодаря применению алгоритмов искусственного интеллекта (ИИ) на фондовом рынке, в 2023 году в Ханчжоу провинции Чжэцзян он основал DeepSeek. DeepSeek — чат-бот на базе ИИ, который работает на двух моделях: генеративной V3 и «рассуждающей» R1. Важное их отличие — открытый код, что означает, что модель можно бесплатно скачать и адаптировать под свои нужды. Успех DeepSeek побудил другие компании в Китае и США последовать его примеру, выпустив собственные открытые модели. В январе 2025 года компания представила модель DeepSeek-R1 — рассуждающий ИИ на 671 млрд параметров, который назвали «убийцей ChatGPT». Разработчики опубликовали подробный технический документ, объясняющий архитектуру и методологию обучения ИИ. На тот момент модель превосходила o1 от компании OpenAI по ряду ключевых показателей в тестах AIME, MATH-500 и SWE-bench Verified. При этом затраты на ее обучение были значительно ниже американских аналогов. Разработчики заявляли, что на это ушло около $6 млн (новая модель ChatGPT стоила не менее $100 млн). В рецензируемой статье, опубликованной в сентябре в журнале Nature, сообщается о еще меньшей сумме. Модель обучалась на 512 чипах Nvidia H800 в течение 80 часов, что обошлось в $294 тыс. В статье также признается, что данные для следующей версии модели — DeepSeek V3 — включали страницы с ответами, сгенерированными другими ИИ, в том числе OpenAI. Однако, как утверждает компания, это произошло «неумышленно». Хотя некоторые аналитики назвали озвученные цифры обманчивыми, они отметили, что DeepSeek поставил под сомнение доминирование США в сфере ИИ и эффективность экспортных ограничений на чипы. Президент США Дональд Трамп назвал успех китайского сервиса «звонком» для американской промышленности. Другие эксперты сравнили выпуск DeepSeek с «моментом спутника» для Китая (выражение возникло после того, как Советский Союз запустил первый искусственный спутник Земли, чем удивил США — прим. ЭКД). Спустя месяц Лян, выросший в деревне в провинции Гуандун, уже был в числе китайских технологических магнатов, приглашенных на встречу с председателем КНР Си Цзиньпином. Результаты, правда, впечатляли. DeepSeek вышел на первую строчку App Store США, обогнав ChatGPT от Open AI. В январе 2025 года он стал самым загружаемым приложением в 140 странах, включая США. Это спровоцировало рост инвестиций в фондовый рынок Китая, особенно в технологическом секторе. Успех DeepSeek в мировых рейтингах загрузок привел к падению акций технологических гигантов. Упали акции Microsoft, Tesla и Broadcom, снизился индейс Nasdaq. Рыночная капитализация компаний снизилась более чем на $1 трлн, только американская Nvidia потеряла почти $500 млрд. В результате состояние 500 самых богатых людей мира сократилось в январе на $108 млрд. Китайские города стали активно использовать DeepSeek в государственном управлении. Его внедрили в систему администрации Пекина, Шанхая, Чэнду (провинция Сычуань), Шэньчжэня (провинция Гуандун) и других мегаполисов. ИИ автоматизирует обработку документов и запросов и ускоряют реагирование на чрезвычайные ситуации. Банки КНР стали использовать DeepSeek для обслуживания клиентов и оценки эффективности. Ряд китайских автопроизводителей, включая BYD, Geely, Great Wall Motor, Dongfeng Motor, а также BMW заключили соглашение с компанией на интеграцию в собственные системы. Компания более 150 раз упоминается в тендерах Народно-освободительной армии Китая и сотрудничает с оборонными научно-исследовательскими институтами. DeepSeek даже спрогнозировал кассовые сборы «Нэчжа 2» на уровне 15,2-17,3 млрд юаней ($2,2-2,5 млрд). Однако некоторые страны и регионы запретили использование DeepSeek из-за опасений по поводу утечек данных и влияния китайского правительства. В Италии и Германии ведомства защиты персональных данных заблокировали DeepSeek за якобы передачу данных пользователей в Китай. Приложение запретили использовать конгрессменам США и сотрудникам Пентагона, опасаясь угрозы национальной безопасности. По той же причине сервис запретили госведомствам в Австралии, а также на Тайване. Нидерланды начали расследование по поводу передачи данных в КНР. Весной 2025 года Лян Вэньфэн попал в рейтинг IT-миллиардеров по версии Forbes, в настоящее время его состояние оценивается в $11,5 млрд. Журнал Time включил его в ежегодный список 100 самых влиятельных людей в категории «Пионеры». Компанию внесли в 6 «маленьких драконов» — самых быстрорастущих из Ханчжоу. В августе журнал Fortune China поставил DeepSeek на второе место (после Huawei) в список 50 крупнейших технологических компаний Китая. Сервис насчитывал 163 млн активных пользователей в месяц и вошел в топ-10 мира по скачиваниям открытых моделей. По итогам года журнал Nature отметил Ляна среди десяти выдающихся ученых мира за развитие открытых и доступных по стоимости моделей искусственного интеллекта. «Мы не стремимся к быстрой прибыли. Китайские компании годами использовали инновации, созданные за рубежом, и монетизировали их в виде приложений. Но такой подход не может быть устойчивым. В этот раз наша цель — не быстрая прибыль, а развитие технологического фундамента, который подтолкнет всю экосистему вперед», — поделился Лян в одном из немногочисленных интервью китайским СМИ. Пожалуй, этот момент DeepSeek уже на подходе. ЭКД Источник: vk.com Комментарии: |
|