Про Deep Seek из первых рук

2025-02-02 20:02

Народ, очень много фейков, спекуляций на эту тему. Я хочу просто повесить здесь часть интервью от основателя стартапа Лян Вэньфэня. Из этого интервью из первых рук - спокойного и взвешенного, картина намного понятнее, чем из истерик и фейков прессы и "экспертов ИИ":

Как был сделан первый выстрел в ценовой войне?

Ань Юн: После выхода модели DeepSeek?v2 в индустрии крупных ИИ?моделей разгорелась настоящая ценовая война. Многие называют вас рыночным разрушителем.

Лян Вэньфэн: Мы никогда не стремились быть разрушителями. Это получилось случайно.

Ань Юн: Этот эффект стал для вас неожиданным?

Лян Вэньфэн: Очень неожиданным. Мы даже не думали, что вопрос цен окажется настолько чувствительным. Мы просто шли своим путём — считали затраты и устанавливали цены исходя из них. Наш принцип — не работать в убыток, но и не гнаться за сверхприбылью. Текущие цены обеспечивают лишь небольшую прибыль сверх себестоимости.

[...]

Ань Юн: За счёт чего образовался этот технологический разрыв?

Лян Вэньфэн: В первую очередь это разрыв в эффективности обучения. По нашим оценкам, даже лучшие китайские модели требуют вдвое больше вычислительных мощностей, чтобы догнать топовые мировые разработки. Кроме того, эффективность работы с данными вдвое ниже, то есть нам нужно вдвое больше информации и ресурсов, чтобы получить аналогичный результат. В совокупности это четырёхкратная разница в затратах. Наша задача — постепенно сокращать этот разрыв.

Ань Юн: Большинство китайских ИИ?компаний разрабатывают и модели, и приложения. Почему DeepSeek сосредоточился исключительно на исследованиях?

Лян Вэньфэн: Потому что важнее всего сейчас — участвовать в глобальном технологическом прогрессе. Китайские компании годами использовали инновации, созданные за рубежом, и монетизировали их в виде приложений. Но такой подход не может быть устойчивым. В этот раз наша цель — не быстрая прибыль, а развитие технологического фундамента, который подтолкнёт всю экосистему вперёд.

Ань Юн: На протяжении интернет?революции и мобильного интернета существовало мнение, что США лидируют в инновациях, а Китай — в коммерческом применении технологий.

Лян Вэньфэн: Мы считаем, что с развитием экономики Китай должен перестать быть просто пользователем технологий и стать их создателем. За последние 30 лет ИТ?революции мы практически не участвовали в фундаментальных технологических разработках.

Мы привыкли к тому, что закон Мура словно «падает с неба»: стоит просто подождать 18 месяцев — и появятся более мощные процессоры и более продвинутый софт. Точно так же воспринимается и закон масштабирования. Но все эти технологические прорывы — не случайность, а результат многих поколений неустанного труда мирового научного сообщества, в котором доминировали западные страны. И поскольку Китай долгое время не участвовал в этом процессе на фундаментальном уровне, мы невольно недооценили его важность.

Настоящий разрыв — в оригинальности, а не во времени

Ань Юн: Почему выход DeepSeek?v2 так удивил Силиконовую долину?

Лян Вэньфэн: В США инновации происходят каждый день, и с их точки зрения в этом нет ничего необычного. Их поразило не само технологическое достижение, а то, что китайская компания смогла сыграть на их поле как новатор, а не просто догоняющий — ведь большинство китайских компаний привыкли именно к роли последователей.

[...]

Ань Юн: Но в ИИ одних технологий недостаточно для успеха. На что DeepSeek делает ставку в глобальной перспективе?

Лян Вэньфэн: Мы убеждены, что Китай не может вечно оставаться в роли догоняющего. Мы часто говорим, что китайский ИИ отстаёт от американского на один?два года, но главный разрыв не во времени, а в подходе: между оригинальностью и копированием. Если мы это не изменим, Китай так и останется в роли последователя. А некоторые риски и неудачи на этом пути — неизбежны.

Доминантное положение Nvidia — это не просто результат их работы, это плод усилий всей западной технологической экосистемы, которая коллективно выстраивает дорожные карты для будущих технологий. Китаю нужно создать аналогичную систему. Сейчас многие китайские чипы терпят неудачу не потому, что у нас не хватает ресурсов, а потому, что у нас нет такой же сильной технологической среды — мы слишком зависим от чужих решений. Кто?то должен сделать первый шаг в неизведанное.

Больше инвестиций — не всегда больше инноваций

[...]

Лян Вэньфэн: Модель v2 была полностью разработана отечественными специалистами. Возможно, сегодня в Китае нет мировых звёзд из топ-50, но наша цель — воспитать их самим.

Ань Юн: Как скоро, по?вашему, человечество достигнет ИИ общего назначения (AGI)? До выхода v2 вы экспериментировали с математическими и кодовыми моделями, а затем перешли от плотных архитектур к MoE (mixture of experts, архитектура, повышающая эффективность модели за счёт активации специализированных подсетей). Как выглядит ваш план развития?

Лян Вэньфэн: Это может занять два года, пять или десять — но это точно произойдёт в нашем поколении. Даже внутри компании у нас нет единого мнения о том, какой путь будет самым эффективным. Однако мы делаем ставку на три ключевых направления.

Во?первых, математика и программирование. Они являются естественной средой для тестирования AGI — как игра в го, эти системы имеют строгие правила и верифицируемые решения, что позволяет ИИ самообучаться и наращивать интеллект. Во?вторых, мультимодальность: чтобы достичь человеческого уровня понимания, ИИ должен взаимодействовать с реальным миром и учиться на разнообразных данных. В?третьих, естественный язык: он лежит в основе мышления и общения, а значит, является ключом к настоящему разуму. Мы открыты ко всем возможным путям.

Все стратегии — это наследие прошлого

[...]

Ань Юн: Многие ИИ?стартапы стараются сочетать разработку моделей и коммерческие приложения, ведь технологическое лидерство не бывает вечным. Почему DeepSeek уверен, что может сосредоточиться только на исследованиях? Это потому, что ваши модели пока отстают?

Лян Вэньфэн: Все стратегии — это наследие прошлого, и далеко не факт, что они будут работать в будущем. Обсуждать прибыльность ИИ с точки зрения коммерческой логики эпохи интернета — это всё равно что сравнивать Tencent в начале пути с General Electric или Coca?Cola. Это как высекать отметку на лодке, чтобы потом найти упавший в воду меч, — устаревший подход.

[...]

Ань Юн: Вернёмся к теме прорывных инноваций. С замедлением экономики и охлаждением инвестиционного рынка не грозит ли это стагнацией исследований?

Лян Вэньфэн: Необязательно. Трансформация китайской промышленности будет всё больше зависеть от глубоких технологических разработок. По мере того как возможности для быстрого заработка исчезают, всё больше людей будут вынуждены заниматься настоящими инновациями.

Ань Юн: То есть вы сохраняете оптимизм?

Лян Вэньфэн: Я рос в 1980-х в небольшом городке в Гуандуне, мой отец был учителем начальной школы. В 1990-х заработать деньги было легко, и многие родители приходили к нам и говорили: «Учёба бесполезна». Но сейчас взгляды изменились: делать деньги уже не так просто, даже работа таксистом больше не кажется надёжным вариантом. За одно поколение всё перевернулось.

Настоящие, фундаментальные инновации будут только нарастать. Пока это неочевидно, потому что обществу нужно пройти через осознание. Когда мы начнём праздновать успехи глубоко технологических разработчиков так же, как успехи интернет?бизнеса, восприятие изменится. Всё, что требуется, — это реальные примеры и время, чтобы этот процесс обрёл силу.

(Июнь 2024 год, распространила The China Academy три недели назад)

Источник: vk.com



		Про Deep Seek из первых рук
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2025-02-02 20:02 искусственный интеллект Народ, очень много фейков, спекуляций на эту тему. Я хочу просто повесить здесь часть интервью от основателя стартапа Лян Вэньфэня. Из этого интервью из первых рук - спокойного и взвешенного, картина намного понятнее, чем из истерик и фейков прессы и "экспертов ИИ": Как был сделан первый выстрел в ценовой войне? Ань Юн: После выхода модели DeepSeek?v2 в индустрии крупных ИИ?моделей разгорелась настоящая ценовая война. Многие называют вас рыночным разрушителем. Лян Вэньфэн: Мы никогда не стремились быть разрушителями. Это получилось случайно. Ань Юн: Этот эффект стал для вас неожиданным? Лян Вэньфэн: Очень неожиданным. Мы даже не думали, что вопрос цен окажется настолько чувствительным. Мы просто шли своим путём — считали затраты и устанавливали цены исходя из них. Наш принцип — не работать в убыток, но и не гнаться за сверхприбылью. Текущие цены обеспечивают лишь небольшую прибыль сверх себестоимости. [...] Ань Юн: За счёт чего образовался этот технологический разрыв? Лян Вэньфэн: В первую очередь это разрыв в эффективности обучения. По нашим оценкам, даже лучшие китайские модели требуют вдвое больше вычислительных мощностей, чтобы догнать топовые мировые разработки. Кроме того, эффективность работы с данными вдвое ниже, то есть нам нужно вдвое больше информации и ресурсов, чтобы получить аналогичный результат. В совокупности это четырёхкратная разница в затратах. Наша задача — постепенно сокращать этот разрыв. Ань Юн: Большинство китайских ИИ?компаний разрабатывают и модели, и приложения. Почему DeepSeek сосредоточился исключительно на исследованиях? Лян Вэньфэн: Потому что важнее всего сейчас — участвовать в глобальном технологическом прогрессе. Китайские компании годами использовали инновации, созданные за рубежом, и монетизировали их в виде приложений. Но такой подход не может быть устойчивым. В этот раз наша цель — не быстрая прибыль, а развитие технологического фундамента, который подтолкнёт всю экосистему вперёд. Ань Юн: На протяжении интернет?революции и мобильного интернета существовало мнение, что США лидируют в инновациях, а Китай — в коммерческом применении технологий. Лян Вэньфэн: Мы считаем, что с развитием экономики Китай должен перестать быть просто пользователем технологий и стать их создателем. За последние 30 лет ИТ?революции мы практически не участвовали в фундаментальных технологических разработках. Мы привыкли к тому, что закон Мура словно «падает с неба»: стоит просто подождать 18 месяцев — и появятся более мощные процессоры и более продвинутый софт. Точно так же воспринимается и закон масштабирования. Но все эти технологические прорывы — не случайность, а результат многих поколений неустанного труда мирового научного сообщества, в котором доминировали западные страны. И поскольку Китай долгое время не участвовал в этом процессе на фундаментальном уровне, мы невольно недооценили его важность. Настоящий разрыв — в оригинальности, а не во времени Ань Юн: Почему выход DeepSeek?v2 так удивил Силиконовую долину? Лян Вэньфэн: В США инновации происходят каждый день, и с их точки зрения в этом нет ничего необычного. Их поразило не само технологическое достижение, а то, что китайская компания смогла сыграть на их поле как новатор, а не просто догоняющий — ведь большинство китайских компаний привыкли именно к роли последователей. [...] Ань Юн: Но в ИИ одних технологий недостаточно для успеха. На что DeepSeek делает ставку в глобальной перспективе? Лян Вэньфэн: Мы убеждены, что Китай не может вечно оставаться в роли догоняющего. Мы часто говорим, что китайский ИИ отстаёт от американского на один?два года, но главный разрыв не во времени, а в подходе: между оригинальностью и копированием. Если мы это не изменим, Китай так и останется в роли последователя. А некоторые риски и неудачи на этом пути — неизбежны. Доминантное положение Nvidia — это не просто результат их работы, это плод усилий всей западной технологической экосистемы, которая коллективно выстраивает дорожные карты для будущих технологий. Китаю нужно создать аналогичную систему. Сейчас многие китайские чипы терпят неудачу не потому, что у нас не хватает ресурсов, а потому, что у нас нет такой же сильной технологической среды — мы слишком зависим от чужих решений. Кто?то должен сделать первый шаг в неизведанное. Больше инвестиций — не всегда больше инноваций [...] Лян Вэньфэн: Модель v2 была полностью разработана отечественными специалистами. Возможно, сегодня в Китае нет мировых звёзд из топ-50, но наша цель — воспитать их самим. Ань Юн: Как скоро, по?вашему, человечество достигнет ИИ общего назначения (AGI)? До выхода v2 вы экспериментировали с математическими и кодовыми моделями, а затем перешли от плотных архитектур к MoE (mixture of experts, архитектура, повышающая эффективность модели за счёт активации специализированных подсетей). Как выглядит ваш план развития? Лян Вэньфэн: Это может занять два года, пять или десять — но это точно произойдёт в нашем поколении. Даже внутри компании у нас нет единого мнения о том, какой путь будет самым эффективным. Однако мы делаем ставку на три ключевых направления. Во?первых, математика и программирование. Они являются естественной средой для тестирования AGI — как игра в го, эти системы имеют строгие правила и верифицируемые решения, что позволяет ИИ самообучаться и наращивать интеллект. Во?вторых, мультимодальность: чтобы достичь человеческого уровня понимания, ИИ должен взаимодействовать с реальным миром и учиться на разнообразных данных. В?третьих, естественный язык: он лежит в основе мышления и общения, а значит, является ключом к настоящему разуму. Мы открыты ко всем возможным путям. Все стратегии — это наследие прошлого [...] Ань Юн: Многие ИИ?стартапы стараются сочетать разработку моделей и коммерческие приложения, ведь технологическое лидерство не бывает вечным. Почему DeepSeek уверен, что может сосредоточиться только на исследованиях? Это потому, что ваши модели пока отстают? Лян Вэньфэн: Все стратегии — это наследие прошлого, и далеко не факт, что они будут работать в будущем. Обсуждать прибыльность ИИ с точки зрения коммерческой логики эпохи интернета — это всё равно что сравнивать Tencent в начале пути с General Electric или Coca?Cola. Это как высекать отметку на лодке, чтобы потом найти упавший в воду меч, — устаревший подход. [...] Ань Юн: Вернёмся к теме прорывных инноваций. С замедлением экономики и охлаждением инвестиционного рынка не грозит ли это стагнацией исследований? Лян Вэньфэн: Необязательно. Трансформация китайской промышленности будет всё больше зависеть от глубоких технологических разработок. По мере того как возможности для быстрого заработка исчезают, всё больше людей будут вынуждены заниматься настоящими инновациями. Ань Юн: То есть вы сохраняете оптимизм? Лян Вэньфэн: Я рос в 1980-х в небольшом городке в Гуандуне, мой отец был учителем начальной школы. В 1990-х заработать деньги было легко, и многие родители приходили к нам и говорили: «Учёба бесполезна». Но сейчас взгляды изменились: делать деньги уже не так просто, даже работа таксистом больше не кажется надёжным вариантом. За одно поколение всё перевернулось. Настоящие, фундаментальные инновации будут только нарастать. Пока это неочевидно, потому что обществу нужно пройти через осознание. Когда мы начнём праздновать успехи глубоко технологических разработчиков так же, как успехи интернет?бизнеса, восприятие изменится. Всё, что требуется, — это реальные примеры и время, чтобы этот процесс обрёл силу. (Июнь 2024 год, распространила The China Academy три недели назад) Источник: vk.com Комментарии:

Про Deep Seek из первых рук

Комментарии: