Гонка нейросетей: китайцы устраивают жару

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-01-11 19:02

ИИ проекты

Сидел тут и думал: «Ну всё, GPT-4 и Anthropic уже монополизировали рынок». Ага, щас. На днях китайская команда DeepSeek выкатили свою DeepSeek-V3 — и это такой заряд, что мировые гиганты нервно покуривают в сторонке. Давайте разбираться, что за модель и чем она так цепляет.

ЧТО ЭТО ЗА ЗВЕРЬ

• Mixture of Experts (MoE): 671 миллиард параметров, при этом для каждого токена включается «всего» 37 ярдов.

• Обучение: 14,8 триллионов токенов — это не шутки, модель реально накачали данными.

• Производительность: порвала на тестах и GPT-4o, и Claude-3.5-Sonnet16, а в китайских задачах, типа C-Eval, просто вынесла Qwen2.5-72B9.

ПОЧЕМУ ВСЕ ТАК ЗАШЕВЕЛИЛИСЬ

1. Быстрее ветра: 87.5 токенов/сек, что почти догоняет GPT-4o mini (а это серьёзная заявка на успех).

2. Дёшево, мать его: $0.48 за 1 миллион токенов — модель реально в разы доступнее конкурентов.

3. Снижение затрат: DeepSeek потратили на обучение что-то около 5.58 миллионов, в то время как OpenAI на GPT-4o вывалили будто бы сотни миллионов. Вот это экономия, да?

ГЛАВНЫЕ ВЫВОДЫ

• Китай наступает: DeepSeek-V3 не просто догоняет, а уже кое-где обходит известных игроков.

• Доступность ИИ: теперь и у малого, и у среднего бизнеса появляется возможность заполучить мощный ИИ без космических трат.

• Новые стандарты: открытые модели становятся серьёзной альтернативой закрытым решениям от титанов вроде OpenAI.

ЧТО ДАЛЬШЕ

Вся эта движуха только начинается. DeepSeek-V3 — пример того, как можно сделать крутую нейросеть без сжигания миллиардов. Значит, к гонке подключатся и другие: ждите новых моделей, которые будут ещё быстрее, дешевле и эффективнее.

Хотите больше деталей? Переходите на их сайт: chat.deepseek.com.

А мы наблюдаем, как мир ИИ меняется буквально на глазах.


Источник: vk.com

Комментарии: