Гонка нейросетей: китайцы устраивают жару |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-01-11 19:02 Сидел тут и думал: «Ну всё, GPT-4 и Anthropic уже монополизировали рынок». Ага, щас. На днях китайская команда DeepSeek выкатили свою DeepSeek-V3 — и это такой заряд, что мировые гиганты нервно покуривают в сторонке. Давайте разбираться, что за модель и чем она так цепляет. ЧТО ЭТО ЗА ЗВЕРЬ • Mixture of Experts (MoE): 671 миллиард параметров, при этом для каждого токена включается «всего» 37 ярдов. • Обучение: 14,8 триллионов токенов — это не шутки, модель реально накачали данными. • Производительность: порвала на тестах и GPT-4o, и Claude-3.5-Sonnet16, а в китайских задачах, типа C-Eval, просто вынесла Qwen2.5-72B9. ПОЧЕМУ ВСЕ ТАК ЗАШЕВЕЛИЛИСЬ 1. Быстрее ветра: 87.5 токенов/сек, что почти догоняет GPT-4o mini (а это серьёзная заявка на успех). 2. Дёшево, мать его: $0.48 за 1 миллион токенов — модель реально в разы доступнее конкурентов. 3. Снижение затрат: DeepSeek потратили на обучение что-то около 5.58 миллионов, в то время как OpenAI на GPT-4o вывалили будто бы сотни миллионов. Вот это экономия, да? ГЛАВНЫЕ ВЫВОДЫ • Китай наступает: DeepSeek-V3 не просто догоняет, а уже кое-где обходит известных игроков. • Доступность ИИ: теперь и у малого, и у среднего бизнеса появляется возможность заполучить мощный ИИ без космических трат. • Новые стандарты: открытые модели становятся серьёзной альтернативой закрытым решениям от титанов вроде OpenAI. ЧТО ДАЛЬШЕ Вся эта движуха только начинается. DeepSeek-V3 — пример того, как можно сделать крутую нейросеть без сжигания миллиардов. Значит, к гонке подключатся и другие: ждите новых моделей, которые будут ещё быстрее, дешевле и эффективнее. Хотите больше деталей? Переходите на их сайт: chat.deepseek.com. А мы наблюдаем, как мир ИИ меняется буквально на глазах. Источник: vk.com Комментарии: |
|