Meta* выпустила семейство языковых моделей Llama 4

2025-04-09 11:22

Meta* выпустила четвёртое поколение открытых языковых моделей Llama, которое включает в себя три мультимодальных нейросети с разным количеством параметров. В бенчмарках языковая модель обходит GPT-4o, но пользователям кажется, что разработчики Meta* смухлевали, чтобы вырваться вперёд.

Llama 4 изнутри

Llama 4 — семейство языковых моделей, которое включает в себя следующие нейросети:

Llama 4 Scout — мультимодальная нейросеть со 109 миллиардами параметров и контекстным окном в 10 миллионов токенов. Нейросеть может конкурировать с Gemini 2.0 Flash-Lite от Google, а чудеса оптимизации позволяют запускать её всего на одной видеокарте NVIDIA H100.

Llama 4 Maverick — рассуждающая мультимодальная нейросеть с 400 миллиардами параметров. Разработчики отмечают, что в тестах языковая модель обходит конкурентов в лице Gemini 2.0 и GPT-4o и при этом потребляет меньше ресурсов.

Llama 4 Behemoth — самая мощная нейросеть от Meta* с 2 триллионами параметров. Компания утверждает, что в тестах производительности и качества ответов модель превосходит Gemini 2.0 Pro, GPT-4.5 и Claude Sonnet 3.7. При этом финальная версия Behemoth ещё находится на этапе обучения, поэтому пользователи получат к ней доступ позже.

Разработчики Llama впервые применили архитектуру MoE (Mixture of Experts — смесь экспертов), которая не использует сразу все слои модели для генерации ответа. Вместо этого в ход идут только эксперты — слои, которые лучше справятся с поставленной задачей.

Критика Llama 4

Первые пользователи и журналисты заметили, что в локальных тестах Llama 4 Maverick оказывается хуже конкурентов одного уровня и даже уступает более слабым нейросетям. При этом на портале LLM Arena языковая модель занимает уверенное второе место, разделяя его с GPT-4o и Grok-3-Preview.

Таблица лидеров LLM Arena
*Скриншот: LLM Arena / Skillbox Media*

Эксперты считают, что команда Meta* решила завысить показатели в тестах и обучила нейросеть хорошо их проходить. В результате получилась мощная модель для бенчмарков, но слабая в реальных задачах.

Пресс-служба Llama не отвечает на запросы журналистов, но если мошенничество подтвердится, то компания рискует опорочить свою репутацию. Впрочем, пользователи социальных сетей уже недовольны тем, что им пообещали открытого конкурента GPT-4o, а дали языковую модель, которая работает хуже DeepSeek.



		Meta* выпустила семейство языковых моделей Llama 4
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2025-04-09 11:22 ИИ проекты Meta* выпустила четвёртое поколение открытых языковых моделей Llama, которое включает в себя три мультимодальных нейросети с разным количеством параметров. В бенчмарках языковая модель обходит GPT-4o, но пользователям кажется, что разработчики Meta* смухлевали, чтобы вырваться вперёд. Llama 4 изнутри Llama 4 — семейство языковых моделей, которое включает в себя следующие нейросети: Llama 4 Scout — мультимодальная нейросеть со 109 миллиардами параметров и контекстным окном в 10 миллионов токенов. Нейросеть может конкурировать с Gemini 2.0 Flash-Lite от Google, а чудеса оптимизации позволяют запускать её всего на одной видеокарте NVIDIA H100. Изображение: Meta AI* Llama 4 Maverick — рассуждающая мультимодальная нейросеть с 400 миллиардами параметров. Разработчики отмечают, что в тестах языковая модель обходит конкурентов в лице Gemini 2.0 и GPT-4o и при этом потребляет меньше ресурсов. Изображение: Meta AI* Llama 4 Behemoth — самая мощная нейросеть от Meta* с 2 триллионами параметров. Компания утверждает, что в тестах производительности и качества ответов модель превосходит Gemini 2.0 Pro, GPT-4.5 и Claude Sonnet 3.7. При этом финальная версия Behemoth ещё находится на этапе обучения, поэтому пользователи получат к ней доступ позже. Изображение: Meta AI* Разработчики Llama впервые применили архитектуру MoE (Mixture of Experts — смесь экспертов), которая не использует сразу все слои модели для генерации ответа. Вместо этого в ход идут только эксперты — слои, которые лучше справятся с поставленной задачей. Критика Llama 4 Первые пользователи и журналисты заметили, что в локальных тестах Llama 4 Maverick оказывается хуже конкурентов одного уровня и даже уступает более слабым нейросетям. При этом на портале LLM Arena языковая модель занимает уверенное второе место, разделяя его с GPT-4o и Grok-3-Preview. Таблица лидеров LLM Arena Скриншот: LLM Arena / Skillbox Media Эксперты считают, что команда Meta* решила завысить показатели в тестах и обучила нейросеть хорошо их проходить. В результате получилась мощная модель для бенчмарков, но слабая в реальных задачах. Пресс-служба Llama не отвечает на запросы журналистов, но если мошенничество подтвердится, то компания рискует опорочить свою репутацию. Впрочем, пользователи социальных сетей уже недовольны тем, что им пообещали открытого конкурента GPT-4o, а дали языковую модель, которая работает хуже DeepSeek. Читайте также: Нейросеть DeepSeek — что она умеет и почему о ней все говорят Как получить доступ Модели Scout и Maverick можно скачать на официальном сайте Llama или на портале Hugging Face, а Behemoth выпустят позже. Meta* использует новые нейросети в своих продуктах, включая WhatsApp, Instagram* и Facebook Messenger. Читайте также: 30 мощных нейросетей для любых задач Исчерпывающий гайд по опенсорсным языковым моделям Как устроено машинное обучение: задачи, алгоритмы и виды machine learning * Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности». Источник: skillbox.ru Комментарии:

Meta* выпустила семейство языковых моделей Llama 4

Комментарии: