Meta* выпустила семейство языковых моделей Llama 4 |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-04-09 11:22 Meta* выпустила четвёртое поколение открытых языковых моделей Llama, которое включает в себя три мультимодальных нейросети с разным количеством параметров. В бенчмарках языковая модель обходит GPT-4o, но пользователям кажется, что разработчики Meta* смухлевали, чтобы вырваться вперёд. Llama 4 изнутри Llama 4 — семейство языковых моделей, которое включает в себя следующие нейросети:
![]()
![]()
![]() Разработчики Llama впервые применили архитектуру MoE (Mixture of Experts — смесь экспертов), которая не использует сразу все слои модели для генерации ответа. Вместо этого в ход идут только эксперты — слои, которые лучше справятся с поставленной задачей. Критика Llama 4 Первые пользователи и журналисты заметили, что в локальных тестах Llama 4 Maverick оказывается хуже конкурентов одного уровня и даже уступает более слабым нейросетям. При этом на портале LLM Arena языковая модель занимает уверенное второе место, разделяя его с GPT-4o и Grok-3-Preview. ![]() Скриншот: LLM Arena / Skillbox Media Эксперты считают, что команда Meta* решила завысить показатели в тестах и обучила нейросеть хорошо их проходить. В результате получилась мощная модель для бенчмарков, но слабая в реальных задачах. Пресс-служба Llama не отвечает на запросы журналистов, но если мошенничество подтвердится, то компания рискует опорочить свою репутацию. Впрочем, пользователи социальных сетей уже недовольны тем, что им пообещали открытого конкурента GPT-4o, а дали языковую модель, которая работает хуже DeepSeek. ![]() Читайте также: Нейросеть DeepSeek — что она умеет и почему о ней все говорят Как получить доступ Модели Scout и Maverick можно скачать на официальном сайте Llama или на портале Hugging Face, а Behemoth выпустят позже. Meta* использует новые нейросети в своих продуктах, включая WhatsApp, Instagram* и Facebook Messenger. Читайте также:
* Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности». Источник: skillbox.ru Комментарии: |
|