Рейтинг ведущих LLM

2025-04-21 12:01

Сложно разобраться во всем этом зоопарке бесчисленных LLMs, выходящих в среднем раз в полмесяца. Даже отраслевые специалисты путаются в этом многообразии, что уж говорить про обычных людей? Следить за инновациями становится все сложнее, а тестировать – тем более.

Конкуренция феноменальная, а темпы инноваций – ошеломляющие. С апреля 2023 по сентябрь 2024 (1.5 года!) на рынке текстовых LLM не было значимых релизов и инноваций, только косметические модификации ChatGPT 4, все остальные лишь сокращали отставание от OpenAI.

Индустрия проснулась с сентября 2024, когда OpenAI внедрила рассуждающую o1, а взрывной рост начался с января 2025.

Напомню ротацию лидеров. С середины декабря самой мощной моделью на рынке была OpenAI o1, с 20 января 2025 достойную конкуренцию o1, а в некоторых задачах в лидеры выбивается DeepSeek R1 (в родной интеграции сломался с начала февраля и так не ожил), спустя 11 дней (с 31 января) в лидеры вновь выбивается OpenAI с моделью o3-mini, но продержался лишь о 18 февраля, когда вышел прорывной Grok 3, следующее обновление топовой LLM было 25 марта, когда вышел Gemini 2.5 Pro, а с 16 апреля OpenAI вновь навела порядок, выпустив o4-mini и o3 в общий доступ.

Таким образом, менее, чем за три месяца было пять (!) обновлений лидирующих LLM и еще две попытки приблизиться в ТОП со стороны Llama 4 и Claude Sonnet 3.7.

Кстати, следует отметить, что OpenAI o3 была доступна с 2 февраля, но за 200 долларов, которая заменила o1 Pro, будучи флагманской моделью в декабре-январе, а теперь o3 в общем доступе и она сильнее o1 Pro. Точнее правильнее отметить, что o3 была в составе Deep Research агентов, а не напрямую, а с 16 апреля доступна напрямую.

Другими словами, пользователи за обычную подписку всего за три месяца получили более мощную модель (o3), чем имели подписчики за 200 баксов (o1 Pro) – вот, что делает конкуренция.

Любопытное наблюдение, OpenAI за всю историю существования LLM упустила лидерство всего на 3 недели, когда доминировала Gemini 2.5 Pro, тогда как в середине января китайцы (DeepSeek R1) лишь приблизились к лидерству, но не сформировали преимущество и тем более отрыв, как и Claude 3.5 Sonnet в середине 2024 приблизился к ChatGPT 4o, но не закрепил лидерство.

Не будь релиза от Google, вероятно не было бы общем доступе ни o3, ни o4-mini, т.е. именно конкуренция заставляет Альтмана шевелиться.

Не получится сделать обзор на каждую LLM – слишком долго и сложно, тем более все меняется быстро и обзоры быстро устареют.

Приведу список лидирующих LLM на утро 20 апреля 2025 (завтра все опять может измениться): OpenAI o3 и рядом с ней o4-mini, на втором месте – Google Gemini 2.5 Pro, на третьем месте – Grok 3 Thinking, на четвертом месте – DeepSeek R1 и следом Claude 3.7 Sonnet Thinking.

Это все рассуждающие модели.

Среди» обычных» моделей: лидером является Gemini 2.5 Flash, второе место – ChatGPT 4.1, третье место – DeepSeek V3 (мартовское обновление), четвертое место – Grok 3, пятое место – Llama 4 Maverick и вместе с ним рядом Claude 3.7 Sonnet.

Кстати, распиаренный и самый дорогой в мире (кратно дороже конкурентов) ChatGPT 4.5 на уровне Grok 3 и даже слабее ChatGPT 4.1, а обновление в конце марта обычно ChatGPT 4o вывело его немного выше Claude 3.7 Sonnet.

Все остальные – не тянут, поэтому даже нет смысла рассматривать. Поэтому в уме нужно держать вот этот список ТОП-5 лучших моделей.

Разбор технических характеристик и преимуществ каждой из модели потребует серию материалов, но кратко выделю самое важное:

• Gemini 2.5 Flash – непревзойденное соотношение цены и качества, вне конкуренции.

• Llama 4- сверхбольшое (10 млн токенов) контекстное окно, что позволяет классифицировать и резюмировать большие массивы информации.

• OpenAI o3 – сильно прокаченное рассуждение в сложных задачах, полноценная работа с Python-интерпретатором, веб-поиском и файлами.

• OpenAI o4 mini – прокаченная мультимодальность, особенно со сложными изображениями и сценами.

• ChatGPT 4.1 – стабильность на широком контексте (1 млн токенов) и более точное следование инструкциям.

Источник: t.me



		Рейтинг ведущих LLM
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2025-04-21 12:01 ИИ проекты Сложно разобраться во всем этом зоопарке бесчисленных LLMs, выходящих в среднем раз в полмесяца. Даже отраслевые специалисты путаются в этом многообразии, что уж говорить про обычных людей? Следить за инновациями становится все сложнее, а тестировать – тем более. Конкуренция феноменальная, а темпы инноваций – ошеломляющие. С апреля 2023 по сентябрь 2024 (1.5 года!) на рынке текстовых LLM не было значимых релизов и инноваций, только косметические модификации ChatGPT 4, все остальные лишь сокращали отставание от OpenAI. Индустрия проснулась с сентября 2024, когда OpenAI внедрила рассуждающую o1, а взрывной рост начался с января 2025. Напомню ротацию лидеров. С середины декабря самой мощной моделью на рынке была OpenAI o1, с 20 января 2025 достойную конкуренцию o1, а в некоторых задачах в лидеры выбивается DeepSeek R1 (в родной интеграции сломался с начала февраля и так не ожил), спустя 11 дней (с 31 января) в лидеры вновь выбивается OpenAI с моделью o3-mini, но продержался лишь о 18 февраля, когда вышел прорывной Grok 3, следующее обновление топовой LLM было 25 марта, когда вышел Gemini 2.5 Pro, а с 16 апреля OpenAI вновь навела порядок, выпустив o4-mini и o3 в общий доступ. Таким образом, менее, чем за три месяца было пять (!) обновлений лидирующих LLM и еще две попытки приблизиться в ТОП со стороны Llama 4 и Claude Sonnet 3.7. Кстати, следует отметить, что OpenAI o3 была доступна с 2 февраля, но за 200 долларов, которая заменила o1 Pro, будучи флагманской моделью в декабре-январе, а теперь o3 в общем доступе и она сильнее o1 Pro. Точнее правильнее отметить, что o3 была в составе Deep Research агентов, а не напрямую, а с 16 апреля доступна напрямую. Другими словами, пользователи за обычную подписку всего за три месяца получили более мощную модель (o3), чем имели подписчики за 200 баксов (o1 Pro) – вот, что делает конкуренция. Любопытное наблюдение, OpenAI за всю историю существования LLM упустила лидерство всего на 3 недели, когда доминировала Gemini 2.5 Pro, тогда как в середине января китайцы (DeepSeek R1) лишь приблизились к лидерству, но не сформировали преимущество и тем более отрыв, как и Claude 3.5 Sonnet в середине 2024 приблизился к ChatGPT 4o, но не закрепил лидерство. Не будь релиза от Google, вероятно не было бы общем доступе ни o3, ни o4-mini, т.е. именно конкуренция заставляет Альтмана шевелиться. Не получится сделать обзор на каждую LLM – слишком долго и сложно, тем более все меняется быстро и обзоры быстро устареют. Приведу список лидирующих LLM на утро 20 апреля 2025 (завтра все опять может измениться): OpenAI o3 и рядом с ней o4-mini, на втором месте – Google Gemini 2.5 Pro, на третьем месте – Grok 3 Thinking, на четвертом месте – DeepSeek R1 и следом Claude 3.7 Sonnet Thinking. Это все рассуждающие модели. Среди» обычных» моделей: лидером является Gemini 2.5 Flash, второе место – ChatGPT 4.1, третье место – DeepSeek V3 (мартовское обновление), четвертое место – Grok 3, пятое место – Llama 4 Maverick и вместе с ним рядом Claude 3.7 Sonnet. Кстати, распиаренный и самый дорогой в мире (кратно дороже конкурентов) ChatGPT 4.5 на уровне Grok 3 и даже слабее ChatGPT 4.1, а обновление в конце марта обычно ChatGPT 4o вывело его немного выше Claude 3.7 Sonnet. Все остальные – не тянут, поэтому даже нет смысла рассматривать. Поэтому в уме нужно держать вот этот список ТОП-5 лучших моделей. Разбор технических характеристик и преимуществ каждой из модели потребует серию материалов, но кратко выделю самое важное: • Gemini 2.5 Flash – непревзойденное соотношение цены и качества, вне конкуренции. • Llama 4- сверхбольшое (10 млн токенов) контекстное окно, что позволяет классифицировать и резюмировать большие массивы информации. • OpenAI o3 – сильно прокаченное рассуждение в сложных задачах, полноценная работа с Python-интерпретатором, веб-поиском и файлами. • OpenAI o4 mini – прокаченная мультимодальность, особенно со сложными изображениями и сценами. • ChatGPT 4.1 – стабильность на широком контексте (1 млн токенов) и более точное следование инструкциям. Источник: t.me Комментарии:

Рейтинг ведущих LLM

Комментарии: