Amazon научил ИИ-агентов эволюционировать: фреймворк A-Evolve поднимает результаты без ручной настройки |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-04-05 15:06 Исследователи Amazon и Университета Пенсильвании выпустили open-source фреймворк A-Evolve, который превращает базового ИИ-агента в топового — автоматически, без ручной настройки. Система берет обычного агента на любой LLM, итеративно модифицирует его промпты, скиллы, память и инструменты, прогоняет через бенчмарки и сохраняет только те изменения, которые улучшают результат. Авторы называют это "моментом PyTorch для самоэволюции ИИ". Идея проста: агенты после деплоя деградируют, потому что мир меняется, а они — нет. Дообучение и ручная подстройка промптов не масштабируются. A-Evolve предлагает третий путь — агентную эволюцию, когда за улучшение агента отвечает отдельный «агент-эволюционер». Он анализирует ошибки, модифицирует рабочую папку агента (промпты, скиллы, память, инструменты), запускает тесты, а каждую мутацию фиксирует через git для воспроизводимости. Подход описан в статье Position: Agentic Evolution is the Path to Evolving LLMs, опубликованной в конце января 2026 года. Результаты получены с агентом на базе Claude Opus 4.6. На бенчмарке MCP-Atlas эволюция дала 79,4% — первое место в общем рейтинге и +3,4 п.п. к тому же агенту без эволюции. На SWE-bench Verified — 76,8% (+2,6 п.п.), примерно пятая позиция. На Terminal-Bench 2.0 прирост составил 13 п.п. (с 63,5% до 76,5%), а на SkillsBench — 15,2 п.п. (с 19,7% до 34,9%). При этом для запуска достаточно трёх строк кода на Python, а весь процесс эволюции происходит без участия человека. Фреймворк построен по принципу "принеси свое": свой агент (BYOA), свою среду (BYOE), свой алгоритм эволюции (BYO-Algo). Рабочее пространство агента — обычная папка с файлами: manifest.yaml, промпты, скиллы, память, инструменты. Движок мутирует файлы — и всt. A-Evolve поддерживает LLM от Anthropic, OpenAI и Amazon Bedrock, а бенчмарки включают SWE-bench, MCP-Atlas, Terminal-Bench и SkillsBench. P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны. Телеграм: t.me/ainewsline Источник: habr.com Комментарии: |
|