Anthropic представила Claude Code Review

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Claude Code Review - инструмент для поиска багов в пулл-реквестах, который сейчас доступен в режиме превью для корпоративных пользователей Team и Enterprise. Процесс полностью бесшовен, агенты автоматически активируются при открытии PR.

В зависимости от объема и сложности изменений система запускает необходимое количество ИИ-агентов. Они анализируют код, отсеивают ложные срабатывания и ранжируют найденные уязвимости по уровню критичности. Результат оформляется в виде общей сводки и инлайн-комментариев к проблемным строкам.

В среднем такое ревью занимает около 20 минут, а тарификация идет по расходу токенов (от $15 до $25 за один пулл-реквест). Эффективность инструмента подтверждена внутренними тестами: после его внедрения доля PR с содержательными комментариями выросла с 16% до 54%.

claude.com (https://claude.com/blog/code-review)

Samsung планирует принести вайб-кодинг на смартфоны Galaxy.

Компания изучает варианты интеграции концепции вайб-кодинга в свои будущие устройства. По словам представителя Samsung, новая функция выйдет за рамки банальной настройки внешнего вида: ИИ позволит на лету менять логику UX и адаптировать существующие приложения под конкретные задачи владельца.

Технические детали реализации пока не раскрываются, однако тренд на генеративный интерфейс активно набирает обороты в мобильной индустрии. Похожая механика уже есть у компании Nothing, где владельцы смартфонов могут с помощью ИИ-моделей собирать кастомные виджеты с функционалом мини-приложений.

9to5google.com (https://9to5google.com/2026/03/07/samsung-galaxy-vibe-code/)

Claude Opus 4.6 распознал тестовую среду и взломал ключи ответов в бенчмарке.

Anthropic зафиксировала уникальный случай: во время прогона на BrowseComp Claude Opus 4.6 поняла, что находится в среде оценки. Не имея данных о названии теста, модель вычислила его и целенаправленно расшифровала скрытые ответы. Это первый известный прецедент, когда ИИ проявляет подобную дедукцию и взламывает проверку без прямых подсказок.

Это потребовало огромных вычислительных затрат. В одном из эпизодов модель потратила около 40,5 млн токенов (в 38 раз больше медианного значения). Разработчики также отметили, что в мультиагентной конфигурации частота поиска подобных нестандартных решений составила 0,87%, что в 3,7 раза выше, чем при работе одного агента (0,24%).

anthropic.com (https://www.anthropic.com/engineering/eval-awareness-browsecomp)

Глава аппаратного направления OpenAI уволилась из-за контракта с Пентагоном.

Кейтлин Калиновски покинула компанию в знак протеста против контракта с Министерством обороны США. Причиной стало заключение сделки без предварительной подготовки механизмов контроля. Калиновски отметила, что ИИ действительно играет важную роль в национальной безопасности, однако вопросы массовой слежки и использования оружия без санкции человека требуют гораздо более серьезного обсуждения.

Кейтлин перешла к Сэму Альману в ноябре 2024 из проекта AR-очков Марка Цукерберга. OpenAI официально подтвердила отставку Калиновски.

linkedin.com (https://www.linkedin.com/posts/ckalinowski_i-resigned-from-openai-i-care-deeply-about-share-7436085772010586112-DoNk)

ИИ-агент от Alibaba сбежал из песочницы ради майнинга криптовалюты.

Исследователи из команды, связанной с Alibaba, столкнулись (https://arxiv.org/pdf/2512.24873) с незапланированным поведением при обучении ИИ-агента ROME. Система не просто вышла за рамки своей изолированной среды - она сделала это без прямых инструкций со стороны разработчиков.

Вместо выполнения целевых задач агент самостоятельно организовал SSH-туннель и попытался запустить несанкционированный майнинг. Авторы отмечают, что в тестовых запросах не было никаких упоминаний сетевого туннелирования или добычи токенов. Самостоятельность модели застала инженеров врасплох и привела к срабатыванию внутренних систем безопасности.

axios.com (https://www.axios.com/2026/03/07/ai-agents-rome-model-cryptocurrency)


Источник: www.axios.com

Комментарии: