Anthropic зафиксировала у Opus 4.6 опасную агентную активность |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-02-15 11:44 В свежем отчете о рисках саботажа компания раскрыла детали поведения Claude Opus 4.6. При тестировании в среде computer use ИИ проявлял излишнюю инициативу: отправлял несанкционированные письма и агрессивно пытался получить токены аутентификации без ведома оператора. Интересен выявленный феномен «answer thrashing». Во время обучения модель иногда впадала в циклы спутанных рассуждений: она вычисляла правильный ответ, но в итоговый вывод намеренно выдавала неверное значение. Также отмечены случаи, когда следуя цели быть максимально полезным, модель оказывала содействие в запросах по разработке химоружия. Несмотря на тревожные прецеденты, Anthropic оценивает риск как очень низкий и заверяет, что это побочный эффект: модель пыталась выполнить задачу любыми доступными средствами, что поддается корректировке через промпт-инжиниринг. anthropic.com OpenAI использует спецверсию ChatGPT для поиска источника слива инсайдов. Компания развернула модифицированную версию чат-бота для выявления источников внутренних утечек. Механизм работы прост, но эффективен: когда в прессе появляется утечка, служба безопасности загружает текст статьи в эту систему. Эта версия ChatGPT имеет расширенные права доступа и анализирует корпоративную переписку в Slack, электронную почту и внутренние документы. Нейросеть сопоставляет факты из утечки с цифровыми следами сотрудников и составляет список подозреваемых, имевших доступ к целевой информации. Пока неизвестно, был ли кто-то наказан по итогу работы этого алгоритма, техническая база для него есть. Недавно OpenAI анонсировала внутреннего ИИ-агента, который выполняет глубокий анализ корпоративных данных по запросам. theinformation.com Microsoft сокращает зависимость от OpenAI и обещает AGI к концу года. Глава Microsoft AI Мустафа Сулейман анонсировал курс на полную самодостаточность в сфере ИИ. Редмондский гигант переходит к агрессивной разработке собственной инфраструктуры и созданию моделей. Для достижения этой цели Microsoft выделяет беспрецедентные ресурсы: капитальные затраты в текущем финансовом году достигнут $140 млрд. Они пойдут на вычислительные мощности гигаваттного класса с целью создать корпоративный AGI. Ожидается, что модели Microsoft будут представлены в этом году, а в течение 18 месяцев эти технологии смогут автоматизировать значительную часть задач «белых воротничков». ft.com Xiaomi опубликовала VLA-модель Xiaomi-Robotics-0 для управления роботами. Робототехническая команда Xiaomi выложила в открытый доступ VLA-модель с 4,7 млрд параметров на базе Qwen3-VL-4B-Instruct. Система заняла первое место в бенчмарках LIBERO и CALVIN, обойдя 30 конкурентных решений. Фишка - в разделении зон ответственности. VLM обрабатывает инструкции и пространственную логику, а DiT отвечает за генерацию непрерывных действий. Такой подход устраняет задержки, вызывающие рывки при движении манипуляторов, а инференс возможен в реальном времени на потребительских GPU. В полевых тестах двурукий робот под управлением новой модели показал стабильную координацию при выполнении длительных задач. Веса модели и код опубликованы на GitHub и Hugging Face. xiaomi-robotics-0.github.io Илон Маск раскрыл планы объединенной xAI. Компания опубликовала 45-минутную запись общего собрания, где Маск обрисовал будущее ИИ-лаборатории. Визионерская часть стратегии включает строительство заводов на Луне и развертывание орбитальных дата-центров, которые смогут получать энергию напрямую от Солнца. Внутри xAI ждут структурные изменения, она разделяется на 4 команды: разработка Grok, создание систем для генерации кода, видеогенератор Imagine и Macrohard - проект полной компьютерной автоматизации. Последнее направление, название которого иронично обыгрывает Microsoft, ставит перед собой наиболее амбициозные цели. По словам Маска, системы Macrohard в будущем должны достичь уровня, позволяющего автономно проектировать ракетные двигатели. xAI в сети Х Источник: vk.com Комментарии: |
|