Галлюцинации, промпт-инъекции и «отравленные» данные: какие угрозы ИИ впервые систематизировал Банк России |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-06-25 13:58 Появление Методических рекомендаций Банка России № 3-МР знаменует собой не только развитие подходов к обеспечению информационной безопасности, но и фактическое формирование новой модели управления технологическими рисками искусственного интеллекта. Если ранее основное внимание уделялось защите сетевой инфраструктуры, автоматизированных банковских систем, каналов передачи данных и средств криптографической защиты информации, то теперь самостоятельным объектом защиты становятся сами модели искусственного интеллекта, данные, на которых они обучаются, а также результаты их функционирования. Такой подход отражает общемировую тенденцию. Современные модели машинного обучения представляют собой не статичные программные продукты, а динамические системы, качество работы которых напрямую зависит от состояния обучающих данных, особенностей архитектуры модели, параметров обучения, характера пользовательских запросов и внешнего воздействия злоумышленников. Именно поэтому Банк России рассматривает информационную безопасность ИИ как самостоятельное направление управления операционной надежностью финансовой организации. От защиты инфраструктуры — к защите модели искусственного интеллекта Одним из наиболее значимых положений документа стало признание того, что объектом атаки может быть не только информационная система организации, но и непосредственно модель искусственного интеллекта. Воздействие может осуществляться:
По существу Банк России предлагает рассматривать систему искусственного интеллекта как самостоятельный объект защиты, имеющий собственный жизненный цикл и собственную модель угроз. Такой подход проходит через весь документ и последовательно раскрывается в приложениях, посвящённых этапам разработки, эксплуатации и сопровождения ИИ. Именно эта особенность отличает новые рекомендации от ранее действовавших документов по информационной безопасности. Банк России впервые систематизировал специфические угрозы технологий ИИ Одним из наиболее ценных элементов Методических рекомендаций является формирование перечня угроз, характерных исключительно для технологий искусственного интеллекта.
Важно отметить, что данный перечень сформирован не теоретически. Для каждой угрозы Банк России определяет: Именно такой риск-ориентированный подход постепенно становится международным стандартом регулирования систем искусственного интеллекта.
Особое внимание регулятор уделяет так называемому Data Poisoning — намеренному искажению обучающих данных. Достаточно добиться попадания в обучающий набор специально подготовленных данных. Например: Поэтому Банк России рекомендует реализовать целый комплекс защитных мероприятий.
Фактически речь идет о необходимости внедрения полноценного управления качеством данных как самостоятельного элемента системы информационной безопасности. Состязательные атаки становятся новой категорией киберугроз Еще несколько лет назад понятие состязательные атаки (adversarial attacks) встречалось преимущественно в научной литературе. Регулятор обращает внимание, что злоумышленник способен подготовить специальные входные данные, содержащие минимальные изменения, практически незаметные человеку, однако приводящие модель к полностью ошибочному выводу. Подобные атаки получили название состязательных. Например: Банк России рекомендует использовать специальные методы повышения устойчивости моделей к подобным воздействиям, включая состязательное обучение, ансамблевые модели, контроль аномалий входных данных и дополнительное тестирование после обучения. Промпт-инъекция выходит на уровень официального регулирования Одной из наиболее современных особенностей документа стало фактическое признание угрозы промпт-инъекции (Prompt Injection). Еще недавно подобные атаки обсуждались исключительно применительно к большим языковым моделям. Суть проблемы заключается в том, что злоумышленник формирует специальный запрос, заставляющий модель игнорировать первоначальные ограничения либо выполнять действия, не предусмотренные разработчиком.
В документе подобные угрозы рассматриваются в составе манипулирования поведением модели посредством вредоносных Для юридических подразделений это означает, что требования к внутреннему контролю должны распространяться не только на программный код, но и на процессы эксплуатации генеративных моделей. Кража модели становится самостоятельным объектом защиты Интересной особенностью Методических рекомендаций является признание риска так называемой модели кражи. Получив достаточный массив информации, злоумышленник может создать функционально близкую модель, практически не имея доступа к исходному программному коду. Речь может идти одновременно: Поэтому рекомендации Банка России предусматривают ограничение потоков запросов, мониторинг аномальной активности, регистрацию событий и использование механизмов контроля поведения модели. Инверсия модели создает риск раскрытия конфиденциальной информации Еще одной новой категорией угроз становится модели инверсии. Вместо этого анализируются ответы модели. Если модель обучалась на персональных данных либо коммерчески значимой информации, последствия могут оказаться весьма существенными.
По существу речь идет о распространении традиционных требований законодательства о персональных данных на весь цикл функционирования моделей искусственного интеллекта. Карта угроз становится обязательным элементом корпоративного управления Одной из наиболее практикоориентированных частей Методических рекомендаций является приложение, устанавливающее взаимосвязь между этапами жизненного цикла модели и возникающими угрозами.
Такой подход имеет важное практическое значение. Контроль необходим на всех этапах ее существования — начиная с формирования обучающих выборок и заканчивая последующим дообучением и сопровождением. Главный вывод второй части Методических рекомендаций Банка России заключается в том, что искусственный интеллект больше не рассматривается как обычное программное обеспечение. Регулятор фактически признает его самостоятельным объектом информационной безопасности, для которого требуется особая модель управления рисками, собственная система угроз и специализированные меры защиты. Именно поэтому организациям уже сегодня необходимо пересматривать существующие процессы управления информационной безопасностью, включая в них угрозы, характерные исключительно для технологий искусственного интеллекта. Такой подход позволит не только повысить уровень операционной надежности, но и сформировать доказательственную базу добросовестного поведения в случае проверок регулятора или судебных споров. В третьей части будет подробно рассмотрено, каким образом Банк России предлагает выстраивать систему защиты ИИ на уровне внутренних документов организации, какие требования предъявляются к политике информационной безопасности, каким должно быть распределение полномочий между подразделениями и почему вопросы безопасной разработки, использования открытого программного обеспечения, внешних ИИ-сервисов и проведения Red Team-тестирования становятся неотъемлемой частью корпоративного управления искусственным интеллектом. Телеграм: t.me/ainewsline Источник: alrf.ru Комментарии: |
|