Эксклюзив: Почему китайские модели ИИ доминируют в проектах с открытым исходным кодом, в то время как западные лаборатории отходят на второй план? |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-02-10 11:11 Потому что западные лаборатории ИИ больше не хотят — или не могут — этого делать. Поскольку OpenAI, Anthropic и Google сталкиваются с растущим давлением с целью ограничения использования своих самых мощных моделей, китайские разработчики заполнили пробел в открытом исходном коде, создав ИИ, специально разработанный для нужд операторов: мощные модели, работающие на стандартном оборудовании. Новое исследование в области безопасности показывает, насколько основательно китайский ИИ захватил эту нишу. Исследование, опубликованное SentinelOne и Censys, в котором за 293 дня было проанализировано 175 000 уязвимых систем ИИ в 130 странах, показывает, что Qwen2 от Alibaba неизменно занимает второе место после Llama от Meta по количеству внедрений в мире. Что еще более показательно, китайская модель присутствует в 52% систем, работающих с несколькими моделями ИИ, что говорит о том, что она стала де-факто альтернативой Llama. «В течение следующих 12–18 месяцев мы ожидаем, что семейства моделей китайского происхождения будут играть все более важную роль в экосистеме LLM с открытым исходным кодом, особенно по мере того, как западные передовые лаборатории замедляют или ограничивают выпуск моделей с открытыми весами», — заявил Габриэль Бернадетт-Шапиро, ведущий научный сотрудник в области искусственного интеллекта в SentinelOne, в интервью TechForge Media's AI News . Эти данные появились в тот момент, когда OpenAI, Anthropic и Google сталкиваются с пристальным вниманием регулирующих органов, дополнительными затратами на проверку безопасности и коммерческими стимулами, подталкивающими их к выпуску продуктов с ограниченным доступом через API, а не к свободной публикации весов моделей. Контраст с китайскими разработчиками не может быть более разительным. Китайские лаборатории продемонстрировали то, что Бернадетт-Шапиро называет «готовностью публиковать большие, высококачественные весовые коэффициенты, специально оптимизированные для локального развертывания, квантования и стандартного оборудования». «На практике это упрощает их внедрение, эксплуатацию и интеграцию в периферийные и жилые помещения», — добавил он. Проще говоря: если вы исследователь или разработчик, желающий запустить мощный ИИ на собственном компьютере без огромного бюджета, китайские модели, такие как Qwen2, часто являются вашим лучшим — или единственным — вариантом. Сервис Qwen2 от Alibaba неизменно занимает второе место после Llama от Meta среди 175 000 открытых хостов по всему миру. Источник: SentinelOne/Censys Исследование показывает, что это доминирование не случайно. Qwen2 поддерживает то, что Бернадетт-Шапиро называет «нулевой волатильностью ранга» — он занимает второе место по всем методам измерения, которые исследовали ученые: общее количество наблюдений, уникальные хосты и количество дней с хостами. Нет никаких колебаний, никаких региональных различий, только стабильное глобальное распространение. Не менее показательной является и тенденция к совместному развертыванию. Когда операторы запускают несколько моделей ИИ на одной и той же системе — распространенная практика для сравнения или сегментации рабочих нагрузок — пара Llama и Qwen2 встречается на 40 694 хостах, что составляет 52% от всех развертываний в многоквартирных домах. Географическая концентрация подтверждает эту картину. В Китае на один только Пекин приходится 30% доступных хостов, а на Шанхай и Гуандун — еще 21%. В Соединенных Штатах на Вирджинию, отражающую плотность инфраструктуры AWS, приходится 18% хостов. Китай и США доминируют в распределении уязвимых хостов Ollama, при этом на Пекин приходится 30% китайских развертываний. Источник: SentinelOne/Censys «Если скорость выпуска, открытость и переносимость оборудования будут по-прежнему различаться между регионами, китайские модели, вероятно, станут стандартом для открытых развертываний, не из-за идеологии, а из-за доступности и прагматизма», — пояснила Бернадетт-Шапиро. Проблема управления Этот сдвиг создает то, что Бернадетт-Шапиро характеризует как «инверсию управления» — фундаментальное изменение распределения рисков и ответственности в сфере ИИ. В сервисах, размещаемых на платформах, таких как ChatGPT, одна компания контролирует всё: инфраструктуру, отслеживает использование, внедряет меры безопасности и может пресекать злоупотребления. В моделях с открытым исходным кодом контроль исчезает. Ответственность распределяется между тысячами сетей в 130 странах, а зависимость концентрируется на нескольких поставщиках моделей — всё чаще это китайские компании. 175 000 уязвимых хостов работают полностью вне систем управления, регулирующих коммерческие платформы искусственного интеллекта. Отсутствует централизованная аутентификация, ограничение скорости запросов, обнаружение злоупотреблений и, что особенно важно, функция аварийного отключения в случае обнаружения неправомерного использования. «После выпуска модели с открытыми весами удалить обучение по технике безопасности или охране труда становится элементарно», — отметила Бернадетт-Шапиро. «Лаборатории передовых разработок должны рассматривать выпуск моделей с открытыми весами как долгосрочные инфраструктурные артефакты». Основу активности обеспечивает постоянно действующая магистральная сеть из 23 000 хостов, демонстрирующая в среднем 87% времени безотказной работы. Это не любительские эксперименты — это работающие системы, обеспечивающие постоянную полезность и часто запускающие несколько моделей одновременно. Пожалуй, наиболее тревожным является тот факт, что от 16% до 19% инфраструктуры не удалось отнести ни к одному конкретному владельцу. «Даже если нам удастся доказать, что модель была использована в атаке, не существует хорошо налаженных механизмов для сообщения о злоупотреблениях», — сказала Бернадетт-Шапиро. Безопасность без ограждений Почти половина (48%) открытых хостов рекламируют «возможности вызова инструментов» — это означает, что они не просто генерируют текст. Они могут выполнять код, получать доступ к API и автономно взаимодействовать с внешними системами. «Текстовая модель может генерировать вредоносный контент, но модель вызова инструментов может действовать», — объяснила Бернадетт-Шапиро. «На неаутентифицированном сервере злоумышленнику не нужны вредоносные программы или учетные данные; ему достаточно простого запроса». Почти половина уязвимых хостов Ollama обладают возможностями вызова инструментов, позволяющих выполнять код и получать доступ к внешним системам. Источник: SentinelOne/Censys Наиболее рискованный сценарий связан с тем, что он называет «открытыми, поддерживаемыми инструментами конечными точками RAG или автоматизации, управляемыми удаленно в качестве уровня выполнения». Злоумышленник может просто попросить модель составить краткое изложение внутренних документов, извлечь ключи API из репозиториев кода или вызвать нижестоящие сервисы, к которым модель настроена для доступа. В сочетании с «мыслительными» моделями, оптимизированными для многошагового рассуждения (присутствующими на 26% хостов), система может автономно планировать сложные операции. Исследователи выявили по меньшей мере 201 хост, работающий в «нецензурированных» конфигурациях, которые явно удаляют защитные механизмы, хотя Бернадетт-Шапиро отмечает, что это представляет собой нижнюю границу. Другими словами, это не просто чат-боты — это системы искусственного интеллекта, способные выполнять действия, и половина из них не имеет защиты паролем. Что должны делать передовые лаборатории? Западным разработчикам ИИ, обеспокоенным сохранением влияния на траекторию развития технологии, Бернадетт-Шапиро рекомендует иной подход к выпуску моделей. «Передовые лаборатории не могут контролировать внедрение, но они могут формировать риски, которые они выпускают в мир», — сказал он. Это включает в себя «инвестирование в мониторинг после выпуска моделей внедрения и неправильного использования на уровне экосистемы», а не рассмотрение выпусков как разовых результатов исследований. Нынешняя модель управления предполагает централизованное развертывание с рассредоточенным доступом к исходным ресурсам — прямо противоположное тому, что происходит на самом деле. «Когда небольшое количество производственных линий доминирует в том, что работает на стандартном оборудовании, решения, принимаемые на исходных серверах, усиливаются повсюду», — объяснил он. «Стратегии управления должны учитывать эту инверсию». Однако признание требует прозрачности. В настоящее время большинство лабораторий, выпускающих модели с открытыми весами, не имеют систематического способа отслеживать, как они используются, где они развертываются или сохраняется ли обучение технике безопасности после количественной оценки и тонкой настройки. Прогноз на 12-18 месяцев Бернадетт-Шапиро ожидает, что открытый уровень будет «сохраняться и профессионализироваться», поскольку использование инструментов, агентов и многомодальных входных данных станет стандартными возможностями, а не исключениями. Временная часть будет продолжать развиваться по мере экспериментов энтузиастов, но основная инфраструктура станет более стабильной, более функциональной и сможет обрабатывать более конфиденциальные данные. Применение мер контроля останется неравномерным, поскольку развертывание VPS-серверов для частных лиц и небольших компаний не соответствует существующим механизмам управления. «Это не проблема неправильной конфигурации», — подчеркнул он. «Мы наблюдаем зарождение общедоступной, неуправляемой вычислительной среды для ИИ. Нет централизованного переключателя, который можно было бы включить». Геополитический аспект придает ситуации дополнительную актуальность. «Когда большая часть вычислительных мощностей в мире, использующих неконтролируемый ИИ, зависит от моделей, выпущенных несколькими незападными лабораториями, традиционные представления о влиянии, координации и реагировании после выпуска моделей ослабевают», — сказала Бернадетт-Шапиро. Для западных разработчиков и политиков это означает нечто очевидное: «Даже идеальное управление собственными платформами оказывает ограниченное влияние на реальные риски, если доминирующие возможности находятся в другом месте и распространяются через открытую, децентрализованную инфраструктуру». Экосистема ИИ с открытым исходным кодом глобализируется, но её центр тяжести решительно смещается на восток. Не за счёт какой-либо скоординированной стратегии, а благодаря практической экономической целесообразности: кто готов публиковать то, что действительно необходимо исследователям и операторам для локального запуска ИИ. 175 000 выявленных в этом исследовании носителей вируса — это лишь видимая поверхность той фундаментальной перестройки, которую западные политики только начинают осознавать, не говоря уже о том, чтобы решать эту проблему. Источник: vk.com Комментарии: |
|