Imagining the Unthinkable: Simulations Without Classical Monte Carlo

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Можно ли заменить традиционные Монте-Карло симуляции в физике элементарных частиц нейронными сетями?

Этот вопрос очень серьезно обсуждается в сообществе. Современные эксперименты физики высоких энергий невозможны без компьютерных симуляции столкновений и "прохождения" рожденных частиц через смоделированный детектор. Данный процесс проводится с использованием, так называемых, Монте-Карло генераторов столкновений, которые моделируют множество независимых взаимодействий со случайными параметрами, тем самым повторяя эксперимент. Результаты моделирования используются, как для сравнения данных с моделями (заложенными внутри генератора), так и для коррекций на различные неэффективности детекторов.

Проблема в том, что Монте-Карло симуляции чрезвычайно ресурсозатратные, и сейчас большая часть мощностей мировой вычислительно сети LHC-Грид уходит именно на производство новых симуляций. Но вы же помните, что БАК через 10 лет будет производить в 10 раз больше данных в год? Значит нам потребуется как минимум в 10 раз больше симуляций.

Но, может быть, мы можем заменить такие симуляции обученными нейронными сетями, которыми смогли бы предсказывать результаты Монте-Карло генераторов?

Ускорение моделирования Монте-Карло представляет интерес, потому что такое моделирование требует больших вычислительных ресурсов для запуска. Что, если мы могли бы значительно ускорить процесс, но все же иметь результаты, которые сделали, а также сегодняшние классические модели Монте-Карло?

Это на уме ряда ученых-исследователей. Их мысли? Урожай гибкость современной компьютерной системы с новым применением машинного обучения. Идея сводится к замене компьютерно управляемого поведения на изученное поведение. Другие исследователи изучают варианты, которые используют производительность обученной нейронной сети, но все еще соединяются с оригинальным симулятором, чтобы предложить интерпретируемость, недоступную только из нейронной сети.

Зачем смещать Монте-Карло?

Моделирование-критическое для анализа данных-потребляет огромное количество вычислений с помощью моделирования Монте-Карло. София Валлекорса из ЦЕРНА объяснила свою мотивацию в изучении возможности смещения классических моделей Монте-Карло, объяснив, что половина вычислений в глобальной вычислительной сетке LHC (WLCG-глобальное сотрудничество более 170 вычислительных центров в 42 странах) используется для моделирования.

Будущие планы по модернизации LHC CERN (большого адронного коллайдера-крупнейшего в мире ускорителя частиц) значительно увеличат количество столкновений частиц, а это означает, что важно исследовать новые структуры likethis и оценить их потенциал в обеспечении того, чтобы скорости передачи данных оставались управляемыми.

Может ли обученная нейронная сеть вытеснить моделирование Монте-Карло?

Основываясь на предыдущей работе, команда исследователей из CERN, SURFsara и Intel сосредоточилась на возможности использования двигателей глубокого обучения для быстрого моделирования. Эти натренированы используя первоначально имитаторы Monte Carlo, но после этого делают фактическую имитацию без использовать классические имитаторы Monte Carlo на всех. Эта работа ведется в рамках проекта в том, что известно как в CERN openlab, уникальный государственно-частного партнерства между ЦЕРН и ведущих ИКТ-компаний.

Команда работала над новым способом моделирования детектора в надежде, что он окажется быстрее, чем существующие методы моделирования. Моделирование детекторов позволяет ученым понять, как конструкции влияют на измерения и физику. Они могут использовать эту информацию для понимания неэффективности и неточностей в своем оборудовании. Самое главное, моделирование позволяет проводить сравнения между реальными данными и теорией, а затем делать выводы об изучаемой физике.

Команда изучает использование глубокого обучения для быстрого моделирования. Подход эффективно инкапсулирует дорогие вычисления в нейронную сеть с помощью обучения, а затем способен извлекать-через бесплодие (используя сеть) - результат гораздо быстрее, чем стандартные алгоритмические подходы классического моделирования Монте-Карло. Команда также изучает, насколько точность может быть сохранена, демонстрируя гораздо более высокую производительность. Первые результаты сообщает Команда моделирования калориметра для предлагаемой деятельности (Компактный Линейный коллайдер) акселератор-используя условную генеративную состязательную сеть (GAN) — очень хорошо сравнил с результатами моделирования Монте-Карло, используя только часть вычислительных ресурсов.

Имитируемый детектор имеет 3D-выход, который они называют "душем".” Классические "Монте-Карло" (сайт Geant4 - инструментарий для моделирования прохождения образующихся частиц через детекторы) способна моделировать душем всего за 17 секунд, тогда как обученной модели (3Д-Ган), выдает результат в размере около 7 мс/душ — работает на том же Xeon от Intel платины 8180 процессор-аппаратные. Конечно, важно отметить, что это сравнение не включает время, необходимое для подготовки GAN.

Кроме того, команда смогла перевести свою работу в распределенную систему. Их работает на КТПС Stampede2 кластера (два сокета Intel процессоры Xeon 8160 с Intel Omni-пути архитектуре) выставлены 94% масштабирования эффективности на 128 узлов при сохранении точности. Результаты с осторожностью называются “очень многообещающими с точки зрения физики” исследователями, поскольку они продолжают изучать свои бары ошибок и искать, чтобы понять, как их уменьшить. Они также планируют рассмотреть, как модель будет обобщаться на другие виды использования.

Почему это работает?

Недавно, после завершения разговора, где они представили свои работы, стипендиат ученого в аудитории отметили, что моделирование методом Монте-Карло предполагает сложных вычислений, требует рекурсии, проектирование выборки, и другие вещи, которые не представимо в нейронной сети. Итак, обращаясь к выходу 3D-GANs, он спросил: "Почему это работает?“После небольшого смеха умер, София Вальекорса ЦЕРНА сказала: "честно говоря, мы не знаем (пока)."Она продолжила объяснять, что обученная сеть, очевидно, узнала результаты, которые она подвергалась в обучении, и эффективно нашла более быстрый способ приблизить их выход, не делая все те же расчеты. Валлекорса описал 3D-выходы как "гораздо более размытые", чем результаты фактического моделирования. Это” просто изучение результатов", а не алгоритм Монте-Карло.Я не могу не думать, что если бы это сделал человек, мы бы просто сказали, что они были хороши в " притворстве.” Ну, притворяешься “очень, очень, очень хорошо” с учетом ошибок баров, которые были представлены!

Вы можете добавить интерпретируемость?

Комментарий, что "мы еще не знаем", как это работает, является общим наблюдением о любой обученной нейронной сети. Понятие "интерпретируемости" - это понятие, которое обсуждается и исследуется во многом.

Обеспокоенные этой точной проблемой, группа исследователей и ученых в Оксфорде, университете Британской Колумбии, нью-йоркском университете, LBNL, университете Льежа и Intel изучают вероятностную компиляцию и Способ подключения оригинального симулятора с двигателем бесплодия для получения степеней интерпретируемости. Они разделяют, что физические науки могут извлечь большую пользу из интерпретируемости — например, они могут дать возможность проверять аспекты процессов, закодированных в моделировании, такие как цепь распадов частиц и взаимодействий внутри детектора, которые привели к предсказаниям.Они утверждают, что такая возможность не возможного в умозаключение методы, которые не имеют доступа к тренажеру, например, на основе нейронных сетей.

В опубликованных результатах они выделили использование вероятностного программирования для управления современным генератором событий Монте-Карло высокоэнергетических реакций частиц (SHERPA1), который обычно используется с geant4. "Эффективность вывода" достигается путем компиляции вывода. Компиляция вывода-это метод для выполнения быстрого повторного вывода с использованием глубоких нейронных сетей для параметризации распределений предложений, существенно вытесняющих Монте-Карло!Дополнительным поворотом в поисках интерпретируемости является использование нейронных сетей для управления оригинальным симулятором для достижения полезных результатов при доле вычислительной стоимости выборки марковской цепи Монте-Карло. Авторы утверждают, что их подход легко масштабируется до более сложных событий и полных имитаторов детектора, прокладывая путь к его использованию в открытии новой фундаментальной физики.[второй] чтобы узнать больше, читайте в статье “эффективные вероятностные умозаключения в поисках физики за пределами Стандартной модели.

Одним из инструментов их доля составляет pyprob, а PyTorch-библиотеку для вероятностного программирования и вывода, обобщения, описывается создателями как исследовательский прототип в стадии альфа-тестирования. Основное внимание в библиотеке уделяется связыванию существующих кодовых баз моделирования с вероятностным выводом с минимальным вмешательством. Как упоминалось в их работе, один из их вывод двигателей для Марков цепи Монте-Карло.

Возможен ли постмодернистский мир Монте-Карло?

Степень, в которой классическое моделирование Монте-Карло может быть заменено, будет во многом зависеть от того, насколько хорошо новые методы доверяются. Как и большая часть машинного обучения, обученное поведение, похоже, работает, но точно, как оно работает, сложнее интерпретировать. Без четкого понимания того, как это работает, трудно иметь уверенное понимание его значения, потенциальных недостатков или режимов сбоя. Это вызывает особый интерес к интерпретируемости, которую изучают исследователи.Учитывая потенциальный золотой рудник с точки зрения повышения производительности, разумно предположить, что этот способ мышления увидит некоторое принятие в использовании добычи. Будет ли это доказывать конкурентное преимущество или Ахиллесова пята, определит будущую судьбу этого нового подхода, чтобы наученное поведение заменило поведение, основанное на вычислениях. Если это продуктивно, какие другие сложные вычисления могут быть смещены изученным поведением? Это действительно интересный вопрос.


Источник: www.rdmag.com

Комментарии: