Максим Федоров: «Универсальность концепции математического моделирования позволяет охватить самые разные области науки и техники»

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Математическое моделирование позволяет решать множество задач — от проектирования умного города до разработки лекарств. Какие знания нужны специалистам по вычислительным методам, как развиваются суперкомпьютерные вычисления и как математическое моделирование поможет решить демографические проблемы — рассказывает директор Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами данных, руководитель магистерских программ «Вычислительные системы в науке и технике» и «Наука о данных» Максим Федоров.

___

Суперкомпьютеры используются для моделирования процессов и явлений, которые не описываются аналитическими формулами. В основе расчета, производимого на суперкомпьютере, практически всегда лежит вычислительный метод. Эффективность вычислительного метода, в свою очередь, зависит от архитектуры вычислительных систем («железа»), на которых он применяется.

Приведу несколько примеров. В 2000-е — начале 2010-х годов суперкомпьютеры в основном строились на базе CPU — Central Processing Unit, большинство методов было ориентировано именно на основные архитектуры CPU, а также на параллельные вычисления на CPU, которые объединены интеркоммуникацией в параллельную сеть. Однако параллельно развивались и набирали популярность GPU-устройства (Graphics Processing Unit) — графические карты. Их отличие в том, что на одном устройстве содержится много очень специализированных процессоров. Изначально они были заточены под обработку изображений. Потом выяснилось, что графические карты можно эффективно использовать в других вычислительных приложениях, в том числе в машинном обучении. С начала 2010-х годов массивно-параллельная архитектура GPU набирает популярность как в создании мощных вычислительных систем на базе десктопов, так и для «настоящих» суперкомпьютеров, в которых много GPU объединено в единое вычислительное поле. Поэтому сейчас много научных и инженерных компьютерных программ для математического моделирования переписывается на GPU.

Сегодня на переднем крае науки в области вычислительных систем находится разработка методов математического моделирования, рассчитанных для использования в принципиально новых вычислительных устройствах. Из них стоит упомянуть два направления. Во-первых, квантовые вычисления, для которых требуются принципиально новые методы, поскольку меняется сама концепция вычисления. Во-вторых, вычисления на оптических устройствах. Так, в феврале 2018 года на сайте ТОП500 была опубликована статья о стартапе из Кремниевой долины, который продемонстрировал работающий прототип оптического вычислителя для машинного обучения. Это вычислительное устройство, которое работает не на электронах, как стандартные полупроводниковые компьютерные процессоры, а на фотонах. Система полностью оптическая. В теории она работает быстрее и потребляет гораздо меньше электроэнергии, чем стандартные полупроводниковые устройства.

В Сколтехе эти методы также активно развиваются, особенно те, что заточены под квантовые вычисления. Недавно к нам присоединился профессор Джейкоб Биамонте, который активно работает над разработкой алгоритмической базы для квантовых компьютеров.

О применении вычислительных методов в естественных науках

Развитие науки и технологии сегодня идет в направлении миниатюризации. Вокруг нас множество приборов, работа которых основана на микро- и нанотехнологиях: смартфоны, ноутбуки, дисплеи и сенсоры. Соответственно, требуется все больше специалистов, которые могут мыслить на микроуровне и понимают процессы, происходящие на атомном и молекулярном уровнях.

Стоит отметить, что большинство экспериментальных методов, которые работают с такими масштабами, все-таки не дают прямой информации о структуре наносистем и структуре молекул, о процессах, происходящих в них. Например, атомно-силовая микроскопия является очень эффективным методом для изучения структуры вещества, однако все же этот метод основан на измерении силы, действующей на иглу атомно-силового микроскопа, а не непосредственно координат тех частиц или микроструктур, которые исследуются.

То же относится к другим методам структурного анализа, основанным на рассеянии рентгеновских лучей или пучков нейтронов на кристаллических структурах. В них измеряются интенсивности плотности рассеянных частиц, и для получения структурной информации данные надо расшифровать с помощью дополнительной математической обработки. Как правило, нужно проводить компьютерный анализ информации, получаемой с помощью экспериментальных методов, и проводить дополнительное моделирование изучаемых процессов, чтобы получить полную картину происходящего.

В этой связи методы математического моделирования набирают всю большую популярность и применяются во многих науках и технологиях, изучающих и использующих явления микромира. Они позволяют исследовать, визуализировать и объяснять процессы, происходящие на микронном, нано-, ангстремном и меньших уровнях.

Несмотря на популярность моделирования микро- и наноструктур, только этим область применения вычислительных систем не ограничивается (отмечу, что для моделирования больших ансамблей молекул и моделирования галактик используются примерно одни и те же вычислительные методы). Универсальность самой концепции математического моделирования позволяет охватить самые разные области науки и техники. В их числе — моделирование месторождений полезных ископаемых, сейсморазведка, аэрокосмические системы, моделирование городского движения и другие вопросы вычислительной урбанистики, начиная от перемещений горожан по городу и заканчивая непосредственным окружением внутри квартиры или рабочего помещения.

_

"О поиске и подготовке специалистов "

Современная междисциплинарность, с одной стороны, хороша, а с другой — часто является проблемой, потому что специалистов, которые могут успешно действовать в разных областях, не хватает. В математическое моделирование часто приходят специалисты, имеющие хорошую базу по прикладной математике, однако им не всегда хватает знаний по собственно предмету моделирования и, как правило, также нужно время для освоения современных вычислительных систем. Для создания успешных приложений необходимо понимать основы вычислительных архитектур, основы параллельного программирования, понимать, какие методы к какой архитектуре хорошо подходят, а какие — плохо.

Еще одна категория людей, которые часто начинают заниматься математическим моделированием, — это, наоборот, специалисты из предметных областей (например, социологи, которые решили заняться компьютерной урбанистикой). У таких людей обычно есть набор специфических знаний о предметной области, но им не хватает знаний о вычислительных методах и архитектурах.

Третья категория — специалисты по вычислительным архитектурам (инженеры-микроэлектронщики), а также IT-специалисты и специалисты по параллельному программированию. Но им может недоставать знаний о предметных областях и знания математики, ведь прикладной математике и алгоритмам моделирования в нужном объеме учат далеко не всех разработчиков.

Цель сколтеховской программы «Вычислительные системы в науке и технике» — синтез разных областей, и это настоящий вызов. Мы заведомо берем бакалавров с разной подготовкой, как правило, из трех групп, перечисленных выше: специалисты-математики, IT-специалисты и специалисты из предметной области (например, химики, инженеры или биологи). Наша цель — за два года научить их системному подходу к математическому моделированию и проектированию вычислительных систем нового поколения, которые позволят понимать, что они проектируют и как это будет использоваться. Это непростая задача, но очень важная: нехватка таких специалистов остро ощущается.

По своему опыту работы и визитов в различных учреждениях — Кембридже, Институте Макса Планка, суперкомпьютерной лаборатории в Юлихе, в шотландских суперкомпьютерных центрах, в университетах США, Японии и других стран — могу сказать, что везде мало разносторонне подготовленных специалистов. А те, что есть, ценятся очень дорого. В большинстве университетов продолжают готовить специалистов очень узкого профиля, а сегодня нужны разносторонне образованные люди, но с твердым фундаментом. Они должны хорошо понимать основные вещи в прикладной математике, в вычислительных системах и в предметной области. А дальнейшее развитие уже зависит от проектов, над которыми они работают.

_

"О нетривиальных задачах"

Одно из важных применений вычислительных методов в биомедицине — разработка лекарств. Но интересно, что задачи разработки лекарств во многом перекликаются с задачами, например, создания парфюмерии: поиск новых хорошо пахнущих соединений, сочетаемых между собой и нетоксичных, — это очень похоже на фармакологию. Рынок новой косметики становится с каждым годом все больше и уже сопоставим с рынком лекарств. Поэтому затраты на «умные» ароматы могут вполне оправдать себя. Искусственный интеллект умеет писать тексты, создавать изображения, писать музыку — почему бы ему не придумывать запахи?

Много потенциальных возможностей дают урбанистика и проектирование современного городского пространства. Здесь есть много задач, в которых суперкомпьютеры и математическое моделирование еще не используются на полную мощь, хотя они были бы очень полезны. Это и эргономика помещений, и интерьеры, и передвижения, и безбарьерный город. Большинство достижений в цифровой урбанистике сегодня связаны со сбором данных — их в последнее время появилось очень много в связи с развитием телекоммуникаций и сенсорных технологий. Анализом данных занимаются специалисты в науке о данных — Data Science. Моделирование могло бы использоваться в многомасштабных сценариях развития городов, оценках изменения городского пространства в целом и отдельных подсистем.

Кроме того, интересны задачи, связанные с демографией и оценкой изменения популяции. За последние пятьдесят лет демографические показатели нашей планеты сильно изменились. Продолжительность жизни растет во всем мире, в разных странах с разной скоростью, но растет практически везде, тогда как средний уровень рождаемости почти не меняется на протяжении ряда лет. По расчетам, через сто лет население планеты сильно увеличится, но детей — жителей планеты Земля в возрасте от 0 до 12 лет — будет столько же, сколько и сейчас, то есть примерно 2 миллиарда. Как это коренное изменение демографической структуры общества отразится на развитии нашей цивилизации, пока неясно: мы еще не сталкивались с таким явлением в массовом масштабе, и, соответственно, даже углубленный анализ исторических и современных данных не позволяет полностью ответить на целый ряд медицинских, социальных и экономических вопросов, связанных с этими изменениями.

Для такого рода приложений подразумевается, что мы должны не только собирать данные, но и на их основе моделировать различные сценарии развития будущего. И с учетом этих сценариев строить новые дома, планировать развитие инфраструктуры, вводить новые транспортные технологии с пониманием того, куда мы движемся и как новые технологии отразятся на окружающей среде.

_

"О концепции магистерской программы "

Магистерская программа «Вычислительные системы в науке и технике» позволяет подготовить универсальных специалистов в области суперкомпьютеров и математического моделирования, которые могут попробовать свои силы в самых разных областях. Эта магистерская программа очень самобытная. Она, на мой взгляд, наиболее самостоятельная и в то же время наиболее универсальная из тех, что есть в Сколтехе. Почему так? Основной упор в этой программе сделан на применение математического моделирования и разработку новых вычислительных методов (с использованием суперкомпьютеров), которые могут применяться в различных областях науки и техники — от разработки лекарств до разработки новых самолетов, от анализа нефтяных месторождений до моделирования кровотока.

Стоит отметить, что в настоящее время «суперкомпьютер — это совсем не страшно». Так, новые поколения GPU позволяют уже в формате стандартного десктопа получить вычислительную мощь, сравнимую с мощью нескольких «шкафов», набитых CPU-устройствами. Новые технологии программирования и проектирования вычислительных систем позволяют тратить минимальное время на рутинные операции, связанные с параллелизацией вычислений.

Меня часто спрашивают, в чем основное различие между двумя основными образовательными программами на базе нашего центра — «Науки о данных» и «Вычислительные системы в науке и технике». Основное концептуальное различие состоит в следующем: студенты, которые изучают науки о данных, в основном учатся анализировать контент, произведенный кем-то другим. Студенты, которые занимаются вычислительными системами, создают этот контент сами при помощи математического моделирования. Они создают модели, которые генерируют данные в большом количестве. Эти данные затем анализируются с помощью современных методов анализа данных и машинного обучения, поэтому эта программа также включает в себя соответствующие курсы.

В качестве примера синтеза математического моделирования и методов анализа больших массивов данных можно привести молекулярное моделирование с помощью методов молекулярной динамики, где только один прогон модели (например, молекулы белка в водном растворе биоактивных соединений) порождает терабайты файлов, которые содержат позиции и скорости молекул на разных временных отрезках. Такие методы могут использоваться в самых разных приложениях: от расчета факторов, влияющих на смачиваемость нефтесодержащего пласта, до изучения прохождения лекарственного соединения через клеточную мембрану.

Существует и активно развивается мировое сообщество суперкомпьютерных центров. Один из наших ключевых партнеров — Институт фон Неймана в Юлихе. Мы активно сотрудничаем с другими суперкомпьютерными центрами, в том числе расположенными в различных частях Шотландии. Универсальность приложений вычислительных методов позволяет нам поддерживать связи с партнерами в самых разных областях.

_

"Последние достижения "

Как уже говорилось выше, одно из последних достижений в области вычислительных систем — работающие прототипы оптических процессоров. Кроме того, уже доступны высокопроизводительные системы, основанные на так называемых тензорных ядрах, которые на несколько порядков эффективнее стандартных CPU-устройств для ряда задач, связанных с машинным обучением.

Большинство достижений последнего времени связаны с новыми процессорными архитектурами, которые позволяют, например, использовать мощные алгоритмы машинного обучения и моделирования на мобильных процессорах. Техника вокруг нас становится все умнее: мы можем доверить камере или мобильному телефону анализ изображений и действительности вокруг нас даже без отправления данных на удаленный сервер. Это главный тренд на ближайшие несколько лет. Процессоры становятся все мощнее и все больше специализируются на решениях конкретных задач. Отдельным важным вопросом остаются новые полупроводниковые системы, оптические вычисления и квантовые вычисления.

В Сколтехе группа Джейкоба Биамонте разрабатывает детальный прототип компьютера будущего, основанного на квантовых вычислениях. В 2017 году его группа опубликовала в Nature статью, в которой они показали принципиальную возможность использования квантового компьютера для машинного обучения. В моей научной группе мы работаем над рядом проектов по приложениям суперкомпьютерных технологий в биомедицине. Например, в 2017 году мы разработали вычислительную технологию для предсказания токсичности лекарственных соединений при помощи гибридного метода — совмещения математического моделирования и машинного обучения. Этот метод позволяет предсказывать токсичность лекарственных соединений с точностью, близкой к экспериментальной.

Максим Федоров

доктор химических наук, кандидат физико-математических наук, профессор, директор Центра по научным и инженерным вычислительным технологиям для задач с большими массивами данных Сколтеха

Источник "Постнаука"

Комментарии: