Как искусственный интеллект меняет науку

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Последние алгоритмы ИИ исследуют эволюцию галактик, вычисляют квантовые волновые функции, открывают новые химические соединения и многое другое. Есть ли что-то, что ученые делают, что нельзя автоматизировать?

 

Ни один человек или группа людей не могли поспеть за лавиной информации, получаемой многими современными физическими и астрономическими экспериментами. Некоторые из них записывают терабайты данных каждый день — и поток только увеличивается. Квадратный километраж, радиотелескоп, который планируется включить в середине 2020-х годов, будет генерировать примерно столько же трафика данных в год, сколько весь интернет.

У наводнения есть много ученых, обращающихся к искусственному интеллекту за помощью. При минимальном вмешательстве человека системы искусственного интеллекта, такие как искусственные нейронные сети — компьютерные сети нейронов, имитирующие функцию мозга, — могут пахать сквозь горы данных, выделяя аномалии и обнаруживая паттерны, которые люди никогда не могли бы обнаружить.

Конечно, использование компьютеров для помощи в научных исследованиях насчитывает около 75 лет, а метод ручного переноса данных в поисках значимых закономерностей появился тысячелетиями ранее. Но некоторые ученые утверждают, что новейшие методы машинного обучения и искусственного интеллекта представляют собой принципиально новый способ ведения науки. Один из таких подходов, известный как генеративное моделирование, может помочь выявить наиболее правдоподобную теорию среди конкурирующих объяснений данных наблюдений, основываясь исключительно на данных, и, что важно, без каких-либо заранее запрограммированных знаний о том, какие физические процессы могут происходить в исследуемой системе. , Сторонники генеративного моделирования считают его достаточно новым, чтобы его можно было считать потенциальным «третьим способом» изучения вселенной.

Традиционно мы узнали о природе через наблюдение. Подумайте о том, как Иоганн Кеплер рассматривает таблицы планетарных позиций Тихо Браге и пытается определить основную закономерность. (В конце концов он пришел к выводу, что планеты движутся по эллиптическим орбитам.) Наука также продвинулась через моделирование. Астроном может смоделировать движение Млечного Пути и соседней галактики Андромеды и предсказать, что они столкнутся через несколько миллиардов лет. И наблюдение, и моделирование помогают ученым генерировать гипотезы, которые затем можно проверить с помощью дальнейших наблюдений. Генеративное моделирование отличается от обоих этих подходов.

«Это в основном третий подход, между наблюдением и моделированием», — говорит Кевин Шавински , астрофизик и один из самых восторженных сторонников генеративного моделирования, который до недавнего времени работал в Швейцарском федеральном технологическом институте в Цюрихе (ETH Zurich). «Это другой способ решения проблемы».

Некоторые ученые рассматривают генеративное моделирование и другие новые методы просто как мощные инструменты для ведения традиционной науки. Но большинство согласны с тем, что ИИ оказывает огромное влияние, и что его роль в науке будет только расти. Брайан Норд , астрофизик из Национальной ускорительной лаборатории Ферми, который использует искусственные нейронные сети для изучения космоса, относится к числу тех, кто боится, что ученый-человек ничего не сделает, что будет невозможно автоматизировать. «Это немного пугающая мысль», — сказал он.

Открытие поколением

С момента окончания школы, Schawinski делает себе имя в науке, управляемой данными. Работая над докторской диссертацией, он столкнулся с задачей классификации тысяч галактик по их внешнему виду. Поскольку для этой работы не было легкодоступного программного обеспечения, он решил краудсорсировать его, и так родился научный проект Галактического зоопарка. Начиная с 2007 года обычные пользователи компьютеров помогали астрономам, записывая свои лучшие предположения относительно того, к какой категории относится галактика, причем правило большинства обычно приводит к правильной классификации. Проект был успешным, но, как отмечает Шавинский, ИИ сделал его устаревшим: «Сегодня талантливый ученый, имеющий опыт в машинном обучении и доступ к облачным вычислениям, может сделать все это за день».

Ученые разработали «клетки-терминаторы» для уничтожения опухолей мозга

Шавинский обратился к мощному новому инструменту генеративного моделирования в 2016 году. По сути, генеративное моделирование спрашивает, насколько вероятно, учитывая условие X, что вы увидите результат Y. Подход оказался невероятно мощным и универсальным. В качестве примера, предположим, что вы предоставляете генеративной модели набор изображений человеческих лиц, каждое из которых помечено по возрасту человека. Когда компьютерная программа прочесывает эти «тренировочные данные», она начинает устанавливать связь между лицами более старшего возраста и повышенной вероятностью появления морщин. В конечном итоге он может «состарить» любое лицо, которое ему дано, то есть он может предсказать, какие физические изменения могут произойти с данным лицом любого возраста.

Самыми известными системами генеративного моделирования являются «генеративные состязательные сети» (GAN). После адекватного доступа к данным тренировки, GAN может восстановить изображения с поврежденными или отсутствующими пикселями, или они могут сделать размытые фотографии четкими. Они учатся выводить недостающую информацию посредством конкуренции (отсюда и термин «состязательный»): одна часть сети, известная как генератор, генерирует поддельные данные, а вторая часть, дискриминатор, пытается отличить поддельные данные от реальные данные. По мере выполнения программы обе половины постепенно улучшаются. Возможно, вы видели некоторые из сверхреалистичных, созданных GAN «лиц», которые распространялись в последнее время, — образы «странно реалистичных людей, которых на самом деле не существует», как выразился один заголовок.

В более широком смысле, генеративное моделирование берет наборы данных (обычно изображения, но не всегда) и разбивает каждый из них на набор базовых, абстрактных строительных блоков — ученые называют это «скрытым пространством данных». Алгоритм манипулирует элементами скрытое пространство, чтобы увидеть, как это влияет на исходные данные, и это помогает раскрыть физические процессы, которые работают в системе.

Идея скрытого пространства абстрактна и ее трудно визуализировать, но в качестве грубой аналогии подумайте о том, что может делать ваш мозг, когда вы пытаетесь определить пол человеческого лица. Возможно, вы заметили прическу, форму носа и т. Д., А также узоры, которые вы не можете легко выразить словами. Компьютерная программа также ищет характерные черты среди данных: хотя она не имеет ни малейшего представления о том, что такое усы или пол, если она была обучена на наборах данных, в которых некоторые изображения помечены как «мужчина» или «женщина», и в которых у некоторых есть тег «усы», он быстро выведет соединение.

В опубликованной в декабре статье « Астрономия и астрофизика» Шавински и его коллеги из ETH Zurich Деннис Турп и Че Чжан использовали генеративное моделирование для исследования физических изменений, которые претерпевают галактики по мере их развития. (Используемое ими программное обеспечение трактует скрытое пространство несколько иначе, чем то, как его обрабатывает генеративная сеть соперников, поэтому технически оно не является ГАН, хотя и схожим.) Их модель создала искусственные наборы данных как способ проверки гипотез о физических процессах. Они спросили, например, как «гашение» звездообразования — резкое снижение скорости образования — связано с увеличением плотности среды галактики.

Для Шавинского ключевой вопрос заключается в том, сколько информации о звездных и галактических процессах можно извлечь из одних только данных. «Давайте стереть все, что мы знаем об астрофизике», — сказал он. «В какой степени мы можем заново открыть эти знания, просто используя сами данные?»

Следующий шаг, говорит Шавинский, еще не автоматизирован: «Я должен войти как человек и сказать:« Хорошо, какая физика могла бы объяснить этот эффект? ». Для рассматриваемого процесса есть два вероятных объяснения: возможно, галактики становятся более красными в средах с высокой плотностью, потому что они содержат больше пыли, или, возможно, они становятся более красными из-за снижения образования звезд (другими словами, их звезды, как правило, старше). С генеративной моделью, обе идеи могут быть проверены: элементы в скрытом пространстве, связанные с запыленностью и скоростью звездообразования, изменены, чтобы увидеть, как это влияет на цвет галактик. «И ответ ясен», — сказал Шавинский. Красные галактики «там, где упало звездообразование, а не те, где пыль изменилась. Поэтому мы должны поддержать это объяснение ».

 

 

Подход связан с традиционным моделированием, но с критическими отличиями. По словам Шавински, симуляция «в основном основана на предположениях». «Подход заключается в том, чтобы сказать:« Я думаю, что я знаю, каковы основные физические законы, которые дают начало всему, что я вижу в системе ». Итак, у меня есть рецепт звездообразования, у меня есть рецепт поведения темной материи и так далее. Я положил туда все свои гипотезы и позволил имитации работать. И затем я спрашиваю: похоже ли это на реальность? »То, что он сделал с генеративным моделированием, по его словам,« в некотором смысле совершенно противоположно моделированию. Мы ничего не знаем; мы не хотим ничего предполагать. Мы хотим, чтобы сами данные сообщали нам, что может происходить ».

Очевидный успех генеративного моделирования в подобном исследовании, очевидно, не означает, что астрономы и аспиранты были сокращены — но, похоже, это представляет сдвиг в степени, в которой обучение об астрофизических объектах и ??процессах может быть достигнуто искусственным система, которая имеет чуть больше электронных средств, чем огромный пул данных. «Это не полностью автоматизированная наука, но она демонстрирует, что мы способны хотя бы частично создать инструменты, которые делают процесс науки автоматизированным», — сказал Шавински.

Генеративное моделирование явно мощно, но действительно ли оно представляет новый подход к науке, открыто для обсуждения. Для Дэвида Хогга , космолога из Нью-Йоркского университета и Института Флэтайрон (который, как и Quanta , финансируется Фондом Саймонса), этот метод впечатляет, но в конечном итоге это просто очень сложный способ извлечения образцов из данных — это то, что астрономы имеют делал веками. Другими словами, это продвинутая форма наблюдения плюс анализ. Работа самого Хогга, как и работы Шавинского, в значительной степени опирается на ИИ; он использует нейронные сети, чтобы классифицировать звезды всоответствии с их спектрами и выводить другие физические характеристикизвезд с использованием управляемых данными моделей. Но он видит свою работу, как и работы Шавинского, как проверенную науку. «Я не думаю, что это третий путь», — сказал он недавно. «Я просто думаю, что мы, как сообщество, становимся все более изощренными в том, как мы используем данные. В частности, мы намного лучше сравниваем данные с данными. Но, на мой взгляд, моя работа все еще находится в режиме наблюдения ».

Трудолюбивые Помощники

Являются ли они концептуально новыми или нет, ясно, что ИИ и нейронные сети стали играть важную роль в современных исследованиях в области астрономии и физики. В Институте теоретических исследований Гейдельберга физик Кай Полстерервозглавляет группу астроинформатики — группу исследователей, сосредоточенных на новых, ориентированных на данные методах астрофизики. Недавно они использовали алгоритм машинного обучения для извлечения информации о красном смещении из наборов данных галактики , что ранее было трудной задачей.

Polsterer рассматривает эти новые системы на основе искусственного интеллекта как «трудолюбивых помощников», которые могут часами просматривать данные, не скучая и не жалуясь на условия работы. Эти системы могут выполнять всю утомительную работу, говорит он, оставляя вас «заниматься интересной, интересной наукой самостоятельно».

 

 

Но они не идеальны. В частности, предостерегает Polsterer, алгоритмы могут делать только то, что они были обучены. Система «независима» от ввода. Дайте ему галактику, и программное обеспечение сможет оценить его красное смещение и его возраст — но скормить этой же системе селфи или изображение гниющей рыбы, и для этого он также выведет (очень неправильный) возраст. В конце концов, контроль со стороны человека-ученого остается необходимым, сказал он. «Это возвращается к вам, исследователь. Вы — тот, кто отвечает за интерпретацию.

Со своей стороны, Норд, в Fermilab, предупреждает, что крайне важно, чтобы нейронные сети давали не только результаты, но и шкалы ошибок, чтобы сопровождать их, как это должен делать каждый студент. В науке, если вы проводите измерения и не сообщаете об оценке связанной ошибки, никто не воспримет результаты всерьез, сказал он.

Как и многие исследователи искусственного интеллекта, Норд также обеспокоен непроницаемостью результатов, получаемых нейронными сетями; часто система дает ответ без четкой картины того, как был получен этот результат.

Тем не менее, не все считают, что отсутствие прозрачности обязательно является проблемой. Ленка Здеборова , исследователь из Института теоретической физики в CEA Saclay во Франции, отмечает, что интуиция человека часто одинаково непроницаема. Вы смотрите на фотографию и сразу же узнаете кошку — «но вы не знаете, откуда вы это знаете», — сказала она. «Ваш собственный мозг в некотором смысле является черным ящиком».

Это не только астрофизики и космологи, которые мигрируют к искусственной науке, управляемой данными. Квантовые физики, такие как Роджер Мелко из Института теоретической физики Периметра и Университета Ватерлоо в Онтарио, использовали нейронные сети для решения некоторых из самых сложных и важных задач в этой области, таких как представление математической «волновой функции».описание системы многих частиц. ИИ важен из-за того, что Мелко называет «экспоненциальным проклятием размерности». То есть возможности для формы волновой функции растут экспоненциально с числом частиц в системе, которую она описывает. Сложность аналогична попытке выработать лучший ход в игре, такой как шахматы или го: вы пытаетесь заглянуть вперед к следующему ходу, представляя, что будет делать ваш противник, а затем выбираете лучший ответ, но с каждым ходом количество возможностей увеличивается.

Конечно, системы ИИ освоили обе эти игры — шахматы, десятилетия назад, и Го в 2016 году, когда система ИИ под названием AlphaGo победила одного из лучших игроков. По словам Мелко, они также подходят для задач квантовой физики.

Разум машины

Прав ли Шавински утверждать, что он нашел «третий способ» заниматься наукой, или, как говорит Хогг, это просто традиционные наблюдения и анализ данных «на стероидах», ясно, что ИИ меняет вкус научных открытий, и это конечно ускоряет это. Как далеко зайдет революция ИИ в науке?

Время от времени делаются большие заявления о достижениях «робо-ученого». Десять лет назад химик-робот по имени Адам исследовал геном пекарских дрожжей и выяснил, какие гены ответственны за производство определенных аминокислот. (Адам сделал это, наблюдая за штаммами дрожжей, у которых отсутствовали определенные гены, и сравнивая результаты с поведением штаммов с этими генами.)  Заголовок Wired гласил: « Робот сам делает научное открытие» .

Совсем недавно Ли Кронин, химик из Университета Глазго, использовал робота для случайного смешивания химикатов , чтобы увидеть, какие виды новых соединений образуются. Отслеживая реакции в реальном времени с помощью масс-спектрометра, аппарата ядерного магнитного резонанса и инфракрасного спектрометра, система в конечном итоге научилась предсказывать, какие комбинации будут наиболее реактивными. По словам Кронина, даже если это не приведет к дальнейшим открытиям, роботизированная система может позволить химикам ускорить свои исследования примерно на 90 процентов.

В прошлом году другая команда ученых из ETH Zurich использовала нейронные сети для определения физических законов из наборов данных. Их система, своего рода робо-кеплер, заново открыла гелиоцентрическую модель солнечной системы из записей положения Солнца и Марса на небе, как видно с Земли, и выяснила закон сохранения импульса, наблюдая сталкивающиеся шары. , Поскольку физические законы часто могут быть выражены более чем одним способом, исследователи задаются вопросом, может ли система предложить новые способы — возможно, более простые способы — мышления об известных законах.

Все это примеры того, как ИИ запускает процесс научного открытия, хотя в любом случае мы можем спорить о том, насколько революционным является новый подход. Возможно, наиболее спорным является вопрос о том, сколько информации можно почерпнуть из одних только данных — актуальный вопрос в эпоху колоссально больших (и растущих) груд данных. В Книге Почему(2018), ученый-компьютерщик Иудея Перл и писатель-научный сотрудник Дана Маккензи утверждают, что данные «глубоко тупые». Вопросы о причинности «никогда не могут быть даны ответом только на основе данных», пишут они. «Каждый раз, когда вы видите документ или исследование, в котором анализируются данные без модели, вы можете быть уверены, что результаты исследования просто суммируют и, возможно, преобразуют, но не интерпретируют данные». Шавинский сочувствует позиции Перл , но он описал идею работы с «одними данными» как «немного соломенного человека». Он никогда не утверждал, что выводит причину и следствие таким образом, сказал он. «Я просто говорю, что мы можем сделать больше с данными, чем мы обычно делаем».

Еще один часто встречающийся аргумент состоит в том, что наука требует творчества, и что — по крайней мере, пока — мы не знаем, как запрограммировать это в машину. (Простая попытка всего, как робот-химика Кронина, не кажется особенно креативной.) «Придумать теорию, рассуждать, я думаю, требует творчества», — сказал Полстерер. «Каждый раз, когда вам нужен творческий подход, вам понадобится человек». И откуда приходит творчество? Польстерер подозревает, что это связано со скукой — то, что, по его словам, машина не может испытать. «Чтобы быть креативным, тебе не должно быть скучно. И я не думаю, что компьютеру когда-нибудь будет скучно ». С другой стороны, такие слова, как« творческий »и« вдохновленный », часто использовались для описания таких программ, как Deep Blue и AlphaGo.

Schawinski недавно покинул академию для частного сектора; сейчас он руководит стартапом под названием Modulos, в котором работает ряд ученых из ETH, и, согласно его веб-сайту, он работает «на пороге бурного развития ИИ и машинного обучения». Какие бы ни были препятствия между современной технологией ИИ и полноценной искусственные умы, он и другие эксперты считают, что машины готовы выполнять все больше и больше работы ученых-людей. Есть ли предел еще предстоит выяснить.

«Удастся ли в обозримом будущем создать машину, которая сможет открывать физику или математику, которые самые яркие люди не могут сделать самостоятельно, используя биологическое оборудование?» — удивляется Шавинский. «Будет ли будущее науки неизбежно зависеть от машин, работающих на уровне, которого мы никогда не сможем достичь? Я не знаю. Это хороший вопрос.

 

 

Теги: ИИ, космос, нейроны, нейросеть


Источник: android-robot.com

Комментарии: