DoWhy: библиотека для причинного вывода от Microsoft

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2020-09-04 18:45

Философия ИИ

DoWhy — это библиотека для поиска причинно-следственных связей от Microsoft.

Сложности поиска причинно-следственных связей

Текущие методы поиска связей в данных представляют упрощенную версию каузального объяснения. Большинство моделей, которые пытаются искать причины в данных, опираются на эмпирический анализ. Чистый причинный вывод (causal inference) опирается на контрфактуальный анализ, который более близок к тому, как люди принимают решения.

Причинный вывод зависит от предсказания объектов, которые модель ранее не наблюдала. Это провоцирует фундаментальную проблему, которая заключается в том, что нельзя объективно оценить алгоритмы причинного вывода с помощью тестовой выборки. Проблема накладывает ограничения на процесс генерации данных. Традиционные методы машинного обучения закрывают глаза на фундаментальную проблему, что приводит к ограниченной обобщающей способности таких моделей.

Подробнее про библиотеку

Целевая задача моделируется как каузальный граф так, что бы все допущения были явно заданы. DoWhy предоставляет унифицированный интерфейс для популярных методах причинного вывода. Библиотека комбинирует два крупных фреймворка: графовые модели и потенциальные результаты (potential outcomes). DoWhy позволяет тестировать валидность допущений, если это возможно, и оценивает устойчивость предсказаний.

В DoWhy распознавание каузального эффекта и его оценка разделяются на две отдельные части. DoWhy моделирует проблему причинного вывода в воркфлоу, который состоит из четырех шагов: моделирование, распознавание, оценка и опровержение.

Визуализация воркфлоу в DoWhy

DoWhy-библиотека для причинного вывода

На протяжении десятилетий методы причинного вывода нашли широкое применение в социальных и биомедицинских науках. По мере того как вычислительные системы начинают вмешиваться в нашу работу и повседневную жизнь, вопросы причинно-следственных связей приобретают все большее значение и в информатике. Чтобы обеспечить широкое использование причинно-следственного вывода, мы рады объявить о создании новой библиотеки программного обеспечения DoWhy. Его название навеяно до-исчислением Джуди Перл для причинного вывода. В дополнение к предоставлению программного интерфейса для популярных методов причинного вывода, DoWhy предназначен для выделения критических, но часто игнорируемых допущений, лежащих в основе анализа причинного вывода. DoWhy делает это, сначала делая базовые предположения явными, например, явно представляя идентифицированные оценки. А во-вторых, делая анализ чувствительности и другие проверки надежности первоклассным элементом процесса причинного вывода. Наша цель состоит в том, чтобы дать людям возможность сосредоточить свои усилия на выявлении предпосылок для причинного вывода, а не на деталях оценки.

Наша мотивация для создания DoWhy исходит из нашего опыта в исследованиях причинного вывода за последние несколько лет, начиная от оценки влияния рекомендательной системы и заканчивая предсказанием вероятных результатов с учетом жизненного события. В каждом из этих исследований мы обнаружили, что повторяем общие шаги поиска правильной стратегии идентификации, разработки наиболее подходящего оценщика и проведения проверки надежности, все с нуля. Хотя мы были впечатлены—а иногда и напуганы—объемом знаний в литературе о причинных выводах, мы обнаружили, что выполнение любого эмпирического причинного вывода остается сложной задачей. Обеспечение того, чтобы мы понимали наши предположения и подтверждали их надлежащим образом, было особенно сложным. В более общем плане мы видим, что подход “свернуть свой собственный” к причинному выводу привел к исследованиям с различными (иногда минимальными) подходами к проверке ключевых предположений.

Поэтому мы задали себе вопрос: А что, если бы существовала библиотека программного обеспечения, обеспечивающая простой интерфейс для общих методов причинно-следственного вывода, кодифицирующих лучшие практики для рассуждения и проверки ключевых допущений? К сожалению, проблема заключается в том, что причинный вывод зависит от оценки ненаблюдаемых величин—также известной как “фундаментальная проблема” причинного вывода. В отличие от контролируемого обучения, такие контрфактические количественные показатели подразумевают, что мы не можем получить чисто объективную оценку с помощью отложенного набора тестов, таким образом, исключая подключаемый подход к причинно-следственному выводу. Например, для любого вмешательства—такого как новый алгоритм или медицинская процедура—можно либо наблюдать, что происходит, когда люди получают вмешательство, либо когда они его не получают. Но никогда и то, и другое. Таким образом, причинно-следственный анализ критически зависит от предположений о процессе генерирования данных.

Чтобы добиться успеха, нам стало ясно, что предположения должны быть первоклассными гражданами в библиотеке причинных выводов. Мы разработали DoWhy, используя два руководящих принципа-сделать причинно-следственные предположения явными и проверить устойчивость оценок к нарушениям этих предположений. Во-первых, Дауи проводит различие между идентификацией и оценкой. Идентификация причинно-следственного эффекта предполагает принятие допущений о процессе генерации данных и переход от контрфактических выражений к определению целевой оценки, в то время как оценка-это чисто статистическая задача оценки целевой оценки по данным. Таким образом, идентификация-это место, где библиотека проводит большую часть своего времени, точно так же, как мы обычно делаем в наших проектах. Чтобы представить предположения формально, DoWhy использует структуру Байесовской графической модели, где пользователи могут указать, что они знают, и, что более важно, чего они не знают, о процессе генерации данных. Для оценки мы предлагаем методы, основанные на структуре потенциальных результатов, такие как сопоставление, стратификация и инструментальные переменные. Счастливый побочный эффект использования DoWhy заключается в том, что вы поймете эквивалентность и совместимость кажущейся несвязной графической модели и потенциальных рамок результатов.

Рисунок 1-Дауи. Разделение идентификации и оценки причинно-следственных связей.

Во-вторых, как только допущения сделаны, DoWhy предоставляет тесты на надежность и чувствительность для проверки надежности полученной оценки. Вы можете проверить, как изменяется оценка по мере изменения исходных предположений, например, введя новый конфаундер или заменив вмешательство плацебо. Там, где это возможно, библиотека также автоматически проверяет достоверность полученной оценки на основе допущений в графической модели. Однако мы также понимаем, что автоматизированное тестирование не может быть совершенным. Поэтому Дауи подчеркивает интерпретируемость своего вывода; в любой момент анализа вы можете проверить непроверенные допущения, идентифицированные оценки (если таковые имеются) и оценку (если таковые имеются).

Рисунок 2-причинный вывод в четырех строках. Пробный прогон Даухи.

В будущем мы с нетерпением ожидаем добавления дополнительных функций в библиотеку, включая поддержку большего количества методов оценки и чувствительности, а также совместимость с имеющимся программным обеспечением для оценки. Мы приветствуем ваши отзывы и вклады в развитие библиотеки. Вы можете проверить библиотеку Dowhy Python на Github. Мы приводим здесь несколько примеров, чтобы вы могли начать работу с записными книжками Jupyter . Если вам интересно узнать больше о причинном выводе, ознакомьтесь с нашим учебником по причинному выводу и контрфактическим рассуждениям, представленным на KDD 2018 в воскресенье, 19 августа.


Источник: neurohive.io

Комментарии: