Машинное обучение: ожидания vs реальность |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-05-06 11:54 Привет, меня зовут Саша Гришин, я инженер в центре искусственного интеллекта компании Samsung и хочу поделиться с вами своим опытом: как выглядит машинное обучение в реальной жизни и в чём практика расходится с ожиданиями.
В машинное обучение я пришёл не сразу. Окончив МФТИ по специальности «Прикладные математика и физика», сначала я занялся биоинформатикой и устроился в лабораторию системной биологии родного вуза. Там мы анализировали человеческий геном с помощью методов машинного обучения. Тогда я понял, что это моё. Мне захотелось развиваться в этой сфере, но для этого не хватало навыков в математике и программировании. Поначалу я не понимал, где взять эти знания. Я проходил онлайн-курсы, но этого мне было мало: без живого общения с единомышленниками разобраться в новых дисциплинах было достаточно сложно. Мой выбор остановился на Школе анализа данных Яндекса, где я мог получить не только теоретические знания, но и практические навыки. Конечно, не обошлось и без сложностей. Три года я не мог пройти даже заочный этап, но всё же решил не сдаваться и, наконец, поступил. Что интересно, в Школе после этого я учился на отлично. В процессе обучения моя мотивация росла, и по мере того, как я получал знания и общался с практикующими первоклассными специалистами, я чувствовал себя всё более уверенно, а желание развиваться в этой сфере становилось всё более сильным и осознанным. Тем более что мне удавалось находить время не только на плотный учебный график, но и на общение с однокурсниками. Увлечение машинным обучением уже на втором курсе Школы привело меня в научную группу Дмитрия Петровича Ветрова, в которой я вплотную занялся нейросетями и байесовскими методами анализа данных. Не всегда мои ожидания совпадали с реальностью. Но это меня не расстраивало. Более того, новые открытия делали работу ещё интереснее.
Факт 1 Когда только знакомишься с этой дисциплиной, кажется, что перед тобой открывается огромный фронт научной работы. Что есть огромное количество разных областей и тем, которых с избытком хватит и тебе, и твоим коллегам. Но стоит лишь начать развивать новую идею и начать её развивать, как обязательно выйдет статья на ту же тему, где все её аспекты уже раскрыты. Да, возможностей здесь много, но много и людей, которые прямо сейчас к ним присматриваются и готовы опередить тебя в любой момент. Факт 2 Как в теории должно работать машинное обучение? Ты строишь гипотезы и приходишь к выводу, что определённый метод хорошо подходит для обработки твоих данных. Применяешь его, получаешь интересные результаты и таким образом решаешь свою задачу. В жизни всё по-другому. Гипотеза почти наверняка не сработает, а если она всё же окажется верна, ты будешь не радоваться этому, а искать ошибки, объясняющие такое невероятное везение. В академическом машинном обучении это нормально, если большинство твоих методов работают не так, как ты ожидаешь. К тому же научный сотрудник должен всегда подвергать сомнению свои субъективные суждения, а не принимать их за аксиому. Факт 3 Казалось бы, машинное обучение — молодая дисциплина, которая сейчас проходит этап становления и взрывного роста. Но на практике обычно оказывается, что «сверхсовременные» технологии и методы уже давно придуманы и описаны в статьях 70-х или 80-х годов. Факт 4 Множество знаковых научных работ и перспективных методов исходят не из Стэнфорда, Беркли и других ведущих вузов, а из крупных корпораций, таких как Google и Facebook. Эта тенденция характерна именно для машинного обучения и стала заметна лишь три–пять лет назад. Факт 5 Когда я начинал писать статьи и отправлять их на крупные конференции, мне почему-то казалось, что рецензии на мои работы будут писать умудрённые опытом специалисты, которые отлично разбираются в машинном обучении и готовы дать строгую, но максимально объективную оценку. На самом же деле там сидят такие же молодые специалисты со своими научными интересами и далеко не всегда идеальным знанием темы. Поэтому в рецензиях часто попадаются замечания, которых совсем не ожидаешь. Так что приходится учиться максимально ясно и аккуратно излагать мысли. Факт 6 Ещё одно заблуждение связано непосредственно с результатами машинного обучения. Например, представим, что нужно создать человекоподобного робота с 20 степенями свободы и научить его быстро бегать. Ты используешь современные методы, разрабатываешь алгоритмы обучения и ожидаешь, что робот будет проходить стометровку, двигаясь, как олимпийский чемпион. Но в реальности всё будет иначе. Он, конечно, будет бегать быстро, но его движения будут выглядеть крайне необычно. Робот будет без видимых причин размахивать рукой, подёргивать ногами и совершать другие действия, странные с точки зрения человека. Факт 7 Болезненное столкновение с реальностью может ожидать специалиста по машинному обучению и при выполнении корпоративных заказов. Перед тобой ставят задачу, ты выбираешь лучшие методы её решения, планируешь работу и, уже предвкушая отличные результаты, говоришь заказчику: «Да, всё получится, сделаем по высшему разряду, но для этого нам нужно получить несколько десятков или лучше сотен тысяч примеров». А тебе отвечают, что есть только 300, максимум 500 объектов. Так что амбициозные планы приходится корректировать, исходя из реальных условий. Факт 8 Обычно для машинного обучения надо выделить признаки объектов, чтобы определять их классы. Например, признаками дома могут быть количество этажей и комнат, площадь и высота. Когда я работал над одним из своих первых проектов в этой сфере, один из признаков я назначил совершенно неправильно. Грубо говоря, вместо комнат я рассчитал, сколько в доме жёлтых стен, умножил это число на три и вычел из него количество стульев. Но в результате алгоритмы всё равно работают! Поначалу это просто поражает. Однако в этом эффекте иногда кроется большая опасность, потому что из-за него бывает трудно понять, что ты где-то ошибся. Факт 9 Одно время я работал в компании, которая разрабатывает технологии искусственного интеллекта в области медицины. Когда я туда устраивался, я думал, что там я буду круглосуточно участвовать в создании новых препаратов и лечении людей. Но вместо этого больше половины времени уходило на разработку инфраструктуры для экспериментов, подготовку данных и другие «бытовые» задачи. Конечно, в этом нет ничего плохого, и заниматься этим тоже интересно, просто не стоит слишком сильно романтизировать ожидания от работы. Факт 10 С приходом нейросетей и глубинного обучения даже самые крупные и известные лаборатории стали страдать от недостатка вычислительных ресурсов. Особенно, если речь идёт о научной работе, где надо пробовать разные методы и параметры, постоянно меняя условия экспериментов. Казалось бы, распределить мощности не так сложно, как решать глобальные технические задачи, которыми мы занимаемся. Но всё же эта проблема оказывается самой острой и вызывает много конфликтов. Факт 11 Поначалу я думал, что машинное обучение — достаточно строгая дисциплина. Ведь оно основано на высшей математике, количественном анализе и других точных науках. Поэтому было бы логично предположить, что и здесь подходы к решению задач будут стройными и понятными. Однако это верно лишь отчасти. Во многих случаях, особенно при работе с нейросетями и глубинным обучением, мы имеем дело в первую очередь с экспериментальными методами — как в физике, а не в математике. Большую часть времени ты не составляешь формулы, а ставишь опыты, смотришь на результаты, выдвигаешь гипотезы, проводишь новые испытания и чаще всего никак не можешь просчитать, что получится в итоге. Все эти примеры показывают, что работа в области машинного обучения может сильно не соответствовать ожиданиям. Но это даже хорошо. Когда сталкиваешься с чем-то принципиально новым, ты всегда идёшь навстречу неизвестности. Иногда тебя ждут приятные сюрпризы, иногда — не очень. Но в любом случае ты открываешь для себя новый мир, и эта магия не перестаёт тебя вдохновлять. Источник: vc.ru Комментарии: |
|