Обзор AI & ML решений в 2018 году и прогнозы на 2019 год: Часть 2 — Инструменты и библиотеки, AutoML, RL, этика в AI |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-02-13 09:06 Всем привет! Представляю вам перевод статьи Analytics Vidhya с обзором событий в области AI / ML в 2018 году и трендов 2019 года. Материал довольно большой, поэтому разделен на 2 части. Надеюсь, что статья заинтересует не только профильных специалистов, но и интересующихся темой AI. Приятного чтения Читать сначала: Часть 1 — NLP, Computer Vision Инструменты и библиотеки Этот раздел понравится всем data science профессионалам. Инструменты и библиотеки — хлеб с маслом для ученых. Я участвовал во многих дебатах о том, какой инструмент лучше, какой фреймворк заменяет другой, какая библиотека является воплощением “экономичных” вычислений, и всё такое. Уверен, что многих из вас это тоже касается. PyTorch 1.0 Что за хайп вокруг PyTorch, который я упоминал уже множество раз в этой статье? AutoML – Automated Machine Learning Automated Machine Learning (или AutoML) постепенно завоёвывает популярность в течении последних пары лет. Такие компании, как RapidMiner, KNIME, DataRobot и H2O.ai уже выпустили отличные продукты, демонстрирующие огромный потенциал этой услуги. Можете ли вы представить себе работу над ML проектом, где вам нужно работать только с интерфейсом перетаскивания без кодирования? Это сценарий, который может стать реальным уже в ближайшем будущем. Кроме того, в ML / DL уже произошло знаменательное событие — релиз Auto Keras! TensorFlow.js – Deep Learning в браузере С тех пор, как мы приступили к этой работе, мы строим и проектируем модели machine learning и deep learning в наших любимых IDE и ноутбуках. Как насчет того, чтобы сделать шаг и попробовать что-то другое? Да, я говорю о deep learning прямо в вашем веб-браузере!
Тренды в AutoML на 2019 год Я хотел сосредоточиться на AutoML в этой статье. Зачем? По моим ощущениям, в ближайшие несколько лет ситуация в сфере data science изменится, но не верьте мне на слово! Марио Михайлидис из H2O.ai, гроссмейстер Kaggle, расскажет о том, чего ожидать от AutoML в 2019 году: Машинное обучение продолжает свой путь к тому, чтобы стать одной из самых важных тенденций будущего — того, куда движется мир. Эта экспансия увеличила спрос на приложения в этой области. Учитывая этот рост, крайне важно, чтобы автоматизация была ключом к максимально эффективному использованию ресурсов в сфере data science. Ведь области применения безграничны: кредитование, страхование, противодействию мошенничеству, компьютерное зрение, акустика, датчики, рекомендации, прогнозирование, NLP. Это большая честь работать в этой области. Список трендов, которые сохранят свою актуальность, выглядит так: Reinforcement Learning (Обучение с подкреплением) Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или её модель. Также нужно иметь в виду, что некоторые правила подкрепления базируются на неявных учителях, например, в случае искусственной нейронной среды, на одновременной активности формальных нейронов, из-за чего их можно отнести к обучению без учителя. Если бы меня спросили, в какой области мне бы хотелось увидеть более быстрое развитие, ответом был был бы reinforcement learning. Не смотря на изредка появляющиеся заголовки, прорывов в этой области еще не было, а главное, создается ощущение, что для комьюнити задачи reinforcement learning пока слишком математически сложны и областей для реального применения таких приложений еще нет. В некоторой степени это верно, в следующем году мне бы хотелось увидеть больше практических примеров использования RL. Каждый месяц на GitHub и Reddit я стараюсь поддерживать хотя бы один репозиторий или дискуссию по RL, чтобы способствовать обсуждению этой темы. Вполне возможно, это следующая важная вещь, которая получится из всех этих исследований. OpenAI опубликовали действительно полезный тулкит для тех кто только знакомится с RL. Можете почитать введение в RL здесь (для меня он оказался очень полезным). Если я что-нибудь пропустил, буду рад вашим дополнениям. Развитие OpenAI в области Deep Reinforcement Learning Пока освоение RL идет медленно, количество учебного материала на эту тему остается минимальным (это мягко сказано). Не смотря на это, OpenAI поделились некоторым количеством отличного материала на эту тему. Они назвали свой проект “Spinning Up in Deep RL”, он доступен по этой ссылке. Проще говоря, это исчерпывающий список ресурсов по RL. Авторы постарались сделать код и объяснения максимально простыми. Там достаточно материалов, которые включают RL терминологию, советы по развитию в области исследований RL, списки важных материалов, отлично документированный код и репозитории, а также примеры задач, чтобы вам было с чего начать. Dopamine от Google Чтобы дать толчок развитию и вовлечь комьюнити в тему reinforcement learning, команда Google AI представила для всех желающих Dopamine, TensorFlow фреймворк, призванный сделать проекты более гибкими и воспроизводимыми. Тренды в Reinforcement Learning на 2019 год Ксандер Стинбрюгге, спикер DataHack Summit 2018 и основатель канала ArxivInsights, является экспертом в reinforcement learning. Вот его мысли о текущем состоянии RL и о том, чего нам ждать в 2019 году: В настоящий момент я вижу три главные проблемы в области RL: Пара спойлеров от переводчика Что такое representation learning? В машинном обучении, feature learning или representation learning — это набор техник которые позволяют системе автоматически исследовать факторы необходимы для определения функций или классификации на основе сырых данных. Это заменяет ручной feature engineering и позволяет машине как и изучать функции, так и использовать их для выполнения конкретных задач.
— источник Wikipedia Что такое latent space (латентное пространство)? Бонус: Посмотрите видео Ксандера о преодолении редких наград в Deep RL (первая задача, выделенная выше). Слово “латентный” здесь означает “скрытый”. В этом контексте оно чаще всего используется в машинном обучении — вы наблюдаете какие-нибудь данные, которые находятся в пространстве, которое вы можете наблюдать, и вы хотите преобразовать их в скрытое пространство, где сходные точки данных находятся ближе друг к другу. Для примера рассмотрим 4 изображения: В наблюдаемом пиксельном пространстве нет непосредственного сходства между любыми двумя изображениями. Но, если вы хотите отобразить его в скрытом пространстве, вы бы хотели, чтобы изображения слева были ближе друг к другу в скрытом пространстве, чем к любому из изображений справа. Таким образом, ваше скрытое пространство передаёт суть структуры ваших данных связанных с задачей. В LDA вы моделируете задачу так, чтобы документы, относящиеся к аналогичным темам, находились ближе в скрытом пространстве тем. При встраивании слов вы хотите отобразить слова в скрытое векторное пространство так, чтобы слова с похожим значением находились ближе в этом пространстве.
Сложность модели продолжит улучшаться с добавлением все новых и новых вспомогательных обучающих заданий, которые увеличивают разреженность, нетипичные сигналы вознаграждения (такие вещи, как исследование, основанная на любопытстве предварительная подготовка в стиле автокодировщика, распутывание причинных факторов в окружающей среде и другое). Это работает особенно хорошо с очень редкими условиями вознаграждения. AI для хороших мальчиков – движение к “этичному” AI Представьте мир, управляемый алгоритмами, которые определяют каждое действие человека. Не самый приятный сценарий? Этика в AI — это тема, которую мы всегда обсуждали в Analytics Vidhya, но она теряется на фоне всех технических дискуссий, в то время, как должна рассматриваться наравне с другими темами. Кампании от Google и Microsoft Было радостно видеть, что крупные корпорации сделали акцент на этическую сторону AI (хотя путь, который привел их к этому моменту, был не очень изящным). Обратите внимание на руководства и принципы, опубликованные некоторыми из компаний: По сути, эти документы говорят о справедливости в ИИ, а также о том, когда и где провести черту. Сослаться на них, когда вы начинаете новый проект на основе AI, всегда хорошая идея. Как GDPR изменил правила игры GDPR (General Data Protection Regulation) определенно оказал влияние на способ сбора данных для создания AI приложений. GDPR появился в этой игре, чтобы обеспечить больший контроль пользователей над их данными (какая информация собирается и распространяется о них). Этические тренды в AI на 2019 год В этой области очень много серых пятен. Мы должны объединиться как общество, чтобы интегрировать этику в AI проекты. Как мы можем это сделать? Основатель и генеральный директор Analytics Vidhya Кунал Джейн подчеркнул в своем выступлении на DataHack Summit 2018, что нам нужно будет разработать концепцию, которой могут следовать другие. Заключение Impactful — единственное слово, которое кратко описывает удивительные события в 2018 году. Я стал активным пользователем ULMFiT в этом году, и я с нетерпением жду возможности поскорее изучить BERT. Действительно удивительное время. Источник: habr.com Комментарии: |
|