Создана платформа для обучения моделей ИИ без навыков программирования

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Возможно, вы не знаете этого, читая эту новость, но Blaize-это компания по производству чипов искусственного интеллекта. Блейз теперь смело идет туда, куда никто из его соплеменников не шел раньше, выпуская продукт для разработки программного обеспечения. И это не единственная причина, по которой AI Studio интересна

Машинное обучение позволяет компьютерам решать задачи, которые до сих пор выполнялись только людьми.

От вождения автомобилей до перевода речи машинное обучение ведет к взрыву возможностей искусственного интеллекта-помогает программному обеспечению осмыслить беспорядочный и непредсказуемый реальный мир.

Но что же такое машинное обучение и что делает возможным нынешний бум машинного обучения?

Что такое машинное обучение?

На очень высоком уровне машинное обучение - это процесс обучения компьютерной системы делать точные прогнозы при поступлении данных.

Эти предсказания можно ответить, является ли фрукт в фото банан или яблоко, заметить людей, переходящих дорогу в передней части автомобиля с автопилотом, является ли употребление слова книга в предложении относится к мягкой обложке или бронирование отеля, является ли письмо спамом, или распознавания речевых точно хватит для создания титров для видео на YouTube.

Ключевое отличие от традиционного компьютерного программного обеспечения заключается в том, что разработчик-человек не написал код, который учил бы систему, как отличить банан от Яблока.

Вместо этого модель машинного обучения была обучена тому, как надежно различать фрукты, обучаясь на большом количестве данных, в данном случае, вероятно, огромном количестве изображений, помеченных как содержащие банан или яблоко.

Данные, и многие из них, являются ключом к тому, чтобы сделать возможным машинное обучение.

В чем разница между искусственным интеллектом и машинным обучением?

Машинное обучение, возможно, пользовалось огромным успехом в последнее время, но это всего лишь один из методов достижения искусственного интеллекта.

Когда в 1950-х годах зародилась область ИИ, ИИ определялся как любая машина, способная выполнять задачи, которые обычно требуют человеческого интеллекта.

Системы искусственного интеллекта обычно демонстрируют, по крайней мере, некоторые из следующих черт: планирование, обучение, рассуждение, решение проблем, представление знаний, восприятие, движение и манипулирование и, в меньшей степени, социальный интеллект и креативность.

Наряду с машинным обучением существуют различные другие подходы, используемые для построения систем искусственного интеллекта, включая эволюционные вычисления, где алгоритмы претерпевают случайные мутации и комбинации между поколениями в попытке "развить" оптимальные решения, и экспертные системы, где компьютеры запрограммированы с правилами, которые позволяют им имитировать поведение человека-эксперта в конкретной области, например автопилот, летящий на самолете.

Каковы основные виды машинного обучения?

Машинное обучение обычно делится на две основные категории: контролируемое и неконтролируемое обучение.

Что такое контролируемое обучение?

Этот подход в основном учит машины на собственном примере.

Во время обучения для контролируемого обучения системы подвергаются воздействию большого количества помеченных данных, например изображений рукописных цифр, аннотированных, чтобы указать, какому числу они соответствуют. При наличии достаточного количества примеров система контролируемого обучения научится распознавать скопления пикселей и фигур, связанных с каждым числом, и в конечном итоге сможет распознавать рукописные числа, способные надежно различать числа 9 и 4 или 6 и 8.

Тем не менее, обучение этих систем обычно требует огромного количества помеченных данных, причем некоторые системы должны быть подвергнуты воздействию миллионов примеров, чтобы справиться с задачей.

В результате наборы данных, используемые для обучения этих систем, могут быть обширными: Google Open Images Dataset содержит около девяти миллионов изображений, его хранилище помеченных видео YouTube-8M связывается с семью миллионами помеченных видео , а ImageNet, одна из ранних баз данных такого рода, содержит более 14 миллионов категоризированных изображений. Размер обучающих наборов данных продолжает расти, и Facebook объявила, что собрала 3,5 миллиарда изображений общедоступно в Instagram, используя хэштеги, прикрепленные к каждому изображению в качестве ярлыков. Использование одного миллиарда этих фотографий для обучения системы распознавания образов дало рекордный уровень точности-85,4% - по сравнению с эталоном ImageNet.

Трудоемкий процесс маркировки наборов данных, используемых в обучении, часто осуществляется с помощью краудворкинговых сервисов, таких как Amazon Mechanical Turk, которые предоставляют доступ к большому пулу дешевой рабочей силы, разбросанной по всему миру. Например, ImageNet был собран в течение двух лет почти 50 000 человек, в основном набранных через Amazon Mechanical Turk. Однако подход Facebook к использованию общедоступных данных для обучения систем может обеспечить альтернативный способ обучения систем с использованием миллиардных наборов данных без накладных расходов на ручную маркировку.

Что такое бесконтрольное обучение?

В отличие от этого, неконтролируемое обучение ставит задачи алгоритмов с выявлением закономерностей в данных, пытаясь обнаружить сходства, которые разделяют эти данные на категории.

Примером может служить Airbnb, объединяющий дома, доступные для аренды по соседству, или Google News, объединяющий истории на похожие темы каждый день.

Алгоритмы неконтролируемого обучения не предназначены для выделения конкретных типов данных, они просто ищут данные, которые могут быть сгруппированы по сходству, или аномалии, которые выделяются.

Что такое полу-контролируемое обучение?

Важность огромных наборов маркированных данных для обучающих систем машинного обучения может со временем уменьшиться из-за роста полууправляемого обучения.

Как следует из названия, этот подход смешивает контролируемое и неконтролируемое обучение. Этот метод основан на использовании небольшого количества меченых данных и большого количества немеченых данных для обучения систем. Помеченные данные используются для частичного обучения модели машинного обучения, а затем эта частично обученная модель используется для маркировки немеченых данных, процесс называется псевдомечением. Затем модель обучается на полученной смеси меченых и псевдомеченых данных.

Жизнеспособность полууправляемого обучения была недавно повышена генеративными состязательными сетями (GANs), системами машинного обучения, которые могут использовать помеченные данные для генерации совершенно новых данных, которые, в свою очередь, могут быть использованы для обучения модели машинного обучения.

Если полууправляемое обучение станет столь же эффективным, как и контролируемое, то доступ к огромным объемам вычислительной мощности может оказаться более важным для успешного обучения систем машинного обучения, чем доступ к большим, помеченным наборам данных.

Что такое обучение подкреплению?

Один из способов понять процесс обучения с подкреплением-это подумать о том, как кто-то может научиться играть в старомодную компьютерную игру в первый раз, когда он не знаком с правилами или с тем, как управлять игрой. Хотя они могут быть полным новичком, в конечном счете, глядя на взаимосвязь между кнопками, которые они нажимают, тем, что происходит на экране, и их игровым счетом, их производительность будет становиться все лучше и лучше.

Примером подкрепляющего обучения является глубокая Q-сеть Google DeepMind, которая победила людей в широком спектре старинных видеоигр. Система подает пиксели из каждой игры и определяет различную информацию о состоянии игры, такую как расстояние между объектами на экране. Затем он рассматривает, как состояние игры и действия, которые он выполняет в игре, соотносятся с достигнутым счетом.

В процессе многих циклов игры, в конечном счете, система строит модель того, какие действия будут максимизировать счет, в каких обстоятельствах, например, в случае прорыва видеоигры, куда следует переместить весло, чтобы перехватить мяч.

Как работает контролируемое машинное обучение?

Все начинается с обучения модели машинного обучения, математической функции, способной многократно изменять то, как она работает, пока она не сможет делать точные прогнозы при наличии свежих данных.

Прежде чем начать обучение, вы должны сначала выбрать, какие данные собирать, и решить, какие особенности данных важны.

Чрезвычайно упрощенный пример того , что такое функции данных, приведен в этом объяснителе Google, где модель машинного обучения обучается распознавать разницу между пивом и вином, основываясь на двух особенностях, цвете напитков и их алкогольном объеме (ABV).

Каждый напиток маркируется как пиво или вино, а затем соответствующие данные собираются с помощью спектрометра для измерения их цвета и гидрометра для измерения содержания алкоголя в них.

Важно отметить, что данные должны быть сбалансированы, в данном случае, чтобы иметь примерно равное количество примеров пива и вина.

Собранные данные затем разделяются на большую часть для обучения, скажем, около 70%, и меньшую часть для оценки, скажем, оставшиеся 30%. Эти оценочные данные позволяют протестировать обученную модель, чтобы увидеть, насколько хорошо она может работать с реальными данными.

Перед началом обучения обычно также проводится этап подготовки данных, в ходе которого будут выполняться такие процессы, как дедупликация, нормализация и исправление ошибок.

Следующим шагом будет выбор подходящей модели машинного обучения из широкого спектра доступных. Каждый из них имеет сильные и слабые стороны в зависимости от типа данных, например, некоторые из них подходят для обработки изображений, некоторые-для текста, а некоторые-для чисто числовых данных.

Прогнозы, сделанные с помощью контролируемого обучения, делятся на два основных типа: классификацию, когда модель маркирует данные как предопределенные классы, например идентифицируя электронные письма как спам или не спам, и регрессию, когда модель предсказывает некоторую непрерывную ценность, такую как цены на жилье.

Как работает тренинг контролируемого машинного обучения?

В основном процесс обучения включает в себя автоматическую настройку модели машинного обучения, пока она не сможет делать точные прогнозы на основе данных, в примере Google, правильно маркируя напиток как пиво или вино, когда модель получает цвет напитка и ABV.

Хороший способ объяснить процесс обучения-рассмотреть пример использования простой модели машинного обучения, известной как линейная регрессия с градиентным спуском. В следующем примере модель используется для оценки количества мороженого, которое будет продаваться в зависимости от температуры наружного воздуха.

Представьте себе, что вы берете прошлые данные, показывающие продажи мороженого и температуру наружного воздуха, и строите эти данные друг против друга на диаграмме рассеяния – в основном создавая рассеяние дискретных точек.

Чтобы предсказать, сколько мороженого будет продаваться в будущем, основываясь на температуре наружного воздуха, вы можете нарисовать линию, проходящую через середину всех этих точек, как показано на рисунке ниже.

мороженое-температура. png

Изображение: Ник Хит / ZDNet

Как только это будет сделано, продажи мороженого можно предсказать при любой температуре, найдя точку, в которой линия проходит через определенную температуру, и считав соответствующие продажи в этой точке.

Возвращаясь к обучению модели машинного обучения, в данном случае обучение модели линейной регрессии будет включать корректировку вертикального положения и наклона линии до тех пор, пока она не окажется в середине всех точек на диаграмме рассеяния.

На каждом этапе тренировочного процесса измеряется вертикальное расстояние каждой из этих точек от линии. Если изменение наклона или положения линии приводит к увеличению расстояния до этих точек, то наклон или положение линии изменяется в противоположном направлении, и производится новое измерение.

Таким образом, благодаря множеству крошечных корректировок наклона и положения линии, линия будет продолжать двигаться, пока в конечном итоге не установится в положение, которое хорошо подходит для распределения всех этих точек. Как только этот процесс обучения будет завершен, линия может быть использована для точного предсказания того, как температура повлияет на продажи мороженого, и можно сказать, что модель машинного обучения была обучена.

Хотя обучение для более сложных моделей машинного обучения, таких как нейронные сети, отличается в нескольких отношениях, оно аналогично тому, что оно также может использовать подход градиентного спуска, когда значения "весов", переменных, которые объединяются с входными данными для генерации выходных значений, многократно корректируются до тех пор, пока выходные значения, полученные моделью, не будут максимально приближены к желаемым.

Как вы оцениваете модели машинного обучения?

Как только обучение модели завершено, модель оценивается с использованием оставшихся данных, которые не были использованы во время обучения, что помогает оценить ее реальную производительность.

При обучении модели машинного обучения обычно для обучения используется около 60% набора данных. Еще 20% данных используется для проверки прогнозов, сделанных моделью, и корректировки дополнительных параметров, оптимизирующих выходные данные модели. Эта тонкая настройка предназначена для повышения точности прогноза модели при представлении новых данных.

Например, один из параметров, значение которого корректируется в ходе этого процесса проверки, может быть связан с процессом, называемым регуляризацией. Регуляризация регулирует выходные данные модели таким образом, что относительная важность обучающих данных при принятии решения о выходе модели уменьшается. Это помогает уменьшить переобучение, проблему, которая может возникнуть при обучении модели. Переоснащение происходит, когда модель производит высокоточные прогнозы при подаче исходных обучающих данных, но не может приблизиться к этому уровню точности при представлении новых данных, что ограничивает ее реальное использование. Эта проблема связана с тем, что модель была обучена делать предсказания, которые слишком тесно связаны с паттернами в исходных обучающих данных, ограничивая способность модели обобщать свои предсказания на новые данные. Обратная проблема заключается в недостаточном приспособлении, когда модель машинного обучения не может адекватно улавливать паттерны, обнаруженные в обучающих данных, что ограничивает ее точность в целом.

Последние 20% набора данных затем используются для проверки выходных данных обученной и настроенной модели, чтобы проверить, остаются ли прогнозы модели точными при представлении новых данных.

Почему знание предметной области важно?

Еще одним важным решением при обучении модели машинного обучения является выбор данных для обучения модели. Например, если вы пытаетесь построить модель, чтобы предсказать, был ли кусок плода гнилым, вам понадобится больше информации, чем просто сколько времени прошло с момента сбора плода. Вы также выиграете от знания данных, связанных с изменением цвета этого плода по мере его гниения и температуры, при которой он хранился. Знание того, какие данные важны для составления точных прогнозов, имеет решающее значение. Вот почему эксперты предметной области часто используются при сборе обучающих данных, поскольку эти эксперты поймут тип данных, необходимых для получения обоснованных прогнозов.

Что такое нейронные сети и как они обучаются?

Очень важной группой алгоритмов как для контролируемого, так и для неконтролируемого машинного обучения являются нейронные сети. Они лежат в основе большей части машинного обучения, и в то время как простые модели, такие как линейная регрессия, могут быть использованы для прогнозирования, основанного на небольшом количестве признаков данных, как в примере Google с пивом и вином, нейронные сети полезны при работе с большими наборами данных со многими признаками.

Нейронные сети, структура которых слабо вдохновлена структурой мозга, представляют собой взаимосвязанные слои алгоритмов, называемых нейронами, которые подают данные друг в друга, причем выход предыдущего слоя является входом последующего слоя.

Каждый слой можно рассматривать как распознавание различных особенностей общих данных. Например, рассмотрим пример использования машинного обучения для распознавания рукописных чисел от 0 до 9. Первый слой нейронной сети может измерять интенсивность отдельных пикселей изображения, второй слой может определять формы, такие как линии и кривые, а последний слой может классифицировать эту рукописную фигуру как число от 0 до 9.

Сеть учится распознавать пиксели, которые формируют форму чисел в процессе обучения, постепенно повышая важность данных по мере их перемещения между слоями сети. Это возможно благодаря тому, что каждая связь между слоями имеет прикрепленный вес, значение которого может быть увеличено или уменьшено, чтобы изменить значимость этой связи. В конце каждого цикла обучения система будет проверять, приближается или отдаляется конечный результат нейронной сети от желаемого – например, становится ли сеть лучше или хуже при идентификации написанного от руки числа 6. Чтобы закрыть разрыв между фактическим выходом и желаемым выходом, система будет работать в обратном направлении через нейронную сеть, изменяя веса, прикрепленные ко всем этим связям между слоями, а также связанное с ними значение, называемое смещением. Этот процесс называется обратным распространением.

В конечном счете этот процесс установится на значениях этих весов и смещений, которые позволят сети надежно выполнять заданную задачу, например распознавать рукописные числа, и можно сказать, что сеть "научилась" выполнять конкретную задачу.

traininginference1. png

Иллюстрация структуры нейронной сети и того, как работает обучение.

Изображение: Nvidia

Что такое глубокое обучение и что такое глубокие нейронные сети?

Подмножеством машинного обучения является глубокое обучение, когда нейронные сети расширяются в разветвленные сети с большим количеством слоев, содержащих множество единиц, которые обучаются с использованием огромных объемов данных. Именно эти глубокие нейронные сети подпитывают нынешний скачок вперед в способности компьютеров выполнять такие задачи, как распознавание речи и компьютерное зрение.

Существуют различные типы нейронных сетей, с различными сильными и слабыми сторонами. Рекуррентные нейронные сети - это тип нейронных сетей, особенно хорошо подходящих для обработки языка и распознавания речи, в то время как сверточные нейронные сети чаще используются для распознавания образов. Дизайн нейронных сетей также развивается, и недавно исследователи разработали более эффективный дизайн для эффективного типа глубокой нейронной сети, называемой long short-term memory или LSTM, что позволяет ей работать достаточно быстро, чтобы использоваться в системах по требованию, таких как Google Translate.

Метод эволюционных алгоритмов ИИ даже используется для оптимизации нейронных сетей, благодаря процессу, называемому нейроэволюцией. Этот подход был продемонстрирован Uber AI Labs, которая выпустила статьи об использовании генетических алгоритмов для обучения глубоких нейронных сетей для задач обучения подкреплению.

Осуществляется ли машинное обучение исключительно с помощью нейронных сетей?

Нисколько. Существует множество математических моделей, которые могут быть использованы для обучения системы делать прогнозы.

Простой моделью является логистическая регрессия, которая, несмотря на название, обычно используется для классификации данных, например спам против не спама. Логистическая регрессия проста в реализации и обучении при выполнении простой бинарной классификации и может быть расширена для обозначения более двух классов.

Еще одним распространенным типом моделей являются машины опорных векторов (SVMs), которые широко используются для классификации данных и прогнозирования с помощью регрессии. SVM могут разделять данные на классы, даже если построенные на графике данные перемешаны таким образом, что их трудно разделить на отдельные классы. Чтобы достичь этого, SVM выполняют математическую операцию, называемую трюком ядра, который отображает точки данных на новые значения, так что они могут быть четко разделены на классы.

Выбор модели машинного обучения обычно основывается на многих факторах, таких как размер и количество объектов в наборе данных, причем каждая модель имеет свои плюсы и минусы.

Почему машинное обучение так успешно?

Хотя машинное обучение не является новым методом, интерес к этой области в последние годы резко возрос.

Это возрождение последовало за серией прорывов, когда глубокое обучение установило новые рекорды точности в таких областях, как распознавание речи и языка, а также компьютерное зрение.

Эти успехи стали возможными благодаря главным образом двум факторам: во-первых, огромному количеству изображений, речи, видео и текста, доступных для обучения систем машинного обучения.

Но еще более важным было появление огромного количества параллельных вычислительных мощностей, благодаря современным графическим процессорам (GPU), которые могут быть объединены вместе, чтобы сформировать центры машинного обучения.

Сегодня любой человек, имеющий подключение к интернету, может использовать эти кластеры для обучения моделям машинного обучения с помощью облачных сервисов, предоставляемых такими фирмами, как Amazon, Google и Microsoft.

По мере того как использование машинного обучения набирало обороты, компании теперь создают специализированное оборудование, адаптированное к запуску и обучению моделей машинного обучения. Примером одного из таких пользовательских чипов является тензорный процессор Google (TPU), который ускоряет скорость, с которой модели машинного обучения, построенные с использованием программной библиотеки Google TensorFlow, могут выводить информацию из данных, а также скорость, с которой эти модели могут быть обучены.

Эти чипы используются не только для обучения моделей для Google DeepMind и Google Brain, но и для моделей, лежащих в основе Google Translate и распознавания изображений в Google Photo, а также для сервисов, позволяющих публике создавать модели машинного обучения с помощью исследовательского облака Google TensorFlow Research Cloud. Третье поколение этих чипов было представлено на конференции Google I/O в мае 2018 года, и с тех пор они были упакованы в силовые установки машинного обучения, называемые стручками, которые могут выполнять более ста тысяч триллионов операций с плавающей запятой в секунду (100 петафлопс).

В 2020 году Google заявила , что ее ТПУ четвертого поколения были в 2,7 раза быстрее, чем ТПУ предыдущего поколения в MLPerf, бенчмарке, который измеряет, насколько быстро система может выполнять вывод с помощью обученной модели ML. Эти постоянные обновления TPU позволили Google улучшить свои сервисы, построенные поверх моделей машинного обучения, например вдвое сократить время обучения моделей, используемых в Google Translate.

По мере того как аппаратное обеспечение становится все более специализированным, а программные платформы машинного обучения совершенствуются, задачи ML все чаще выполняются на телефонах и компьютерах потребительского класса, а не в облачных центрах обработки данных. Летом 2018 года Google сделала шаг к тому, чтобы предложить такое же качество автоматического перевода на телефонах, которые находятся в автономном режиме, как и в интернете, развернув локальный нейронный машинный перевод для 59 языков в приложении Google Translate для iOS и Android.

Что такое AlphaGo?

Пожалуй, самой известной демонстрацией эффективности систем машинного обучения является триумф Google DeepMind AlphaGo AI в 2016 году над человеческим гроссмейстером в Go- подвиг, которого никто не ожидал до 2026 года. Go-это древняя китайская игра, сложность которой обманывала компьютеры на протяжении десятилетий. Го имеет около 200 возможных ходов за ход, по сравнению с примерно 20 в шахматах. В ходе игры в Го существует так много возможных ходов, что поиск по каждому из них заранее, чтобы определить лучшую игру, слишком затратен с вычислительной точки зрения. Вместо этого AlphaGo была обучена играть в эту игру, принимая ходы, сыгранные человеческими экспертами в 30 миллионах игр Go, и подавая их в нейронные сети глубокого обучения.

Обучение необходимым сетям глубокого обучения может занять очень много времени, требуя поглощения и повторения огромного количества данных, поскольку система постепенно совершенствует свою модель для достижения наилучшего результата.

Однако совсем недавно Google усовершенствовал процесс обучения с помощью AlphaGo Zero, системы, которая играла "совершенно случайные" игры против самой себя, а затем училась на результатах. На конференции Neural Information Processing Systems (NIPS) в 2017 году генеральный директор Google DeepMind Демис Хассабис показал, что AlphaZero, обобщенная версия AlphaGo Zero, также освоила игры в шахматы и сеги.

DeepMind продолжает открывать новые горизонты в области машинного обучения. В июле 2018 года DeepMind сообщила, что ее агенты ИИ научились играть в многопользовательский 3D-шутер от первого лица Quake III Arena 1999 года, достаточно хорошо, чтобы победить команды человеческих игроков. Эти агенты научились играть в игру, используя не больше информации, чем доступно человеческим игрокам, причем их единственным входом были пиксели на экране, когда они опробовали случайные действия в игре, и обратная связь об их производительности во время каждой игры.

Совсем недавно DeepMind продемонстрировал агента ИИ, способного к сверхчеловеческой производительности в нескольких классических играх Atari, что было улучшением по сравнению с более ранними подходами, когда каждый агент ИИ мог хорошо работать только в одной игре. Исследователи DeepMind говорят, что эти общие возможности будут важны, если исследования ИИ будут касаться более сложных областей реального мира.

Самое впечатляющее применение исследования DeepMind было получено в конце 2020 года, когда он показал AlphaFold 2, систему, возможности которой были объявлены знаковым прорывом для медицинской науки.

AlphaFold 2-это нейронная сеть, основанная на внимании, которая потенциально может значительно увеличить темпы разработки лекарств и моделирования заболеваний. Система может отображать трехмерную структуру белков, просто анализируя их строительные блоки, известные как аминокислоты. В конкурсе "критическая оценка предсказания структуры белка" AlphaFold 2 смог определить трехмерную структуру белка с точностью, соперничающей с кристаллографией, золотым стандартом убедительного моделирования белков. Однако, хотя для получения результатов кристаллографии требуются месяцы, AlphaFold 2 может точно моделировать белковые структуры в течение нескольких часов.

Для чего используется машинное обучение?

Системы машинного обучения используются повсюду вокруг нас и сегодня являются краеугольным камнем современного интернета.

Системы машинного обучения используются для того, чтобы рекомендовать, какой продукт вы хотите купить в следующий раз на Amazon или какое видео вы хотите посмотреть на Netflix.

Каждый поиск Google использует несколько систем машинного обучения, чтобы понять язык вашего запроса и персонализировать ваши результаты, поэтому любители рыбной ловли, ищущие "бас", не завалены результатами о гитарах. Точно так же системы распознавания спама и фишинга Gmail используют обученные модели машинного обучения, чтобы держать ваш почтовый ящик подальше от мошеннических сообщений.

Одной из наиболее очевидных демонстраций мощи машинного обучения являются виртуальные помощники, такие как Siri от Apple, Alexa от Amazon, Google Assistant и Microsoft Cortana.

Каждый из них в значительной степени полагается на машинное обучение, чтобы поддерживать свое распознавание голоса и способность понимать естественный язык, а также нуждается в огромном корпусе данных для ответа на запросы.

Но помимо этих очень заметных проявлений машинного обучения, системы начинают находить применение практически в каждой отрасли. Эти разработки включают в себя: компьютерное зрение для беспилотных автомобилей, беспилотных летательных аппаратов и роботов доставки; распознавание речи и языка и синтез для чат-ботов и сервисных роботов; распознавание лиц для наблюдения в таких странах, как Китай; помощь рентгенологам в выявлении опухолей в рентгеновских лучах, помощь исследователям в выявлении генетических последовательностей, связанных с заболеваниями, и идентификации молекул, которые могут привести к более эффективным лекарствам в здравоохранении.; позволяя прогнозировать техническое обслуживание инфраструктуры путем анализа данных датчиков Интернета вещей; подкрепляя компьютерное зрение, которое делает возможным безналичный супермаркет Amazon Go, предлагая достаточно точную транскрипцию и перевод речи для деловых встреч-список можно продолжать и продолжать.

В 2020 году GPT-3 OpenAI (Generative Pre-trained Transformer 3) сделал заголовки для своей способности писать как человек, почти на любую тему, которую вы могли бы придумать.

GPT-3-это нейронная сеть, обученная миллиардам англоязычных статей, доступных в открытом интернете, и способная генерировать статьи и ответы в ответ на текстовые подсказки. Хотя на первый взгляд часто было трудно отличить текст , генерируемый GPT-3, от человеческого, при ближайшем рассмотрении предложения системы не всегда выдерживали проверку.

Глубокое обучение может в конечном итоге проложить путь для роботов, которые могут учиться непосредственно у людей, с исследователями из Nvidia, создающими систему глубокого обучения, предназначенную для обучения робота тому, как выполнять задачу, просто наблюдая, как эта работа выполняется человеком.

Объективны ли системы машинного обучения?

Как и следовало ожидать, выбор и широта данных, используемых для обучения систем, будут влиять на задачи, для которых они подходят. Растет озабоченность по поводу того, как системы машинного обучения кодифицируют человеческие предубеждения и социальное неравенство, отраженные в их обучающих данных.

Например, в 2016 году Рэйчел Татман, аспирантка Национального научного фонда на факультете лингвистики Вашингтонского университета, обнаружила, что система распознавания речи Google лучше работает для мужских голосов, чем для женских, когда она автоматически подписывает выборку видеороликов YouTube, что она приписала "несбалансированным учебным наборам" с преобладанием мужчин-спикеров.

Было показано, что системы распознавания лиц с большей трудностью правильно идентифицируют женщин и людей с более темной кожей. Вопросы об этичности использования таких навязчивых и потенциально предвзятых систем для охраны правопорядка привели к тому, что крупные технологические компании временно приостановили продажу систем распознавания лиц правоохранительным органам.

В 2018 году Amazon также отказалась от инструмента машинного обучения рекрутинга, который определял кандидатов-мужчин как предпочтительных.

По мере того как системы машинного обучения переходят в новые области, такие как помощь в медицинской диагностике, все большую озабоченность вызывает возможность смещения систем в сторону предоставления более качественных услуг или более справедливого обращения с конкретными группами людей. В настоящее время ведутся исследования способов устранения предвзятости в системах самообучения.

А как насчет воздействия машинного обучения на окружающую среду?

Экологическое воздействие питания и охлаждения вычислительных ферм, используемых для обучения и запуска моделей машинного обучения, было предметом доклада Всемирного экономического форума в 2018году . Одна из оценок 2019 года заключалась в том, что мощность, требуемая системами машинного обучения, удваивается каждые 3,4 месяца.

По мере роста размеров моделей и наборов данных, используемых для их обучения, например, недавно выпущенная модель языкового прогнозирования GPT-3 представляет собой разросшуюся нейронную сеть с примерно 175 миллиардами параметров, а также озабоченность по поводу углеродного следа ML.

Существуют различные факторы, которые необходимо учитывать, обучающие модели требуют значительно больше энергии, чем запуск их после обучения, но стоимость запуска обученных моделей также растет по мере роста спроса на услуги с поддержкой ML. Существует также контраргумент, что прогностические возможности машинного обучения потенциально могут оказать значительное положительное влияние в ряде ключевых областей, от окружающей среды до здравоохранения, как это продемонстрировал AlphaFold 2 от Google DeepMind.

Какие курсы машинного обучения являются лучшими?

Широко рекомендуемый курс для начинающих, чтобы научить себя основам машинного обучения, - это бесплатная серия лекций Стэнфордского университета и Coursera от эксперта по искусственному интеллекту и основателя Google Brain Эндрю Нга.

Совсем недавно НГ выпустил свой специализированный курс глубокого обучения, который фокусируется на более широком спектре тем и применений машинного обучения, а также на различных архитектурах нейронных сетей.

Если вы предпочитаете учиться с помощью нисходящего подхода, где вы начинаете с запуска обученных моделей машинного обучения и углубляетесь в их внутреннюю работу позже, то fast.ai рекомендуется практическое глубокое обучение для кодеров, предпочтительно для разработчиков с годовым опытом работы на Python в соответствии с fast.ai. Оба курса имеют свои сильные стороны, причем курс Ng дает обзор теоретических основ машинного обучения, в то время как fast.ai его предложение сосредоточено вокруг Python, языка, широко используемого инженерами машинного обучения и учеными по обработке данных.

Еще один высоко оцененный бесплатный онлайн-курс, получивший высокую оценку как за широту охвата, так и за качество преподавания, - это edX и Columbia University introduction to machine learning, хотя студенты упоминают, что он требует солидных знаний математики вплоть до университетского уровня.

Как начать работу с машинным обучением?

Технологии, предназначенные для того, чтобы разработчики могли самостоятельно обучаться машинному обучению, становятся все более распространенными-от камер с поддержкой глубокого обучения AWS DeepLens до комплектов AIY от Google Raspberry Pi.

Какие сервисы доступны для машинного обучения?

Все основные облачные платформы-Amazon Web Services, Microsoft Azure и Google Cloud Platform-предоставляют доступ к оборудованию, необходимому для обучения и запуска моделей машинного обучения, а Google позволяет пользователям облачной платформы тестировать свои Тензорные процессоры-пользовательские чипы, дизайн которых оптимизирован для обучения и запуска моделей машинного обучения.

Эта облачная инфраструктура включает в себя хранилища данных, необходимые для хранения огромного объема обучающих данных, сервисы для подготовки этих данных к анализу и инструменты визуализации для четкого отображения результатов.

Новые сервисы даже упрощают создание пользовательских моделей машинного обучения, а Google предлагает услугу, которая автоматизирует создание моделей искусственного интеллекта, называемую Cloud AutoML. Эта служба перетаскивания создает пользовательские модели распознавания образов и не требует от пользователя специальных знаний в области машинного обучения, как в студии машинного обучения Microsoft Azure. Аналогичным образом, Amazon имеет собственные сервисы AWS, предназначенные для ускорения процесса обучения моделям машинного обучения.

Для сведения ученых, Гугл облака с искусственным интеллектом, управляемый машинного обучения, сервиса, который позволяет пользователям подготовку, распределение и экспорт пользовательских модели машинного обучения на основе от Google с открытым исходным кодом TensorFlow мл основы, или открытие нейронной сети рамках выбранной позиции, и которые могут быть использованы при библиотеке Python научно-Kit узнать и XGBoost.

Администраторы баз данных без опыта работы в области науки о данных могут использовать BigQueryML от Google, бета-сервис, который позволяет администраторам вызывать обученные модели машинного обучения с помощью команд SQL, позволяя делать прогнозы в базе данных, что проще, чем экспортировать данные в отдельную среду машинного обучения и аналитики.

Для фирм, которые не хотят создавать свои собственные модели машинного обучения, облачные платформы также предлагают услуги на основе искусственного интеллекта, такие как распознавание голоса, зрения и языка.

Тем временем IBM, наряду со своими более общими предложениями по требованию, также пытается продавать секторальные услуги искусственного интеллекта, нацеленные на все-от здравоохранения до розничной торговли, группируя эти предложения вместе под своим зонтиком IBM Watson.

В начале 2018 года Google распространила свои сервисы машинного обучения на мир рекламы, выпустив набор инструментов для создания более эффективной рекламы, как цифровой, так и физической.

В то время как Apple не пользуются одинаковой репутацией на передовые распознавания речи, обработки естественного языка и компьютерного зрения, как Google и Amazon, это инвестиции в улучшение ИИ услуг, с гугла бывший начальник машинного обучения в заряда Ай стратегии через Apple, включая развитие его помощник Siri и ее по требованию машинного обучения сердечник мл.

В сентябре 2018 года NVIDIA запустила комбинированную аппаратно-программную платформу, предназначенную для установки в центрах обработки данных, которая может ускорить скорость, с которой обученные модели машинного обучения могут выполнять распознавание голоса, видео и изображений, а также другие связанные с ML услуги.

Гипермасштабируемая платформа вывода NVIDIA TensorRT использует графические процессоры NVIDIA Tesla T4, которые обеспечивают до 40-кратную производительность процессоров при использовании моделей машинного обучения для вывода данных, и программную платформу TensorRT, предназначенную для оптимизации производительности обученных нейронных сетей.

Какие программные библиотеки доступны для начала работы с машинным обучением?

Существует большое разнообразие программных фреймворков для начала обучения и запуска моделей машинного обучения, как правило, для языков программирования Python, R, C++, Java и MATLAB, причем Python и R наиболее широко используются в этой области.

Известные примеры включают TensorFlow от Google, библиотеку с открытым исходным кодом Keras, библиотеку Python scikit-learn, фреймворк глубокого обучения CAFFE и библиотеку машинного обучения Torch.

Комментарии: