Обучение и развертывание модели TensorFlow - Azure Machine Learning |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-10-03 10:12 Из этой статьи вы узнаете, как выполнять сценарии обучения TensorFlow в масштабе с помощью машинное обучение Azure. В этом примере производится обучение и регистрация модели TensorFlow для классификации рукописных цифр с помощью глубокой нейронной сети (DNN). Независимо от того, разрабатываете ли вы модель TensorFlow с нуля или используете существующую модель в облаке, вы можете использовать машинное обучение Azure для масштабирования заданий обучения с открытым исходным кодом для создания, развертывания, контроля версий и мониторинга моделей производственного уровня. Предварительные условия Запустите этот код в любой из этих сред:
Настройка эксперимента В этом разделе выполняется настройка обучающего эксперимента путем загрузки требуемых пакетов Python, инициализации рабочей области, создания целевого объекта вычислений и определения среды обучения. Импорт пакетов Сначала импортируйте необходимые библиотеки Python. Python
Инициализация рабочей области Машинное обучение Azure Рабочая область — это ресурс верхнего уровня для службы. Она предоставляет централизованное расположение для работы со всеми создаваемыми артефактами. В пакете SDK для Python можно получить доступ к артефактам рабочей области, создав Создайте объект рабочей области из Python
Создание файлового набора данных Объект Python
Используйте Python
Создание целевого объекта вычислений Создайте целевой объект вычислений для выполнения задания TensorFlow. В этом примере создайте кластерный Машинное обучение Azure вычислений с поддержкой GPU. Python
Примечание Вы можете использовать низкоприоритетные виртуальные машины для выполнения части или всех рабочих нагрузок. Узнайте, как создать низкоприоритетную виртуальную машину. Дополнительные сведения о целевых объектах вычислений см. в статье что такое целевые показатели вычислений . Определение среды Чтобы определить среду машинного обучения Azure, в которой будут инкапсулированы зависимости сценария обучения, можно определить пользовательскую среду или использовать среду, проверенную в машинном обучении Azure. Создание пользовательской среды Определите среду машинного обучения Azure, в которой инкапсулируются зависимости сценария обучения. Сначала определите зависимости conda в файле YAML. в этом примере файл называется YAML
Создайте среду машинного обучения Azure из этой спецификации среды conda. Среда будет упакована в контейнер DOCKER во время выполнения. По умолчанию, если базовый образ не указан, Azure ML будет использовать образ ЦП в Python
Совет При необходимости можно просто захватить все зависимости непосредственно в пользовательском образе DOCKER или Dockerfile и создать среду из нее. Дополнительные сведения см. в разделе обучение с помощью пользовательского образа. Дополнительные сведения о создании и использовании сред см. в разделе Создание и использование программных сред в машинное обучение Azure. Использование проверенной среды Кроме того, Azure ML предоставляет предварительно созданные и проверенные среды, если вы не хотите создавать собственный образ. В МАШИНном обучении Azure имеется несколько проверенных сред ЦП и GPU для TensorFlow, соответствующих разным версиям TensorFlow. Дополнительные сведения см. здесь. Если вы хотите использовать проверенную среду, то вместо этого можно выполнить следующую команду: Python
Чтобы просмотреть пакеты, входящие в проверенную среду, можно записать зависимости conda на диск: Python
Убедитесь, что проверенная среда включает все зависимости, необходимые для обучающего скрипта. В противном случае необходимо будет изменить окружение, включив недостающие зависимости. Обратите внимание, что при изменении среды потребуется присвоить ей новое имя, так как префикс AzureML зарезервирован для проверенных сред. Если вы изменили файл YAML Dependencies conda, можно создать новое окружение с новым именем, например: Python
Если вы изменили проверенный объект среды напрямую, вы можете клонировать эту среду с новым именем: Python
Настройка и отправка учебного запуска Создание Скриптрунконфиг Создайте объект скриптрунконфиг , чтобы указать сведения о настройке учебного задания, включая сценарий обучения, используемую среду и целевой объект вычислений. Любые аргументы в скрипте обучения передаются через командную строку, если они указаны в Python
Предупреждение Машинное обучение Azure запускает скрипты обучения, копируя весь исходный каталог. Если у вас есть конфиденциальные данные, которые не нужно передавать, используйте файл. Ignore или не включайте его в исходный каталог. Вместо этого получите доступ к данным с помощью набора данныхмашинного обучения Azure. Дополнительные сведения о настройке заданий с помощью Скриптрунконфиг см. в статье Настройка и отправка обучающих запусков. Предупреждение Если вы ранее использовали оценщик TensorFlow для настройки заданий обучения TensorFlow, обратите внимание, что оценивающие будут считаться устаревшими в будущих выпусках пакета Azure ML SDK. С помощью пакета SDK машинного обучения Azure >= 1.15.0, Скриптрунконфиг является рекомендуемым способом настройки заданий обучения, включая те, которые используют платформы DL. Отправка запроса на выполнение Объект Run предоставляет интерфейс для журнала выполнения во время выполнения задания и после его завершения. Python
Что происходит во время выполнения При выполнении выполнения он проходит следующие этапы.
Регистрация или скачивание модели После обучения модели ее можно зарегистрировать в рабочей области. Регистрация модели позволяет хранить и редактировать версии моделей в рабочей области для упрощения развертывания и управления моделями. Необязательно: путем указания параметров Python
Вы также можете скачать локальную копию модели с помощью объекта Run. В сценарии обучения Python
Распределенное обучение Машинное обучение Azure также поддерживает распределенные задания TensorFlow с несколькими узлами, чтобы можно было масштабировать рабочие нагрузки для обучения. Вы можете легко выполнять распределенные задания TensorFlow, и МАШИНное обучение Azure будет управлять согласованием. Azure ML поддерживает выполнение распределенных заданий TensorFlow с помощью встроенного API-интерфейса распределенного обучения хоровод и TensorFlow. Horovod Хоровод — это платформа с открытым исходным кодом, которая сокращает структуру для распределенного обучения, разработанного Uber. Она предлагает простой путь для написания распределенного кода TensorFlow для обучения. Обучающий код должен быть оснащен хоровод для распределенного обучения. Дополнительные сведения об использовании хоровод с TensorFlow см. в документации по хоровод: Дополнительные сведения об использовании хоровод с TensorFlow см. в документации по хоровод: Кроме того, убедитесь, что в среде обучения включен пакет хоровод . Если вы используете TensorFlow проверенную среду, хоровод уже включен в качестве одной из зависимостей. Если вы используете собственную среду, убедитесь, что включена зависимость хоровод, например: YAML
Чтобы выполнить распределенное задание с использованием MPI или хоровод в МАШИНном обучении Azure, необходимо указать мпиконфигуратион в Python
Полный учебник по запуску распределенных TensorFlow с помощью хоровод в МАШИНном обучении Azure см. в разделе Распределенная TensorFlow с хоровод. TF. распространение Если вы используете собственные распределенные TensorFlow в обучающем коде, например TensorFlow 2. x Для этого укажите тенсорфловконфигуратион в Python
В TensorFlow Пример структуры JSON
Если сценарий обучения использует стратегию сервера параметров для распределенного обучения, т. е. для устаревшего TensorFlow 1. x, необходимо также указать количество серверов параметров, которое будет использоваться в задании, например Развертывание модели TensorFlow Руководство по развертыванию содержит раздел, посвященный регистрации моделей, но можно сразу перейти к созданию целевого объекта вычислений для развертывания, так как у вас уже есть Зарегистрированная модель. Образца Развертывание модели без кода Вместо традиционного маршрута развертывания можно также использовать функцию развертывания без кода (Предварительная версия) для TensorFlow. Зарегистрировав модель, как показано выше с помощью Python
Полное Описание процесса развертывания в машинное обучение Azure более подробно. Дальнейшие действия В этой статье вы обучили и зарегистрировали модель TensorFlow и узнали о вариантах развертывания. Дополнительные сведения о Машинное обучение Azure см. в других статьях. Источник: docs.microsoft.com Комментарии: |
|