Обучение моделей TensorFlow с помощью Службы машинного обучения Azure |
||||||||||||||||||||||||||||||||||||||||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-03-07 04:59 Для глубокого обучения нейронных сетей (DNN) с помощью TensorFlow служба «Машинное обучение Azure» предоставляет пользовательский класс Одноузловое обучение Обучение с помощью средства оценки Чтобы выполнить задание TensorFlow, следует создать объект
Укажем следующие параметры в конструкторе TensorFlow.
Так как вы работаете со средством оценки TensorFlow, контейнер, используемый для обучения, по умолчанию будет содержать пакет TensorFlow и связанные зависимости, необходимые для обучения в ЦП и GPU. Затем отправьте задание TensorFlow:
Распределенное обучение Средство оценки TensorFlow также позволяет обучать модели в кластерах ЦП и GPU виртуальных машин Azure. Распределенное обучение TensorFlow проводится с помощью нескольких вызовов API, при этом служба машинного обучения Azure в фоновом режиме будет управлять инфраструктурой и функциями оркестрации, необходимыми для выполнения этих рабочих нагрузок. Служба машинного обучения Azure поддерживает два метода распределенного обучения в TensorFlow.
Horovod Horovod — это поддерживающая алгоритм ring-allreduce платформа на основе открытого исходного кода для распределенного обучения, разработанная Uber. Чтобы запустить распределенное обучение TensorFlow с помощью платформы Horovod, создайте объект TensorFlow следующим образом:
В приведенном выше коде показаны следующие новые параметры в конструкторе TensorFlow.
В приведенном выше примере будет выполняться распределенное обучение с двумя рабочими ролями — по одной рабочей роли для каждого узла. Horovod и его зависимости будут установлены автоматически, поэтому их можно просто импортировать в сценарий обучения
И, наконец, отправьте задание TensorFlow:
Сервер параметров Можно также запустить собственное распределенное обучение TensorFlow, которое использует модель сервера параметров. В этом методе обучение проводится в кластере серверов параметров и рабочих ролей. Во время обучения рабочие роли вычисляют градиенты, а серверы параметров выполняют статистическую обработку градиентов. Создайте объект TensorFlow:
Обратите внимание на следующие параметры в конструкторе TensorFlow в приведенном выше коде.
Примечания по TF_CONFIG Вам также потребуются сетевые адреса и порты кластера для Переменная среды
Если вы используете высокоуровневый API Если для обучения вы используете API более низкого уровня, вам необходимо самостоятельно проанализировать переменную
Завершив написание сценария обучения и создание объекта TensorFlow, отправьте задание обучения:
Примеры Записные книжки по распределенному глубокому обучению см. в репозитории GitHub, раздел Узнайте, как запускать записные книжки, следуя указаниям из статьи о том,как изучить эту службу с помощью записных книжек Jupyter. Источник: habr.com Комментарии: |
|||||||||||||||||||||||||||||||||||||||