FBNet: как оптимизировать архитектуру нейросети с помощью SGD |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-10-17 13:44 FBNet — это архитектура сверточной нейросети, которая была автоматически разработана с помощью метода для оптимизации архитектуры модели. Исследователи опубликовали дифференцируемый метод для поиска архитектуры — DNAS. Differential Neural Architecture Search основывается на градиентных методах для оптимизации архитектуры сверточной нейросети. DNAS адаптирует структуру нейросети под тип устройства, на котором она будет запускаться. Разработка эффективных и точных сверточных нейросетей для мобильных устройств — это сложная задача из-за того, что широко пространство возможных архитектур. Из-за размера пространства предыдущие методы для поиска архитектуры нейросети вычислительно дорогие. Оптимальность архитектуры сверточной сети зависит от таких факторов, как разрешение входных данных и тип мобильного устройства. Предыдущие методы слишком ресурсоемкие, чтобы переделывать дизайн под отдельные кейсы. Исследователи используют DNAS, чтобы избавиться от ограничений предыдущих подходов. DNAS оптимизирует архитектуру нейросети с помощью методов, основанных на градиентах. При этом в DNAS рассматриваемые архитектуры не тренируются отдельно, как в предыдущих методах. Как работает DNAS DNAS исследует пространство на уровне слоев. Каждый слой в сверточной нейросети может выбрать разный тип блока. Пространство поиска представляется с помощью стохастической super net. Процесс поиска обучает стохастическую главную сеть с помощью SGD. Это необходимо, чтобы оптимизировать распределение архитектур. Оптимальные архитектуры отбираются из обученного распределения. Как работают FBNets FBNets (Facebook-Berkeley-Nets) — это семейство сверточных моделей, которые выдал DNAS алгоритм. Модели обходят state-of-the-art нейросети, как разработанные вручную, так и те, чья структура была оптимизирована автоматически. FBNet-B достигает точности в 74.1% на ImageNet с задержкой в 23.1 миллисекунд на Samsung S8 phone. Модель в 2.4 раза меньше и в 1.5 быстрее, чем MobileNetV2-1.3 с схожей точностью. Несмотря на высокую точность и небольшую задержку у MnasNet модели, ресурсов на поиск архитектуры FBNet-B затратили в 420 раз меньше. Общее число GPU часов составило 216. FBNets достигают точности от 1.5% до 6.4% выше, чем MobileNetV2. Источник: neurohive.io Комментарии: |
|