Radeon Instinct MI60 способна обойти даже Tesla T4 |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-11-10 17:01 Несколько дней назад компания AMD представила первые в мире графические адаптеры, основанные на семинанометровом GPU. Модели Radeon Instinct MI60 и MI50 получили GPU Vega 20 и ориентированы в первую очередь на ускорение вычислений искусственного интеллекта. Vega 20 очень похож на Vega 10, так что и производительность Radeon Instinct MI60/MI50 близка к Radeon Instinct MI25. Но только в случае FP16 и FP32, тогда как в режиме двойной точности (FP64) производительность MI60 почти на порядок превосходит возможности MI25: 7,4 TFLOPS против 768 GFLOPS. Кроме того, на презентации AMD сравнивала свою новинку с топовой картой Nvidia Tesla V100 в тесте Resnet 50 (распознавание изображений). Согласно подсчётам самой AMD, её ускоритель лишь немного проигрывает конкуренту: 334 изображений в секунду у MI60 против 357 у V100. Однако оказалось, что в этом случае сравнение хоть и честное, но не полное. Дело в том, что оно проводилось в режиме FP32 без использования тензорных ядер, имеющихся в активе новых GPU Nvidia. Если задействовать этот резерв, производительность Tesla V100 вырастает втрое — до 1189-1232 изображений в секунду в зависимости от типа подключения. Более того, в этом режиме производительность ускорителя Tesla T4 с TDP всего 75 Вт также выше, чем у MI60. Да, использование тензорных ядер возможно не везде, да и сама AMD утверждает, что именно режим FP32 используется в большинстве случаев, но эти ядра способны в разы повысить производительность ускорителей Nvidia последнего поколения. Источник: m.vk.com Комментарии: |
|