Nvidia представила 144-ядерный ARM-процессор Grace Superchip для ЦОД и утверждает, что он в 1,5 раза быстрее, чем EPYC прошлого поколения от AMD

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Точнее, продукта два - один включает как раз пару CPU Grace, т.е. те самые 144 ядра. Второй включает лишь один CPU Grace на 72 ядра и GPU Hopper.

Система на базе Neoverse состоит из двух процессоров, объединенных новой технологией Nvidia NVLink-C2C interconnect. Nvidia утверждает, что такая система быстрее, чем два 64-ядерных процессора AMD EPYC последнего поколения, которые она использует в своих собственных серверах DGX A100, и вдвое превышает энергоэффективность ведущих серверных чипов сегодняшнего дня.

Nvidia утверждает, что суперчип Grace CPU станет самым быстрым процессором на рынке, когда он поступит в продажу в начале 2023 года для широкого спектра приложений, таких как гипермасштабируемые вычисления, анализ данных и научные вычисления.

Учитывая то, что мы знаем о дорожной карте Arm, суперчип процессора Hopper основан на платформе N2 Perseus, которая первой поддерживает Arm v9, и имеет 5-нм дизайн, который поддерживает все новейшие технологии подключения, такие как PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. До 40% больше производительности по сравнению с платформой V1.

Суперчип Grace Hopper имеет два отдельных чипа, один процессор и один графический процессор, на одной несущей плате. Каждый процессор имеет 72 ядра и использует дизайн на основе Neoverse, который поддерживает Arm v9, и он работает в паре с графическим процессором Hopper. Эти два устройства обмениваются данными по соединению NVLink-C2C со скоростью 900 Гбит /с, которое обеспечивает согласованность памяти между процессором и графическим процессором, обеспечивая одновременный доступ к пулу ECC-памяти LPDDR5X, которая, как утверждается, в 30 раз увеличивает пропускную способность по сравнению со стандартными системами.

Первоначально Nvidia не объявляла количество LPDDR5X, которое она использует для дизайна, но теперь компания заявляет о "графическом процессоре с памятью 600 ГБ", который, вероятно, включает пул памяти LPDDR5X. Мы знаем, что LPDDR5X достигает максимума в 64 ГБ на упаковку. Предполагая, что в нижней части суперчипа Grace Hopper нет чипов LPDDR5X, это означает, что мы могли бы увидеть модели с объемом памяти до 512 ГБ LPDDR5X. Между тем, графический процессор Hopper обычно поставляется с емкостью 80 ГБ HBM3, что приближает нас к показателю Nvidia в 600 ГБ.

Сегодняшнее объявление касается суперчипа Grace CPU, который основан на дизайне Grace Hopper CPU + GPU, но со вторым CPU-чипом вместо графического процессора Hooper. Эти два 72-ядерных чипа также подключены через соединение NVLink-C2C, обеспечивая согласованное соединение со скоростью 900 Гбит / с, которое объединяет их в один 144-ядерный блок. Чип на базе Arm v9 Neoverse поддерживает масштабируемые векторные расширения Arm (SVE), которые представляют собой SIMD-инструкции, функционирующие аналогично AVX.

Суперчип процессора Grace использует Arm v9, что говорит нам о том, что чип использует дизайн Neoverse N2. Платформа Neoverse N2 - это первый IP Arm, поддерживающий недавно анонсированные расширения Arm v9, такие как SVE2 и маркировка памяти, и обеспечивает до 40% большую производительность по сравнению с платформой V1. Платформа N2 Perseus имеет 5-нм дизайн, который поддерживает PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. Perseus оптимизирован для производительности на мощность (ватт) и производительности на площадь.

Это имеет большой смысл, учитывая, что суперчип процессора Grace потребляет максимум 500 Вт как для двух процессоров, так и для встроенной памяти. Nvidia утверждает, что это сделает его вдвое более эффективным, чем конкурирующие процессоры, когда он выйдет на рынок.

Учитывая, что каждый процессор имеет доступ к своим собственным восьми чипами LPDDR5X, на два чипа по-прежнему будут влиять стандартные NUMA-подобные операции, но увеличенная пропускная способность между двумя чипами также должна помочь уменьшить задержку из-за меньшего количества конфликтов. Устройство также поставляется с 396 МБ встроенного кэша, но неясно, предназначено ли это для одного чипа или для обоих.

Подсистема памяти Grace CPU Superchip обеспечивает пропускную способность до 1 ТБ / с, что, по словам Nvidia, является первым для процессоров и более чем в два раза превышает показатели других современных процессоров центров обработки данных. При наличии 16 видимых чипов, теоретическая максимальная емкость LPDDR5X составит 1024 ГБ, хотя существует явная вероятность того, что в нижней части видимого носителя есть скрытые чипы, и поддержка ECC может увеличить полезную емкость. Nvidia также отмечает, что Grace использует первую реализацию ECC LPDDR5X.

Nvidia утверждает, что суперчип процессора Grace в тесте SPECrate_2017_int_base в 1,5 раза быстрее, чем два 64-ядерных процессора EPYC Rome 7742 предыдущего поколения, которые он использует в своих системах DGX A100. Nvidia основала это утверждение на предкремниевом моделировании, которое предсказывает производительность процессора Grace на уровне 740+ (370 на чип). Чипы AMD текущего поколения EPYC Milan, нынешний лидер по производительности в центрах обработки данных, показали результаты спецификаций в диапазоне от 382 до 424, что означает, что чипы x86 самого высокого класса по-прежнему будут лидировать. Однако решение Nvidia будет иметь много других преимуществ, таких как энергоэффективность и более удобный дизайн для графического процессора.

Два процессора Grace взаимодействуют через новый интерфейс NVLink-C2C от Nvidia. Это соединение между кристаллами и микросхемами поддерживает согласованность памяти, позволяя подключенным устройствам одновременно работать с одними и теми же пулами памяти.

Nvidia заявляет, что NVLink-C2C может обеспечить до 25 раз большую энергоэффективность и в 90 раз большую площадь, чем PCIe 5.0 PHYs, который в настоящее время использует Nvidia, поддерживая пропускную способность до 900 Гбит / с или выше. Этот интерфейс поддерживает стандартные отраслевые протоколы, такие как CXL и Arm AMBA Coherent Hub Interface (CHI), и поддерживает все виды соединений, начиная от межсоединений на основе печатных плат и заканчивая кремниевыми вставками и реализациями в масштабе пластины.

Поддержка AMBA CHI важна, поскольку она обеспечивает поддержку когерентной ячеистой сети Arm (CMN-700), которая свяжет проекты Neoverse N2 с интеллектуальными интерфейсами с высокой пропускной способностью и низкой задержкой с другими дополнениями платформы, такими как DDR, HBM и различные технологии ускорителей, используя комбинацию отраслевых-стандартные протоколы, такие как CCIX, CXL и PCIe. Эта новая сетчатая конструкция служит основой для следующего поколения процессоров Arm, основанных как на однокристальных, так и на многокристальных схемах.

Nvidia также объявила, что будет поддерживать новый стандарт межсоединения UCIE chiplet (это круто!), который поддерживается другими тяжеловесами отрасли, такими как Intel, AMD, Arm, TSMC и Samsung. Это стандартизированное соединение "от матрицы к матрице" предназначено для обеспечения связи между микросхемами с открытым исходным кодом, что снижает затраты и способствует созданию более широкой экосистемы проверенных микросхем. В конце концов, стандарт UCIE стремится быть таким же повсеместным и универсальным, как и другие стандарты подключения, такие как USB, PCIe и NVMe, обеспечивая при этом исключительные показатели мощности и производительности для соединений с чипами.

Grace Hopper Superchip и Grace CPU Superchip также могут быть объединены в нескольких различных конфигурациях с использованием до восьми графических процессоров с использованием Nvidia ConnectX-7 SmartNICs (CX7), обеспечивая поддержку более крупных систем.


Источник: vk.com

Комментарии: