Nvidia представила 144-ядерный ARM-процессор Grace Superchip для ЦОД и утверждает, что он в 1,5 раза быстрее, чем EPYC прошлого поколения от AMD

2022-03-23 17:01

Точнее, продукта два - один включает как раз пару CPU Grace, т.е. те самые 144 ядра. Второй включает лишь один CPU Grace на 72 ядра и GPU Hopper.

Система на базе Neoverse состоит из двух процессоров, объединенных новой технологией Nvidia NVLink-C2C interconnect. Nvidia утверждает, что такая система быстрее, чем два 64-ядерных процессора AMD EPYC последнего поколения, которые она использует в своих собственных серверах DGX A100, и вдвое превышает энергоэффективность ведущих серверных чипов сегодняшнего дня.

Nvidia утверждает, что суперчип Grace CPU станет самым быстрым процессором на рынке, когда он поступит в продажу в начале 2023 года для широкого спектра приложений, таких как гипермасштабируемые вычисления, анализ данных и научные вычисления.

Учитывая то, что мы знаем о дорожной карте Arm, суперчип процессора Hopper основан на платформе N2 Perseus, которая первой поддерживает Arm v9, и имеет 5-нм дизайн, который поддерживает все новейшие технологии подключения, такие как PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. До 40% больше производительности по сравнению с платформой V1.

Суперчип Grace Hopper имеет два отдельных чипа, один процессор и один графический процессор, на одной несущей плате. Каждый процессор имеет 72 ядра и использует дизайн на основе Neoverse, который поддерживает Arm v9, и он работает в паре с графическим процессором Hopper. Эти два устройства обмениваются данными по соединению NVLink-C2C со скоростью 900 Гбит /с, которое обеспечивает согласованность памяти между процессором и графическим процессором, обеспечивая одновременный доступ к пулу ECC-памяти LPDDR5X, которая, как утверждается, в 30 раз увеличивает пропускную способность по сравнению со стандартными системами.

Первоначально Nvidia не объявляла количество LPDDR5X, которое она использует для дизайна, но теперь компания заявляет о "графическом процессоре с памятью 600 ГБ", который, вероятно, включает пул памяти LPDDR5X. Мы знаем, что LPDDR5X достигает максимума в 64 ГБ на упаковку. Предполагая, что в нижней части суперчипа Grace Hopper нет чипов LPDDR5X, это означает, что мы могли бы увидеть модели с объемом памяти до 512 ГБ LPDDR5X. Между тем, графический процессор Hopper обычно поставляется с емкостью 80 ГБ HBM3, что приближает нас к показателю Nvidia в 600 ГБ.

Сегодняшнее объявление касается суперчипа Grace CPU, который основан на дизайне Grace Hopper CPU + GPU, но со вторым CPU-чипом вместо графического процессора Hooper. Эти два 72-ядерных чипа также подключены через соединение NVLink-C2C, обеспечивая согласованное соединение со скоростью 900 Гбит / с, которое объединяет их в один 144-ядерный блок. Чип на базе Arm v9 Neoverse поддерживает масштабируемые векторные расширения Arm (SVE), которые представляют собой SIMD-инструкции, функционирующие аналогично AVX.

Суперчип процессора Grace использует Arm v9, что говорит нам о том, что чип использует дизайн Neoverse N2. Платформа Neoverse N2 - это первый IP Arm, поддерживающий недавно анонсированные расширения Arm v9, такие как SVE2 и маркировка памяти, и обеспечивает до 40% большую производительность по сравнению с платформой V1. Платформа N2 Perseus имеет 5-нм дизайн, который поддерживает PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. Perseus оптимизирован для производительности на мощность (ватт) и производительности на площадь.

Это имеет большой смысл, учитывая, что суперчип процессора Grace потребляет максимум 500 Вт как для двух процессоров, так и для встроенной памяти. Nvidia утверждает, что это сделает его вдвое более эффективным, чем конкурирующие процессоры, когда он выйдет на рынок.

Учитывая, что каждый процессор имеет доступ к своим собственным восьми чипами LPDDR5X, на два чипа по-прежнему будут влиять стандартные NUMA-подобные операции, но увеличенная пропускная способность между двумя чипами также должна помочь уменьшить задержку из-за меньшего количества конфликтов. Устройство также поставляется с 396 МБ встроенного кэша, но неясно, предназначено ли это для одного чипа или для обоих.

Подсистема памяти Grace CPU Superchip обеспечивает пропускную способность до 1 ТБ / с, что, по словам Nvidia, является первым для процессоров и более чем в два раза превышает показатели других современных процессоров центров обработки данных. При наличии 16 видимых чипов, теоретическая максимальная емкость LPDDR5X составит 1024 ГБ, хотя существует явная вероятность того, что в нижней части видимого носителя есть скрытые чипы, и поддержка ECC может увеличить полезную емкость. Nvidia также отмечает, что Grace использует первую реализацию ECC LPDDR5X.

Nvidia утверждает, что суперчип процессора Grace в тесте SPECrate_2017_int_base в 1,5 раза быстрее, чем два 64-ядерных процессора EPYC Rome 7742 предыдущего поколения, которые он использует в своих системах DGX A100. Nvidia основала это утверждение на предкремниевом моделировании, которое предсказывает производительность процессора Grace на уровне 740+ (370 на чип). Чипы AMD текущего поколения EPYC Milan, нынешний лидер по производительности в центрах обработки данных, показали результаты спецификаций в диапазоне от 382 до 424, что означает, что чипы x86 самого высокого класса по-прежнему будут лидировать. Однако решение Nvidia будет иметь много других преимуществ, таких как энергоэффективность и более удобный дизайн для графического процессора.

Два процессора Grace взаимодействуют через новый интерфейс NVLink-C2C от Nvidia. Это соединение между кристаллами и микросхемами поддерживает согласованность памяти, позволяя подключенным устройствам одновременно работать с одними и теми же пулами памяти.

Nvidia заявляет, что NVLink-C2C может обеспечить до 25 раз большую энергоэффективность и в 90 раз большую площадь, чем PCIe 5.0 PHYs, который в настоящее время использует Nvidia, поддерживая пропускную способность до 900 Гбит / с или выше. Этот интерфейс поддерживает стандартные отраслевые протоколы, такие как CXL и Arm AMBA Coherent Hub Interface (CHI), и поддерживает все виды соединений, начиная от межсоединений на основе печатных плат и заканчивая кремниевыми вставками и реализациями в масштабе пластины.

Поддержка AMBA CHI важна, поскольку она обеспечивает поддержку когерентной ячеистой сети Arm (CMN-700), которая свяжет проекты Neoverse N2 с интеллектуальными интерфейсами с высокой пропускной способностью и низкой задержкой с другими дополнениями платформы, такими как DDR, HBM и различные технологии ускорителей, используя комбинацию отраслевых-стандартные протоколы, такие как CCIX, CXL и PCIe. Эта новая сетчатая конструкция служит основой для следующего поколения процессоров Arm, основанных как на однокристальных, так и на многокристальных схемах.

Nvidia также объявила, что будет поддерживать новый стандарт межсоединения UCIE chiplet (это круто!), который поддерживается другими тяжеловесами отрасли, такими как Intel, AMD, Arm, TSMC и Samsung. Это стандартизированное соединение "от матрицы к матрице" предназначено для обеспечения связи между микросхемами с открытым исходным кодом, что снижает затраты и способствует созданию более широкой экосистемы проверенных микросхем. В конце концов, стандарт UCIE стремится быть таким же повсеместным и универсальным, как и другие стандарты подключения, такие как USB, PCIe и NVMe, обеспечивая при этом исключительные показатели мощности и производительности для соединений с чипами.

Grace Hopper Superchip и Grace CPU Superchip также могут быть объединены в нескольких различных конфигурациях с использованием до восьми графических процессоров с использованием Nvidia ConnectX-7 SmartNICs (CX7), обеспечивая поддержку более крупных систем.

Источник: vk.com



		Nvidia представила 144-ядерный ARM-процессор Grace Superchip для ЦОД и утверждает, что он в 1,5 раза быстрее, чем EPYC прошлого поколения от AMD
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2022-03-23 17:01 Суперкомпьютеры Точнее, продукта два - один включает как раз пару CPU Grace, т.е. те самые 144 ядра. Второй включает лишь один CPU Grace на 72 ядра и GPU Hopper. Система на базе Neoverse состоит из двух процессоров, объединенных новой технологией Nvidia NVLink-C2C interconnect. Nvidia утверждает, что такая система быстрее, чем два 64-ядерных процессора AMD EPYC последнего поколения, которые она использует в своих собственных серверах DGX A100, и вдвое превышает энергоэффективность ведущих серверных чипов сегодняшнего дня. Nvidia утверждает, что суперчип Grace CPU станет самым быстрым процессором на рынке, когда он поступит в продажу в начале 2023 года для широкого спектра приложений, таких как гипермасштабируемые вычисления, анализ данных и научные вычисления. Учитывая то, что мы знаем о дорожной карте Arm, суперчип процессора Hopper основан на платформе N2 Perseus, которая первой поддерживает Arm v9, и имеет 5-нм дизайн, который поддерживает все новейшие технологии подключения, такие как PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. До 40% больше производительности по сравнению с платформой V1. Суперчип Grace Hopper имеет два отдельных чипа, один процессор и один графический процессор, на одной несущей плате. Каждый процессор имеет 72 ядра и использует дизайн на основе Neoverse, который поддерживает Arm v9, и он работает в паре с графическим процессором Hopper. Эти два устройства обмениваются данными по соединению NVLink-C2C со скоростью 900 Гбит /с, которое обеспечивает согласованность памяти между процессором и графическим процессором, обеспечивая одновременный доступ к пулу ECC-памяти LPDDR5X, которая, как утверждается, в 30 раз увеличивает пропускную способность по сравнению со стандартными системами. Первоначально Nvidia не объявляла количество LPDDR5X, которое она использует для дизайна, но теперь компания заявляет о "графическом процессоре с памятью 600 ГБ", который, вероятно, включает пул памяти LPDDR5X. Мы знаем, что LPDDR5X достигает максимума в 64 ГБ на упаковку. Предполагая, что в нижней части суперчипа Grace Hopper нет чипов LPDDR5X, это означает, что мы могли бы увидеть модели с объемом памяти до 512 ГБ LPDDR5X. Между тем, графический процессор Hopper обычно поставляется с емкостью 80 ГБ HBM3, что приближает нас к показателю Nvidia в 600 ГБ. Сегодняшнее объявление касается суперчипа Grace CPU, который основан на дизайне Grace Hopper CPU + GPU, но со вторым CPU-чипом вместо графического процессора Hooper. Эти два 72-ядерных чипа также подключены через соединение NVLink-C2C, обеспечивая согласованное соединение со скоростью 900 Гбит / с, которое объединяет их в один 144-ядерный блок. Чип на базе Arm v9 Neoverse поддерживает масштабируемые векторные расширения Arm (SVE), которые представляют собой SIMD-инструкции, функционирующие аналогично AVX. Суперчип процессора Grace использует Arm v9, что говорит нам о том, что чип использует дизайн Neoverse N2. Платформа Neoverse N2 - это первый IP Arm, поддерживающий недавно анонсированные расширения Arm v9, такие как SVE2 и маркировка памяти, и обеспечивает до 40% большую производительность по сравнению с платформой V1. Платформа N2 Perseus имеет 5-нм дизайн, который поддерживает PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 и CXL 2.0. Perseus оптимизирован для производительности на мощность (ватт) и производительности на площадь. Это имеет большой смысл, учитывая, что суперчип процессора Grace потребляет максимум 500 Вт как для двух процессоров, так и для встроенной памяти. Nvidia утверждает, что это сделает его вдвое более эффективным, чем конкурирующие процессоры, когда он выйдет на рынок. Учитывая, что каждый процессор имеет доступ к своим собственным восьми чипами LPDDR5X, на два чипа по-прежнему будут влиять стандартные NUMA-подобные операции, но увеличенная пропускная способность между двумя чипами также должна помочь уменьшить задержку из-за меньшего количества конфликтов. Устройство также поставляется с 396 МБ встроенного кэша, но неясно, предназначено ли это для одного чипа или для обоих. Подсистема памяти Grace CPU Superchip обеспечивает пропускную способность до 1 ТБ / с, что, по словам Nvidia, является первым для процессоров и более чем в два раза превышает показатели других современных процессоров центров обработки данных. При наличии 16 видимых чипов, теоретическая максимальная емкость LPDDR5X составит 1024 ГБ, хотя существует явная вероятность того, что в нижней части видимого носителя есть скрытые чипы, и поддержка ECC может увеличить полезную емкость. Nvidia также отмечает, что Grace использует первую реализацию ECC LPDDR5X. Nvidia утверждает, что суперчип процессора Grace в тесте SPECrate_2017_int_base в 1,5 раза быстрее, чем два 64-ядерных процессора EPYC Rome 7742 предыдущего поколения, которые он использует в своих системах DGX A100. Nvidia основала это утверждение на предкремниевом моделировании, которое предсказывает производительность процессора Grace на уровне 740+ (370 на чип). Чипы AMD текущего поколения EPYC Milan, нынешний лидер по производительности в центрах обработки данных, показали результаты спецификаций в диапазоне от 382 до 424, что означает, что чипы x86 самого высокого класса по-прежнему будут лидировать. Однако решение Nvidia будет иметь много других преимуществ, таких как энергоэффективность и более удобный дизайн для графического процессора. Два процессора Grace взаимодействуют через новый интерфейс NVLink-C2C от Nvidia. Это соединение между кристаллами и микросхемами поддерживает согласованность памяти, позволяя подключенным устройствам одновременно работать с одними и теми же пулами памяти. Nvidia заявляет, что NVLink-C2C может обеспечить до 25 раз большую энергоэффективность и в 90 раз большую площадь, чем PCIe 5.0 PHYs, который в настоящее время использует Nvidia, поддерживая пропускную способность до 900 Гбит / с или выше. Этот интерфейс поддерживает стандартные отраслевые протоколы, такие как CXL и Arm AMBA Coherent Hub Interface (CHI), и поддерживает все виды соединений, начиная от межсоединений на основе печатных плат и заканчивая кремниевыми вставками и реализациями в масштабе пластины. Поддержка AMBA CHI важна, поскольку она обеспечивает поддержку когерентной ячеистой сети Arm (CMN-700), которая свяжет проекты Neoverse N2 с интеллектуальными интерфейсами с высокой пропускной способностью и низкой задержкой с другими дополнениями платформы, такими как DDR, HBM и различные технологии ускорителей, используя комбинацию отраслевых-стандартные протоколы, такие как CCIX, CXL и PCIe. Эта новая сетчатая конструкция служит основой для следующего поколения процессоров Arm, основанных как на однокристальных, так и на многокристальных схемах. Nvidia также объявила, что будет поддерживать новый стандарт межсоединения UCIE chiplet (это круто!), который поддерживается другими тяжеловесами отрасли, такими как Intel, AMD, Arm, TSMC и Samsung. Это стандартизированное соединение "от матрицы к матрице" предназначено для обеспечения связи между микросхемами с открытым исходным кодом, что снижает затраты и способствует созданию более широкой экосистемы проверенных микросхем. В конце концов, стандарт UCIE стремится быть таким же повсеместным и универсальным, как и другие стандарты подключения, такие как USB, PCIe и NVMe, обеспечивая при этом исключительные показатели мощности и производительности для соединений с чипами. Grace Hopper Superchip и Grace CPU Superchip также могут быть объединены в нескольких различных конфигурациях с использованием до восьми графических процессоров с использованием Nvidia ConnectX-7 SmartNICs (CX7), обеспечивая поддержку более крупных систем. Источник: vk.com Комментарии:

Nvidia представила 144-ядерный ARM-процессор Grace Superchip для ЦОД и утверждает, что он в 1,5 раза быстрее, чем EPYC прошлого поколения от AMD

Комментарии: