叫板英特尔，英伟达将推出首款服务器CPU，基于ARM

博文供求网 › 网站首页 › 资讯列表› 资讯内容

叫板英特尔，英伟达将推出首款服务器CPU，基于ARM

2021-04-22 发布于博文供求网

安徽拉伸缠绕膜

财联社（上海编辑夏军雄）讯，放眼全球CPU市场，英特尔公司的霸主地位已维持多年。虽然暂时还无法被撼动，但英特尔也感受到了来自AMD以及Arm等服务器芯片厂商的压力。如今，英伟达公司也加入到了挑战者的阵营中。

当地时间周一，英伟达在GTC2021大会上宣布，将推出首款服务器CPU。这款CPU被命名为Grace，以已故的计算机先驱GraceHopper的名字命名。

英伟达基于Arm的技术设计了Grace。值得一提的是，英伟达正在从软银集团手中收购Arm。去年9月份，英伟达宣布斥资400亿美元收购Arm公司，这笔交易还在进行中。

据英伟达称，瑞士国家超级计算中心和美国能源部阿拉莫斯国家实验室将成为Grace的首批用户。

英伟达表示，基于Grace的系统性能将比基于英伟达DGX的系统快10倍，而后者被认为是目前世界上最先进的系统。

从目前的市场份额来看，英伟达是显卡界当之无愧的龙头老大，而且他们已不满足于显卡市场，想和英特尔争夺CPU市场这块肥肉。

不过，英伟达想挑战英特尔也没那么容易，英特尔仍然牢牢占据了CPU市场90%以上的份额。

英伟达还表示，其一季度营收将高于此前预估的53亿美元。

消息传出后，英特尔股价大跌逾4%，而英伟达直线拉升，截至收盘，英特尔盘中跌4.18%，英伟达涨5.62%。

相关阅读：

芯片圈变天了！英伟达推出首个CPU，狂捧Arm生态

芯东西（ID：aichip001）

作者|心缘

编辑|漠影

芯东西4月13日报道，今日凌晨，一年一度影响人工智能及高性能计算技术盛会NVIDIAGTC如期而至，这是GTC大会继去年后第二次在线上举行。

NVIDIA（英伟达）创始人黄仁勋依然穿着拉风的皮衣，在自家厨房举办发布会。可以明显看到，老黄的头发更白了，也更长了。

去年NVIDIA重磅发布旗舰A100GPU以及一系列服务器、集群、超算，轰动整个人工智能领域，如今，老黄带着一系列软硬件新品高调回归。

在宣布400亿美元收购Arm的6个月后，NVIDIA连发三款基于ArmIP打造的处理器，包括全球首款专为TB级加速计算而设计的CPUNVIDIAGrace、全新BlueField-3DPU，以及业界首款1000TOPS算力的自动驾驶汽车SoC。

“我们每年都会发布激动人心的新品。。”黄仁勋说，

此外，NVIDIA还公布了与等基于Arm的CPU平台的合作伙伴关系。

、等一系列最新进展首次揭晓。

显然，面向数据中心异构计算的新天地，NVIDIA正集合软硬件技术优势，打出高调的组合拳。

此次发布会令人最印象深刻的，就是NVIDIA在助推Arm生态方面不遗余力，从自研CPU、DPU、自动驾驶处理器到GPU的合作伙伴，从云、高性能计算、边缘计算到PC，无处不Arm。

先来看下这次发布的五款硬件新品：

黄仁勋宣布的第一个重磅新品，是一款专为。

绝大多数的数据中心仍将继续使用现有的CPU，而

由于超大规模的模型很难完全放进GPU内存，如果存储在系统内存，访问速度则会大大受限，这款CPU的问世主要即是为了解决这一瓶颈。

NVIDIAGrace以发明了世界上第一个编译器、被称为“计算机软件工程第一夫人”的先驱计算机科学家GraceHopper命名，具体有3点创新进步：

（1）

明年将有两台性能强大的AI超级计算机面世，都将采用NVIDIAGrace，据称

这两台AI超算中，瑞士国家计算中心（CSCS）正在打造一个算力可达的系统，美国洛斯阿拉莫斯国家实验室（LosAlamosNationalLaboratory）也将为其研究人员配备新AI超算。

在黄仁勋看来，负责在数据中心传输和处理数据的数据处理单元（DPU），正与CPU、GPU共同组成“未来计算的三大支柱”。

NVIDIA全新BlueField-3DPU包含，采用16个ArmA78CPU核心18MIOPs弹性块存储

BlueField-2能够卸载相当于30个CPU核的工作负载，而

BlueField-3通过NVIDIADOCA（集数据中心于芯片的架构）软件开发包为开发者提供一个完整、开放的软件平台，开发在BlueFieldDPU上开发软件定义和硬件加速的网络、存储、安全和管理等应用。DOCA已于今日发布并提供下载。

新一代BlueField-3DPU预计将于BlueFieldDPU将包含640个晶体管，算力达1000TOPS，网络速率达800Gbps。

NVIDIADRIVEAtlan是新一代AI自动驾驶汽车处理器，超过了绝大多数现有无人驾驶出租车的子女计算能力。

，通过Arm核为自动驾驶汽车带来数据中心级的网络，致力于应用到2025年的车型。

该SoC采用下一代GPU的体系结构、新型ArmCPU内核、新深度学习和计算机视觉加速器，并内置为先进的网络、存储和安全服务的BlueFieldDPU，网络速度可达400Gbps。

黄仁勋夸赞说：“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成，堪称一项技术奇迹。”

黄仁勋还宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”NVIDIADGXStation，以及NVIDIA专为密集型AI研发打造的AI数据中心产品NVIDIADGXSuperPod。

全新DGXStation320G借助320GB超快速HBM2e连接至4个NVIDIAA100GPU，内存带宽达到每秒8TB。然而，仅需将其插入普通的壁装电源插座即可使用，耗电量只有1500W。

黄仁勋说，达到这种性能的CPU集群成本约为100万美元，而DGXStation仅需14.9万美元。

DGXSuperPOD使用全新80GBNVIDIAA100，将其HBM2e内存提升至90TB，实现2.2EB/s的总带宽。要实现如此的带宽，需要11000台CPU服务器，大约相当于有250个机柜的数据中心，比SuperPOD多15倍。

目前它已经升级至采用NVIDIABlueField-2，且NVIDIA如今还为该产品提供配套的NVIDIABaseCommandDGX管理和编排工具。

黄仁勋还提到了NVIDIA的AI-on-5G计算平台，这是一款专为边缘设计、将5G和AI相结合的新型计算平台。该平台将采用NVIDIAAerial软件开发套件与NVIDIABlueField-2A100，将GPU和CPU组合成“有史以来最先进的PCIE卡。”

富士通、谷歌云、Mavenir、Radisys和WindRiver等合作伙伴都在开发适用于NVIDIAAI-on-5G平台的解决方案。

除了推出基于Arm的CPU外，NVIDIA还宣布一系列与Arm处理器设计商的合作进展，包括将为亚马逊AWSGraviton2CPU提供GPU加速、为科学和AI应用开发提供支持的全新HPC开发者套件、提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIARTXGPU的新款PC等。

，基于相结合，在云端部署。

这一新组合将实现降低成本、支持更丰富的游戏串流体验、优化云上安卓游戏和人工智能推理、以更低成本提供更高的AI推理性能等优势。

黄仁勋说：“”

为了更好地支持科学和AI应用开发面向高性能计算领域，NVIDIA推出了

包含80个ArmNeoverse核，运行频率高达3.3GHz）、每个GPU可提供312TFLOPS的FP16深度学习性能）、。

该开发者套件包含一套NVIDIA编译器、库和工具，可用于创建HPC和AI应用，以及将其迁移到GPU加速的Arm计算系统中，，多家顶尖研究机构已率先展开部署。

今天NVIDIA还宣布了等进展。

NVIDIA正扩大与Marvell的合作，将基于Arm的OCTEONDPU与GPU相结合，加速AI工作负载，实现网络优化和安全。

NVIDIA与全球最大的基于Arm的SoC供应商之一联发科合作，共同打造一个采用Arm核与NVIDIA显卡、支持Chromium、Linux和NVIDIASDK的参考平台，将GPU的性能及先进的AI、光线追踪图形等技术带入ArmPC平台。

此外，NVIDIA也正与富士通、SiPearl等其他合作伙伴共同致力于扩展Arm生态系统。

NVIDIA在去年推出了一个机架比肩AI数据中心的AI系统DGXA100、AI算力高达700PFLOPS的集群DGXSuperPOD、千万亿级工作组服务器DGXStationA100。

面向AI应用需求，NVIDIA已经提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化的预训练模型。

今天，NVIDIA进一步强化企业计算服务，不仅推出大型语言模型训练与推理问答引擎、宣布对话式AI平台最新落地进展，还展示了其量子电路模拟框架。

为进一步实现AI民主化，黄仁勋发布了来自顶尖制造商的新系列NVIDIA认证系统，即大容量企业级服务器，现已通过认证。

这一系统可运行NVIDIAAIEnterprise软件套件，该套件得到了全球应用最广泛的计算虚拟化平台——VMwarevSphere7的独家认证。

NVIDIA今日推出多款新系统，以扩大NVIDIA认证服务器生态系统。这些新系统配备用于主流AI和数据分析的NVIDIAA30GPU，以及用于AI图形、虚拟工作站以及混合计算和图形工作负载的NVIDIAA10GPU。

黄仁勋发布了用于训练Transformers的超大语言模型的NVIDIAMegatronTriton推理服务器。

Transformers已帮助开发者在自然语言处理领域取得了突破性进展，能够生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码。

使用MegatronTriton的DGXA100能在1秒内做出响应，可同时支持16项查询，而双插座CPU服务器支持1条问询就超过了1分钟。

Jarvis是一个基于NVIDIAGPU提供实时性能的灵活、多模态对话式AI服务应用框架，可帮助开发者轻松实现等功能。

现在，NVIDIA已经是一个生产就绪、现已可用的端到端对话式AI模型，企业可基于自身数据和特定需求对模型做进一步的微调，并使用NGC实现在云或边缘快速部署定制化语言型AI服务。

为帮助客户将自身专业知识应用于AI领域，黄仁勋还宣布推出NVIDIATAO，其可以运用客户和合作伙伴的数据，对NVIDIA预训练模型进行微调和适配，同时保护数据隐私。

为了保障现代化数据中心的安全，黄仁勋宣布推出而构建的NVIDIAMorpheus数据中心安全平台，能够对完整的数据包进行实时检测、预防安全威胁，。

作为一个基于AI的云原生网络安全框架，NVIDIAMorpheus通过在边缘和AI技术的结合，利用实时的遥测、策略执行及操作，可以在不牺牲成本和性能的情况下分析更多的安全数据，识别、捕捉和应对以往无法识别的威胁和异常情况，如未加密敏感数据的泄露、网络钓鱼攻击和恶意软件。

Morpheus与BlueFieldDPU相结合，使网络中的每个计算节点都成为边缘网络防御传感器，。相比之下，传统的AI安全工具通常只能采样5%左右的网络流量数据，因此威胁检测算法并非基于完整的模型。

同步推出的BlueField-3可为NVIDIAMorpheus提供的网络可视化、网络威胁的检测与响应、以及监控、遥测和代理服务。开发者还能够在现有IP投资的基础上，使用深度学习模型来创建自己的MorpheusAI功能。

为加快有赖于量子位（或量子比特，能作为单个的0或1存在，也可以同时作为二者存在）的量子计算研究，黄仁勋推出了cuQuantum，为量子电路模拟器提供加速。

这是专为模拟量子电路而设计的加速库，适用于张量网络求解器和状态向量求解器，经过优化后，可以扩展到大GPU显存、多个GPU和多个DGX节点。

运行cuQuantum基准测试时，状态向量模拟在双CPU服务器上需要10天，但在DGXA100上只需2小时，DGX上的cuQuantum可以高效模拟10倍的量子位，从而助力研究人员设计出更完善的量子计算机。

自动驾驶汽车（AV，Autonomousvehicles）是NVIDIA近年来极其重视的赛道之一。除了前文提及的1000TOPS自动驾驶处理器外，此次黄仁勋还推出了Hyperion8AV平台，并宣布沃尔沃汽车扩大与NVIDIA的合作。

NVIDIAHyperion8AV平台是一个先进的数据采集、开发和测试平台，包含参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。

沃尔沃汽车从2016年开始借助高性能且高能效的NVIDIADRIVE的算力，基于NVIDIADRIVEXavier，为新车型开发AI辅助驾驶功能，软件则由沃尔沃汽车旗下的自动驾驶软件开发公司Zenseact自主研发。

黄仁勋说，将于2022年投产的NVIDIA自动驾驶汽车计算系统级芯片NVIDIADRIVEOrin，旨在成为汽车的中央电脑。

而沃尔沃汽车将为新一代汽车的自动驾驶计算机配备NVIDIADRIVEOrin。

这意味着两家公司的合作深入到更多软件定义车型，首发就是将于2022年发布的新一代XC90。

黄仁勋强调说，NVIDIA是一家软件平台公司，并大力发展NVIDIAAI和将3D世界连接至共享虚拟世界的NVIDIAOmniverse。

NVIDIAOmniverse是一款多GPU可扩展的云原生平台，支持建模、布局、着色、合成、渲染、动画等一系列构建3D虚拟建模所需的功能，用于仿真、协作和自主机器训练。

其特点还包括：具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIAMDL模拟材料、可以使用NVIDIAPhysX模拟物理学并且与NVIDIAAI完全集成。

黄仁勋提到：“Omniverse旨在创建共享虚拟3D世界，就像尼尔·斯蒂芬森在1990年代早期的小说《雪崩》中所描述的科幻虚拟空间那样。”

去年12月，NVIDIA推出了Omniverse公测版本。自公测版发布以来，建筑、游戏以及大型广告公司等合作伙伴都将Omniverse运用到其工作中。

从今年夏季开始，NVIDIA将提供Omniverse企业授权许可。

黄仁勋还宣布DRIVESim将于今年夏季开放供业界使用。他提到Omniverse中的DRIVE数字孪生是能够与车队中每一位工程师和每一辆车互联的虚拟空间。

正如Omniverse能够构建汽车生产工厂的数字孪生一样，DRIVESim也可用于创建自动驾驶汽车的数字孪生，并将其用于自动驾驶汽车的开发。

此外，NVIDIA正与宝马合作打造一个完全采用数字化设计的未来工厂，自始至终在Omniverse中进行模拟，创建数字孪生，并让机器人与人类协同工作开展运营。

总体来看，NVIDIA今日公布的多项成果与进展，为基于Arm的解决方案带来更多可能性，NVIDIA这又打造硬件又优化软件的势头，更加彰显了其主导数据中心领域AI和HPC市场的决心，也为颇负盛名的GTC大会打出了响亮的头炮。

此次GTC线上大会共超过10万人注册参会，共计将举行1600多场技术演讲。在接下来的5天内，3位图灵奖得主、12位戈登-贝尔奖得主、10位奥斯卡奖得主，以及来自微软、Arm、奥迪汽车、亚马逊、通用电气、微软等企业的领导人均将在此次科技盛会上发表演讲。

从最新一系列努力来看，NVIDIA身上早已贴上远多于GPU巨头的更多标签，成为全栈计算平台。首款数据中心CPU的发布，也宣告着NVIDIA的异构计算布局再添新的关键元件，数据中心产品线集齐CPU、GPU、DPU这“未来计算的三大支柱”。

NVIDIA正卯足了劲儿推进将GPU与Arm系CPU相结合的生态发展，这一切显然还只是开始。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

博文供求网

亲爱的游客，欢迎！

客服电话

电子邮件

叫板英特尔，英伟达将推出首款服务器CPU，基于ARM

请发表评论

全部评论

相关阅读

博文供求网

探寻未来娱乐新趋势：手机影院

手机影院：随时随地享受观影乐趣

如何免费在线观看最新美剧电视剧

手机影院：随时随地的观影新体验

探索云影视：数字时代下的新娱乐体验

全集网：免费在线看最新电视剧的最佳选择

南瓜影院：承载童年记忆的神奇地方

鸿蒙5.0终端数量突破千万余承东谈鸿蒙破局

一城一故事・河北深州站｜以零醛科技，锻造家具界「健康护盾」

探寻热门影视，搜看在线看最火

88 VIP 甄选榜携手《披荆斩棘的哥哥》，打造年度品质商品天团

热门课程

新手指南

关于我们

帮助中心

博文供求网

亲爱的游客，欢迎！

客服电话

电子邮件

叫板英特尔，英伟达将推出首款服务器CPU，基于ARM

请发表评论

全部评论

相关阅读

博文供求网

探寻未来娱乐新趋势：手机影院

手机影院：随时随地享受观影乐趣

如何免费在线观看最新美剧电视剧

手机影院：随时随地的观影新体验

探索云影视：数字时代下的新娱乐体验

全集网：免费在线看最新电视剧的最佳选择

南瓜影院：承载童年记忆的神奇地方

鸿蒙5.0终端数量突破千万 余承东谈鸿蒙破局

一城一故事・河北深州站｜以零醛科技，锻造家具界「健康护盾」

探寻热门影视，搜看在线看最火

88 VIP 甄选榜携手《披荆斩棘的哥哥》，打造年度品质商品天团

热门课程

新手指南

关于我们

帮助中心

鸿蒙5.0终端数量突破千万余承东谈鸿蒙破局