快科技3月17日消息,NVIDIA GPU可以说天下无敌,CPU就比较低调了,一直扮演辅助配角,但从现在开始就不是了!GTC 2026大会上,NVIDIA公布了下一代数据中心CPU Vera的更多细节,并宣布它公开对外销售,正面向Intel、AMD等发起了挑战。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
Vera CPU代号“Olympus”(奥利巴斯),底层架构是基于ARMv9.2-A指令集的自研设计,而上代Grace还是公版内核。流水线包括10发射的指令解码单元、每时钟周期2次分支预测的神经分支预测器、定制的图数据库分析预取引擎等。单颗88个核心,支持176线程,还有162MB三级缓存,而上代Grace为72核心144线程。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
NVIDIA声称,Vera IPC性能对比上代Grace大幅提升了1.5倍,结合创新的高带宽设计,性能相比标准CPU高出50%,号称拥有当前最快的单线程性能。同时,它采用了空间多线程技术(spatial multi-threading),不对执行单元、缓存和寄存器文件等关键部件进行时间片轮转(time-slicing),而是对流水线中的各类组件进行物理隔离,避免与同一核心上运行的其他线程争抢资源。
这与传统同步多线程(SMT)的时间片轮转、线程轮流使用资源的做法截然不同。
空间多线程技术可以在执行单元空闲时,从其他线程拉取指令,从而提升指令级并行度(ILP)、吞吐量与性能可预测性,确保资源得到充分利用。简单地说,它可以两个线程在单个核心上真正同时运行,而传统SMT的本质仍是轮流执行,这对多用户并发环境尤为有利。
基于这一技术,Vera的全部88个核心都放置在于单一域内,不会像x86处理器那样出现非一致内存访问(NUMA)而大幅增加延迟,对延迟、可预测性、带宽、编程易用性等都意义重大。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
NVIDIA没有披露其中的更多细节,但是Vera搭载了新一代的SCF(可扩展一致性互连),基于上代Grace中的CMN-700一致性网格网络改进而来,但是考虑到Arm已经升级到了最新的Neoverse CMN S3网格,Vera大概率用的就是它,或者定制版本。
基于这种互连设计,Grace支持的网格内存吞吐量为546GB/s,平均每个核心7.6GB/s。
Vera直接翻倍到了1.2 TB/s,平均每个核心接近14GB/s,尤其是网络负载不均衡时,单个核心最高可以获得80GB/s。
此外,Vera还搭载了NVLink-C2C互联接口,吞吐量最高1.8TB/s,是上代的两倍,并相当于PCIe 6.0整整七倍,并支持双路配置,当然也支持PCIe 6.0、CLX 3.1。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
根据NVIDIA官方数据,在脚本执行、编译、数据分析、图分析、高性能计算等场景中,Vera的性能相比上代Grace提升了1.8-2.2倍。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
NVIDIA同时发布了全新Vera CPU机架设计,单个机柜集成256颗液冷散热CPU,总计45056个线程,同时还有74颗Bluefield-4 DPU、ConnectX SuperNIC网卡,配备最多400TB LPDDR5内存,带宽300TB/s。
NVIDIA声称,它支持22500个可彼此独立运行工的并发CPU环境。
Meta已宣布将引入Vera CPU机架方案,NVIDIA生成也会向阿里巴巴、甲骨文、Coreweave、Nebius等超大规模云厂商提供。
Vera CPU现已全面量产,计划今年下半年开始交付。
这标志着,经过Grace的积累和沉淀,NVIDIA Vera开始正式进入CPU直销市场,不但在传统领域与Intel、AMD直接竞争,同时与全球超大规模云厂商所用的各类定制Arm处理器展开角逐。

NVIDIA 88核心Vera CPU开卖:第一次正面叫板Intel、AMD
【本文结束】出处:快科技
- 本文固定链接: https://www.4218.cn/articles/65783.html
- 转载请注明: zhiyongz 于 科技资讯 发表