除了64核心和7nm之外 AMD的Rome架构还有什么值得关注?

  • 时间:
  • 浏览:0

美国时间2019年8月7日,AMD终于发布了代号为Rome的第二代EPYC数据中心解决器。

作为数据中心领域内的首款7nm工艺x86解决器,AMD的本次发布吸引了包括HPE、Dell、联想等全球顶级系统提供商;AWS、Azure、Google Cloud等全球前三的云服务提供商以及Cray这家顶尖超算制造商登台助阵,声势空前浩大。而面对来自全球隔得的合作者伙伴、客户和媒体,AMD CEO苏姿丰博士也毫不避讳的表示:AMD要把竞争带回到数据中心市场。

AMD CEO苏姿丰博士发表演讲

最高64核心、128多程序运行 、最高3.4GHz Boost频率、双路系统最高4TB内存、512MB L3缓存、全线8路DDR4 3400MHz内存支持及128 Lane PCI-E 4.0支持让AMD删改有底气说出这句话。

由AMD定义的Leadership

而从基础型态来看,本次发布的第二代EPYC解决器主要蕴含三大特点:7nm工艺、Zen 2核心以及Chiplet架构。

7nm无敌舰队的最后一员猛将就位

不得不说,在过去相当长的一段时间内,AMD都被工艺制程所抛下。究其由于 ,GF技术上的常年落后难辞其咎。不过在苏博士大刀阔斧的改革之下,AMD终于摆脱了GF的束缚,将代工工作交给了技术更先进的台积电。于是,亲戚我们我们 便都看了Ryzen7 4000系列解决器、Radeon RX 5700系列显卡和此次发布的第二代EPYC解决器。民用解决器、图形卡、数据中心解决器,AMD的三大支柱业务终于删改享受到了7nm所带来的功耗降低及Die size减小优势。

嘴笨 工艺与制程并都不 决定一款芯片的成败,但其带来的功耗降低和面积缩减却让AMD有由于 向更好能效、更多核心、更高频率发起冲击。而哪此正是AMD重新站上擂台与Intel正面交锋的先决条件。

Chiplet架构——对芯片的全新理解

所谓chiplet假如将以往CPU设计中传统的单Die设计思路彻底抛下,进而将不同功能的每种单独进行设计与制造;模块之间通过专门的互联器件和埋线技术来进行数据交换。

AMD引以为傲的Chiplet设计

目前,在Rome中,AMD采用了Core与IO分离的设计思路;在解决器最后边是集成了内存控制器、PCI-E 4.0控制器、内部人员互联Infinity Fabric控制器和L3缓存的IO核心,在IO核心附过则是数个Core模组(AMD将之称为CCD,每8个核心和另一一个 Infinity Fabric为一组,64核产品只需要在IO核心附过排布8个Core模组)。这名设计思路有十几次 好处:

其一,不同每种单独制造可不是 效缩减由良率问题所产生的成本。举个例子,在相同的技术条件下,由于 同一批次的晶圆会在蚀刻过程中随机生成20个故障点,在最坏的状态下,这由于 20个die会假如报废。在采用传统的大核心设计中,由于 另一一个 晶圆没人切割出400个删改核心,那这20个故障点也就由于 良率最低会降至400%。但在chiplet思路中,AMD还可以在相同尺寸的晶圆上构建更多的die(与芯片边长成平方反比),由于 将die的边长缩小一半,没人另一一个 晶圆还可以切割出的die数量则最少会提升4倍,没人同样的20个坏点在最坏的状态下也没人让芯片良率降低至95%。显然,这会在极大程度上降低AMD的制造成本。

其二,由于 不同功能模块彼此之间删改独立,有些进行升级或步进都不 变得更容易,成本也更低。

第三,这名chiplet思路也允许AMD解决器在片上(on chip而非in chip)整合不同IP、不同公司、不同功能、不同工艺的芯片,从而快速制发明符合市场需求的全新解决器或SOC。

对于解决器来说,chiplet是有三种相当先进的设计思路,还可以大大降低成本,错综复杂新产品的上市流程。不过chiplet也并不万能的,我不必做好高性能的CPU产品,AMD由于 台积电需要解决封装工艺上的诸多挑战,累似 于互联导体的电气性能、在更小的截面积上实现更高的数据传输强度、咋样在有效的面积上布置更多针脚等等。不过,既然Rome由于 还可以在这名框架下实现3.4GHz的频率和最高225W的TDP,没人AMD和台积电显然在这方面由于 获得了不少成功。还可以说第二代EPYC是目前chiplet模式中性能最高、功耗最高、频率最高的有三种形式,个中挑战并不一定。

Zen 2架构带来的惊喜

第二代EPYC的CPU设计架构

有了EPYC一代的良好开头,AMD显然由于 找到了正确的分类整理方向,并在第二代EPYC中进行了更加大刀阔斧型态增强。这其中就包括名为TAGE的全新分支预测架构、2倍的OP缓存容量、经过优化的L1指令缓存、几乎倍增的L1传输强度、第三代地址单元、2倍的浮点路径传输强度以及2倍的L3缓存容量。

这名大刀阔斧的的性能架构增强所带来的则是23%的核心执行传输强度提升。而配合8路DDR4 3400内存通道和最高4TB的内存支持容量(每核心最高64GB内存),AMD在有些对内存性能敏感的应用中都还可以取得性能优势。在发布会当天,苏姿丰博士表示:通过使用第二代EPYC解决器,AMD的合作者伙伴和用户由于 打破了全球400项性能记录。

PCI-E 4.0威力倍增器

同時 ,第二代EPYC还是目前全球第一款支持PCI-E 4.0的x86解决器。2倍于PCI-E 3.0的传输强度还可以让高数据吞吐量的设备获得更好的性能。

支持PCI-E 4.0的赛灵斯ALVEO U400网络加速卡

博通400G以太网卡

Mellanox ConnectX-6 400G Infiniband网卡

嘴笨 目前的多数应用型态(GPU、加速卡、网卡、HBA等)还无法充分享受到传输强度翻倍所带来的性能提升,但对有些高吞吐量的FPGA(累似 于应用在Spark Quary上的赛灵斯ALVEO U400)来说,更高的PCI-E总线传输强度显然还可以极大的提升单卡性能(在现场演示中,赛灵斯Spark Quary加速卡在换装PCI-E 4.0总线后数据吞吐量可提升1.7倍)。

另外,对于下下代(就目前而言,400G网卡属于过后推向市场的下一代产品,没人400G自然假如下下代了)网络来说,400G网卡也是需要PCI-E 4.0来作为总线的(400G网卡换算来的总线传输强度为12.8GB,刚好达到PCI-E 3.0 x16的上限,400G网卡自然就需要传输强度翻倍的PCI-E 4.0了)。在演示中,博通的400G网卡在PCI-E 4.0 x16环境下的一对一双向读测试中,数据吞吐量就还可以直接从192Gbps翻倍为381Gbps,性能提升立竿见影。

Mellanox的ConnectX-6 400G Infiniband网卡都不 着累似 于的表现,一对一双向写测试从202Gbps提高至395Gbps。

当然,随着闪存技术和主控性能的进一步增强,PCI-E 4.0对于有些高性能NVMe存储设备来说同样有着长远的意义(当然,由于 需要进入全面应用得话PCI-E 4.0 Switch及配套的标准也同样需要跟进和心智心智成熟 期期是什么期期期)。

由于 PCI-E 4.0控制器被集成在了IO核心之中,而所有产品的IO核心都删改一样,假如,无论十几次 核心、频率咋样的第二代EPYC产品,其最大支持的PCI-E 4.0 Lane数都为128(注意,即便是在双路系统中,在安装了两颗第二代EPYC过后,这名数量假如会翻倍;AMD给出的解释是IO核心需要将一定数量的Infinity Fabric连接留给核心之间的通讯)。

但无论咋样,另一另一一个的设计显然会给有些超融合、冷存储、防火墙、AI集群等应用等有些CPU负载不高的应用另一一个 更高性价比的确定。

生态之役将成胜败关键

在性能和功能上的巨大飞跃让AMD在产品端有能力重回数据中心主流市场。但十余年的落后却让AMD在生态上还有有些课要补,而这绝非像产品发布一样一蹴而就的事。

400+合作者伙伴

在发布环节,HPE、Dell、新华三、思科、超微、华硕、技嘉、华擎、泰安主板、Open 19等企业和组织就由于 展示了另一方的产品和设计,而在用户层面,包括AWS、Azure、Google Cloud等在内的三大云服务提供商也排除高管为AMD站台。而在国内,包括BAT在内的三大云巨头也都与AMD就第二代EPYC的应用展开了积极的合作者(新华三产品由于 就绪并在会议现场进行了展示)。但壮观的合作者伙伴名单对于数据中心应用来说却仍然不足。

除了系统制造商合作者伙伴和用户之外,EPYC系列我不必帮助AMD重新回到游戏还需要大量数据中心组件、操作系统、应用软件以及开源标准的支持。在AMD非公开展示的合作者伙伴名录中,亲戚我们我们 由于 还可以都看像三星、镁光、现代、西部数据另一另一一个的主流闪存和主控制造商,PMC另一另一一个的主控制造商,博通、Mellanox另一另一一个的网络设备制造商,微软、SUSE、红帽另一另一一个的操作系统提供商,SAP、Oracle、MongoDB、VMware、思杰另一另一一个的企业核心应用提供商以及如OpenStack、Docker、Spark、Java等开源组织的支持,但这对于整个数据中心生态来说仍旧是不足的。

没人,哪此过后才不是 构建了删改的企业级生态?帮我 应该是需要由于 无法提供合作者企业名单的过后才算够吧。而AMD距离这名状态还有很长的路要走。

由于 AMD还可以在未来的数代产品找那个保持这名性能、核心数量、型态上的领先(由于 最少持平),没人相信主动对AMD伸出橄榄枝的合作者伙伴会不要 ,AMD的生态亦会没人强大。而那时,AMD还可以重新将竞争带向Intel的城门口。

不过话又说回来,更多核心、更高频率、更先进制程、Chiplet架构等的出现标志着AMD由于 在向正确的方向发展。而这也让亲戚我们我们 对EPYC系列和AMD在数据中心领域未来的发展充满了期待。