请选择 进入手机版 | 继续访问电脑版

超级大本营军事论坛

 找回密码
 加入超大军事

QQ登录

只需一步,快速开始

查看: 2166|回复: 31
收起左侧

AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

[复制链接]
发表于 2019-1-5 09:09 | 显示全部楼层 |阅读模式

更多精彩专业军事内容,期待你的加入!

您需要 登录 才可以下载或查看,没有帐号?加入超大军事

x
本帖最后由 zhuzhancheng 于 2019-1-10 10:55 编辑



【18/11/14 补充AMD对Zen 2 IPC的说明、“Rome” 64核频率及双精度性能、Shasta超算的规格等消息,可以在文章相应部分红色字体找到】

AMD就在刚刚举办了Next Horizon活动,这次活动是针对数据中心的,不是普通的消费级产品发布。在活动上AMD宣布与亚马逊AWS的合作,发布了首款搭载Vega 20的显卡:Radeon Instinct MI60,揭晓了更多关于Zen 2架构的消息,同时现场演示了MI60和64核 Zen2 EPYC “Rome”的性能。本文将直接涵盖所有活动的内容。文章内容并非活动发布的顺序,是我重新整理过的。

活动的主旋律是TSMC 7nm - N7 HPC制程下的产品。HoriZon的“Z”里有个"7"。

点击相关标题跳转到文章内容。





世界首颗7nm GPU - Vega 20,主打HPC,PCIe 4.0



作为今年最后的发布之一【后面估计就还剩个P30】,Vega 20的规格大概是最没有悬念的了。
64CU + 32GB HBM2,1/2 FP64,PCIe 4.0。和之前的消息一致。




【btw:虽然AMD发布上没有提到Vega20,但David Wang在台上的时候一不小心说漏嘴了hhhhh:
David Wang:"(ROCm 2.0)....It comes with Vega twen...MI60"】



132亿晶体管,331mm2面积。N7 HPC带来了最多2倍的晶体管密度,同等功耗下1.25倍性能【其实就是频率】,同等频率下降低50%功耗。
简单算下就知道N7 HPC的密度比手机芯片用的N7 SoC的要低很多。
【官方都说了是最大2x密度提升。N7 SoC是3.3x,比如Kirin980的69亿晶体管,面积只有74mm2】
N7 HPC主要为高频率优化。在能效、密度上相比Intel 14nm有着明显优势。

Vega 20是AMD在N7 HPC上的第一款产品,可能也充当着试水的角色,不一定完全利用了N7 HPC的密度。
【更新:Vega20的某些部分晶体管密度更高,推测是为了缩短设计周期,同时又能够用到7nm的频率和功耗优势的考虑,所以并不能很好地反映N7 HPC的实际密度。而且有些IO电路在7nm下并没有减小多少面积。






几个月前预测的是大概340mm2,差了9mm2。有误差是难免的。
331mm2大概是Cypress【HD5870】和Tahiti【HD7970】的面积。




Vega 20主要瞄准数据中心市场,根据AMD预计该市场在2021年之前会达到120亿美元的TAM。


搭载Vega 20 GPU的首款产品为Radeon Instinct MI60,也就是会上发布的这款,4096SP,32GB HBM2。





Radeon Instinct MI60会是Vega 20的完整旗舰版本,AMD声称它是目前市面上最快的FP64/32 PCIe GPU。
MI60可以说是在MI25的基础上,向运算速度【INT8,机器学习】和运算精度【FP64,高性能计算】两头延伸。Vega20支持更多深度学习需要的指令集。

FP32性能达到14.7 TFLOPS, FP64为7.4 TFLOPS【1/2比率】,
FP16:29.4 TFLOPS;
INT8:59 TOPS,
INT4:118 TOPS。

换算过来Boost频率能达到1794MHz,比Vega 10的1677MHz高了不少。平均频率大约有10%的提升。
如果和同样300W TDP的MI25对比,Vega20在多了两块HBM2的情况下,频率增加了25%。

由于主打的是HPC,TMU/ROP应该会维持同样的256/64配置。
TDP 300W。后续非旗舰型号应该能压到150-200W左右。

还有Radeon Instinct MI50,预计为Vega 20的harvested版本,性能大概是MI60的90%左右,应该是切掉了几组CU。【更新确认:MI50切到了 3840SP,4组CU,16GB HBM2,300W TDP】

Radeon InstinctMI60/MI50/MI25 和 Tesla V100 /T4的对比




Radeon Instinct MI60和MI50都可以算主推HPC和机器学习的产品;AMD还把32GB的MI60的定位拓展到GPU虚拟化市场,比如云游戏、App串流等;而显存更小定位更低的MI50进一步瞄准ML inference市场。



带宽则是Vega 20显著提升的另一个地方,HBM2从2块变成4块,频率2Gbps,带宽达到1TB/s。由于是企业级产品,ECC当然是支持的。是完全的ECC,包括HBM2,还有CU里的SRAM,L2等都是ECC的。



Vega 20还是业界首款支持PCIe 4.0的GPU。相比PCIe 3.0, 4.0提供双倍的带宽,双向64GB/s【CPU到GPU】。正好Rome也支持PCIe 4.0,形成一个平台。



而多个GPU之间则是Infinity Fabric Link提供互联,每条IF能提供100GB/s的GPU间带宽,组成一个环形,多GPU效率比以往更高。这个很类似NVLINK。
看样子每颗GPU应该只有两条IF,没法组成更复杂的结构,会有GPU无法直接互联。

在现场看到了4块mGPU的XGMI Link
【更新:GPU显存访问延迟只有60-70ns,延迟非常低。】




Vega 20是AMD第三代支持硬件虚拟化的GPU,硬件虚拟化没有软件的overhead,没有授权费。
单GPU可以支持最多16个VM【虚拟化桌面】,单个VM也可以分配最多8个GPU【虚拟化计算】,灵活配置。



随着Vega 20/Radeon Instinct MI60的发布,AMD也发布了ROCm 2.0
ROCm是开源的,可以在AMD、NVIDIA的GPU上运行,也能在Intel CPU上运行。
支持最新的机器学习框架。支持Dockers和Kubernetes。
目前ROCm 2.0已经upstream给了上游的Linux内核发行组织。



Google


好的扯了这么多我知道你们肯定只关心性能。下面是AMD给出的官方性能数字

DGEMM
Vega20比Vega10在上快8.8倍
6717 GFLOPS vs 763 GFLOPS
【这是自然。因为Vega10只有1/16的FP64。不算频率的话Vega20的FP64理论性能为Vega10的8倍】



RESNET-50
Vega20是Vega10的2.8倍
498 vs 179


RESNET-50 TRAINING
多GPU效率
2 GPU达到1.99x【99.5%】
4 GPU达到3.98x【99.5%】
8GPU达到7.64x【95.5%】


对比Tesla V100 PCIe
双精度和单精度均强于V100


RESNET-50 TRAINING
大概为V100的94%性能



Radeon Instinct MI60将于本季度出货。


与此同时AMD还更新了数据中心GPU的路线图。
Vega20的下一代将会有更高性能,更多互联能力,更好软件兼容性。
至于名字“MI-NEXT”只是临时放在那里的占位符。


以上是本次活动关于GPU方面的所有更新。


最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 09:10 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

本帖最后由 zhuzhancheng 于 2019-1-10 10:56 编辑

Zen 2以及第二代 EPYC "ROME"
TSMC N7 HPC制程


和Vega20一样,Zen2也是用TSMC 7nm HPC工艺制造的。关于N7 HPC上面Vega 20已经有讲到。

AMD在设计当初考虑到代工厂的10nm属于半节点,带来的提升不是很明显,于是把赌注都下在了7nm节点上。



相较14/16nm,7nm HPC带来两倍的密度,同等频率下功耗只有一半,同等功耗下频率达到1.25倍以上。
N7 HPC的密度比N7 SoC要低。前者为高性能计算优化,需要频率;后者注重移动低功耗领域。

AMD在Next Horizon活动上拿的应该是TSMC CLN16FF对比,密度比14LPP还要低一些。



TSMC在7nm节点的进度明显快于三星和Intel。不得不佩服台积的实力。
在Zen2的研发过程中,AMD和TSMC有着紧密的合作关系。





Zen2架构:前端及浮点大幅加强

关于架构细节方面AMD并没有提太多,信息也给的很笼统,没法进一步分析。
个人不会没有事实依据就去预测。
如果有新的消息会第一时间更新。



作为世界上首款高性能x86 7nm CPU,Zen 2架构带来了各方面的显著提升。
总的来讲,Zen2在性能方面改进了如下几点

  • 改进了执行管线
  • 浮点和Load/Store翻倍
  • 核心密度翻倍
  • 单次运算耗能减半

Zen2的输出能达到Zen的两倍,IPC也有明显提升。
AMD内部用DKERN + RSA测试,Zen2的IPC为4.53,Zen的IPC为3.5,Zen2在这里比Zen高29.4%

【18/11/14更新:关于这个IPC测试AMD给出了进一步的声明:
“As we demonstrated at our Next Horizon event last week, our next-generation AMD EPYC server processor based on the new “Zen 2” core delivers significant performance improvements as a result of both architectural advances and 7nm process technology. Some news media interpreted a “Zen 2” comment in the press release footnotes to be a specific IPC uplift claim. The data in the footnote represented the performance improvement in a microbenchmark for a specific financial services workload which benefits from both integer and floating point performance improvements and is not intended to quantify the IPC increase a user should expect to see across a wide range of applications. We will provide additional details on “Zen 2” IPC improvements, and more importantly how the combination of our next-generation architecture and advanced 7nm process technology deliver more performance per socket, when the products launch.”
跟我说的一样,这个29%的IPC提升只是AMD内部跑的这个程序有29%的IPC提升,不代表其他类型的程序会有一样的结果。Zen架构的特性之一就是浮点+整数指令混合执行能达到最大指令吞吐量,29%属于比较理想的情况。

如果说平均IPC的话,个人的预计不会有30%这么高,10-15%差不多。
纯浮点提升会比较明显,整数相比之下提升就比较小。
但个别跑AVX的程序里可能会有远高于29%的性能提升。】

由于是浮点和整数混合测试,属于比较理想的情况。
如果能用上AVX的测试的确会有很大提升,因为Zen2主要加强的还是浮点性能。



首先是前端的改进:
  • 改进的分值预测单元
  • 更好的指令预取
  • 重新优化指令缓存
  • 更大的微指令缓存
这点显得尤其重要,因为Zen的前端被认为是最大的瓶颈之一。
改进的前端能够保证Zen2充分利用加强的后端处理管线,减少管线的等待时间。


浮点单元也得到了大幅加强,基本翻倍。
  • 依然是4个浮点单元,2MUL+2ADD,但指令宽度从128-bit翻倍到256-bit
  • Load/Store带宽翻倍
  • 增加Dispatch/Retire带宽
  • 各种模式下均能保持高输出
Papermaster说,AMD不是仅仅将FPU指令宽度翻倍,而是把前端的Load/Store也翻倍到256-bit,保证能在实际应用中看到性能提升。增加的dispatch/retire带宽还能让Zen2的FPU更高效地运行非矢量程序。

当初AMD设计把Zen的FPU设计成128bit就是因为当时【现在也是】的绝大多数程序依然只用得到128bit浮点指令,所以设计了非常高效的128bit FPU,结果也很成功。

Zen2则是这一设计决定的一次进化。保持架构的平衡。

对比Zen
同时还有安全上的加强。原本Zen架构就不受Intel架构专属漏洞Meltdown等的影响,在安全考虑上要强那么一点。
现在Zen2则更进一步,在硬件上加强Spectre漏洞的修复。


基于Zen2架构的EPYC,代号“Rome”



这个才是本次发布的重头戏,也是很多人最关心的。



第二代EPYC处理器,代号"Rome",单路将提供最多64核心,8通道DDR4,单路4TB内存,128条 PCIe4.0支持,更高的IPC,256MB L3缓存。单路输出达到Naples的两倍,浮点输出达到四倍。
7nm HPC制程,世界首先。Intel的10nm服务器得等到2020下半年。



都知道第一代EPYC用的是4x MCM,4块Zeppelin die用IF连接,成为AMD服务器平台的基石,在良率和密度上均有优势。



而第二代EPYC进行了大刀阔斧的改革,利用第二代Infinity Fabric将I/O部分分离成一颗独立的I/O die,使用14nm制程制造,位于封装中心;周围则是8颗7nm的CPU核心chiplet,每颗包含8个Zen2核心。【Zen架构Zeppelin也是每颗die 8个Zen核心,2x 4C CCX。至于Rome的8C CCX目前还没有确认。Next Horizon会后有人问了这个问题,AMD没有直接回答,说更详细的架构信息会在后续发表。
跟我之前说的一样,已经证实Rome依然是2x 4C CCX。

I/O die集成了很多东西,面积巨大,大概有440mm2左右,良率不会太好看。
【我也好奇AMD在IO die里还塞了些啥,大部分可能都被IMC占了
简单的小学数学:IF、IMC、IO这些玩意在Zen上占了将近一半面积,4块就是400mm2。这些东西是很占面积的。
Rome大概率不会在I/O Die上集成缓存。
Milan可能吧。只是可能。
拿eDRAM做成L4比较合适。Intel 22nm 128MB的Crystal Well只有84mm2。】

但这是服务器用的,比起服务器的margin来讲这点成本就不算高了

桌面AM4如果沿用同样的Chiplet,就需要集成一个更小的IO die,切成四分之一。


7nm的CPU chiplet和I/O die之间采用点对点的IF连接【互相通信需要通过IO Die】,IMC和I/O都在I/O die上。
两颗7nm的CPU chiplet比一颗14nm Zeppelin还要小。
粗略计算两颗7nm CPU Chiplet的封装面积是单颗14nm Zeppelin的68%。
单颗7nm CPU Chiplet的封装面积是单颗14nm Zeppelin的32%。

当然CPU chiplet也就去掉了IMC、IO等等IP模块。L3缓存从Zeppelin的16MB翻倍至32MB。

像CPU核心、缓存这些逻辑元件能用7nm制程大幅缩小,某些IP模块则从中收益不大。
Rome的设计就是将正确的制程用在正确的地方。


实物图 图源:computerbase.de


这样能够达成更低延迟,更低功耗,弥补第一代EPYC "Naples"上出现的部分不足。



Rome也是首个支持PCIe 4.0的x86服务器CPU,一共128条。PCIe 4.0带来64GB/s的双向带宽,相比3.0翻倍,对于加速卡等的性能发挥很重要。



兼容、升级性:Rome向后兼容目前的Naples平台 —— Socket SP3 LGA4094,
同时向前兼容Zen3架构的第三代EPYC,N77nm+工艺的Milan【更新:AMD还在看三星7nm EUV 7LPP的性能如何,目前尚未确定工艺。】

当然,如果用Naples的老平台就没法用PCIe 4.0咯

18/11/14更新:在SC18现场的"Rome"原型单路主板图
技嘉的MZ32-AR0
目前在售的Naples的相应型号为MZ30-AR0和MZ31-AR0
可以看到大致布局和MZ31-AR0基本相同
只是有5条PCIe x16插槽升级为了4.0

"Rome"平台和"Naples"平台互相兼容,要兼容的话供电需求就不能有多少变化。预计单路高核心数 Rome的TDP在180-205W左右。

最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 09:22 | 显示全部楼层
呼叫黄老邪,有人来砸场子了……
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 09:24 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

本帖最后由 zhuzhancheng 于 2019-1-10 10:56 编辑


图源:stocktwits.com


这个是MZ30-AR0



【18/11/13更新:Anandtech和AMD CTO Papermaster的访谈中提到了一些新信息,这里是摘要:



All roads lead to Rome !





N7 HPC密度、Zen2芯片面积相关分析
看到某低能拿着Vega20预测N7 HPC的密度,觉得很有必要说明一下。
大致的我上面已经说到了,Vega20并不能很好地代表N7 HPC的密度,这里不再重复。
当然我也不会像某些人张口就来IO Die“600mm2”之类的话。

本人只会根据已有事实,要有数据支撑再进行合理的推断。

首先,根据现场照片粗略估算:单个8C 7nm Chiplet的面积大概在72-75mm2,I/O Die大概有425-440mm2。整个"Rome"的8颗Chiplet + I/O Die 大概在1000-1040mm2。



14LPP制程下单个Zen CCX面积为44mm2, 目前已知的Zen2改进点主要是前端、浮点和L3

好的下面开始胡扯:

前端和浮点这一堆东西占了单个14nm Zen核的将近60%面积。单颗Zen核面积为7mm2。

如果算上Zen2的各项改进,保守估计:4个 Zen2核心+L3 在14nm下大概需要67-70mm2,8C+L3 就是134-140mm2,大概30-32亿晶体管。

这还是只算了8个Zen2核心+32M L3,不算目前未知的其他改进和其他chiplet内的模块的结果

用N7 HPC 做到70+mm2,密度你说是多少?的确接近AMD官方说的最高两倍。

AMD把能充分7nm密度优势的东西都放进chiplet了。
此外,如果同样的chiplet拿给AM4用,把IO Die切成四分之一:

两个7nm Chiplet = 140-150mm2
AM4 IO Die = 100-110mm2
一共240-260mm2,没比Zeppelin大多少。
显然Zen 2 AM4上
16C【比如Ryzen 7 3700X】是可行的,但并不代表AMD就100%会这么做。

如果在IO Die上集成两套不同的IMC还能继续兼容现有平台,不用改动Chiplet,对有效利用设计资源有很大的帮助。【比如Skylake就集成了DDR4和LPDDR3/DDR3L的两套IMC】
现在Client端的DDR5定档2020,大概只有Zen3才有希望支持吧。

预测终究是预测,没法做的很精确,总比毫无事实依据的异想天开要好。






性能如何?


这次AMD在现场小小演示了一下64核 Rome的性能。
理论上Rome的单路输出是Naples的两倍【因为有两倍核心】
浮点输出是Naples的四倍【因为有两倍核心x两倍浮点宽度】
但理论终究是理论,实际性能只有测了才知道。



在现场AMD用Cray 4K测试,对比目前Intel的最强Skylake-SP系统和AMD的Rome
Cray是Linux上常用的浮点性能测试。【AMD说测试用的是AVX2】
Intel:双路白金至强 Xeon-SP Platinum 8180M, 56C/112T,3TB DDR4
AMD: 单路 Zen2 EPYC "Rome", 64C/128T, 4TB DDR4


结果单路Rome用时28.1秒,双路白金至强8180M用时30.2秒。
双路打单路,结果单路更快。
而且Rome用的是风冷、未超频、频率还不是最终版的原型系统

btw: 双路白金至强性能是比Cascade Lake-AP要强的。而且Cascade Lake-AP的功耗注定了要水冷。

仅凭Cray一个测试无法完全判断性能到底如何,AMD作为厂商当然会选对自己有利的测试进行demo。
不过还是很震撼。性能上优势巨大,更不用提能效。

P.S. AMD在后面又给看了一个DEMO,也是CRAY,用的应该是AVX2【AMD的人这么说的】。
双路Skylake-SP 8180M vs 单路64C Rome vs 双路Naples EPYC 7601

双路 8180M用时30.5秒
双路 7601 用时28.4秒
单路 Rome 用时27.7秒


第二代EPYC "Rome” 将于2019年发布。随着发布的临近,会有更多的信息更新。







最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 09:25 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

本帖最后由 zhuzhancheng 于 2019-1-10 10:57 编辑

HLRS的“Hawk”超算将采用“Rome” 64核处理器,曝光“Rome” 频率及性能信息


18/11/14更新:这则发布也发表于SC18大会,由于关联度很高就一起放在这里

HLRS的“Hawk”超算将采用“Rome” 64核处理器,共10000颗,合计640000个Zen 2核心,双精度算力24.06PF/s (DP)。

算下来每颗 “Rome” 跑 AVX2 双精度性能能有2.4 TFLOPS!
Skylake-SP顶级的白金至强 8180 AVX512 DP性能为2.06 TFLOPS【AVX512会大幅降频】
AVX2 DP性能为1.25 TFLOPS
Cascade Lake-SP在这方面不会有明显提升,Cascade Lake-AP单路由两颗Cascade Lake-SP MCP组成,最高48核心,CLX-AP在AVX512双精度上会胜过Rome,只是 1.功耗爆炸 2.需要水冷。






主频2.35GHz,应该是基础频率。在核心数翻倍的情况下比EPYC 7601还要高7%,要知道两者的供电规格相近,Rome兼容现有的Naples平台,TDP大概在180-205W范围。


图源:anandtech






EPYC路线图更新,Zen4研发中

发布会一开始Mark Papermaster就提到Zen2和Zen3的进度一切正常,Zen3 On track。
这里强调了路线图的稳定性,“AS PROMISED”,颇有一番讽刺隔壁的意味。


Papermaster称设计队伍采用蛙跳式的策略,始终有两款架构在研发中。
与某些谣言网站所称的恰恰相反,AMD并没有跳过Zen4。【从来都没有。】
现在Zen2已经开始出样,后面就是Zen3 Milan和Zen4了。Zen4目前还处于设计阶段



以上是本次活动关于Zen2的所有信息。




亚马逊AWS部署EPYC主机

看来财报上说年底前的4-6%市占率的确有可能啊。。

据AMD预测,2021年之前数据中心的TAM将达到290亿美元

AMD去年发布的的EPYC服务器和Radeon Instinct加速卡被业界采用的情况



早在去年就发布的EPYC平台,由于企业级领域和普通消费级不同,需要很长的验证周期,所以直到最近才能看到有各种大客户采用的消息,比如Dropbox,微软Azure,甲骨文等。



AMD想让最多的用户能接触到EPYC,所以就需要和行业老大合作。而云服务行业的No.1 当然还得是亚马逊AWS。

AMD宣布亚马逊AWS将在亚马逊EC2云服务器上部署EPYC平台。这对AMD EPYC平台而言意义重大。
今天起就能使用的有R5a和M5a实例。T3a 需要等一段时间。

R5a,M5a和T3a均采用2.5GHz AMD EPYC处理器,是AMD给AWS的定制型号。



EPYC平台的TCO有很大优势。总体成本更低。


M5a和R5a规格表
目前可以用的有US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Ireland), 和 Asia Pacific (Singapore) 节点,有按需(On-Demand)、竞价(Spot)和保留(Reserved)实例形式可选。
价格比现有的同等级实例便宜10%






AMD与CRAY合作打造超算 NERSC-9,“Shasta”将采用Zen3 "Milan" EPYC CPU

AMD还宣布和Cray合作打造新的Shasta超算系统,美国NERSC的下代NERSC-9系统就会用它。
NERSC-9系统代号“Perlmutter”(以诺奖得主Saul Perlmutter命名),采用AMD EPYC + Nvidia GPU,运算能力 100+PFLOPS,预计2020年底交付。

【18/11/14更新:这部分内容来自于SC18大会,作为后续的跟进内容放在这里。
Shasta超算系统将采用AMD Zen 3 EPYC "Milan" + NVIDIA Volta的下代GPU
每个CPU+GPU节点:1x AMD "Milan" + 4x NVIDIA "Volta-next" GPU,4x Cray的Slingshot互联(4x25GB/s),Cori的2-3x性能



纯CPU节点:1x AMD "Milan",8通道内存,每节点至少256GB,1x Slingshot互联。
文件系统采用纯闪存,也就是没有HDD。



NERSC-9 Perlmutter将提供前代“Cori” 3-4倍性能,功耗>5MW
下代的NERSC-10将会是Exascale级别,预计2024年。


路线图 via:tomshardware

关于"Milan"  DOE的发言人没有给出多少信息【目前Zen 3的所有信息都是NDA状态】,只知道是Zen 3架构,7nm+工艺。PPT里放的都还是Rome的规格占位。
Volta下代则是>7 TFLOPS (DP), >32GB HBM2, NVLINK

Milan的核心数、频率、内存规格至少是和Rome同等级,或者高于Rome。

图源:tomshardware

Shasta CPU节点为水冷设计,内置8颗 Zen 3 “Milan” CPU,4个铜制水冷头下面是4个Milan EPYC,剩下的4个则是一样的安装方式,只是方向相反,在绿色的PCB上。

那么问题来了,这里面到底有没有“Milan”的实物。
AMD官方说的是18年下半年“Rome”出样,“Milan” 按计划进行。目前“Milan”应该还处于设计-极早期原型阶段。最近也没有说Milan有流片的消息。
现场展示的这台机子并没有给你看CPU。只看得到水冷模块、PCB和插在里面的内存。

可能性大概就三种,依次递减

  • 可能只给你看了台没插CPU的机子
  • 可能只给你看了台插了“Rome” CPU和内存的机子 供展示用,而且“Rome”和“Milan”是兼容的
  • 真的给你看了有极早期“Milan”工程样品的机子【基本不可能】

NERSC-9是2020年底交付,有充足的时间给Milan。】




除了NERSC-9之外还有个更大的项目。美国能源部的“Coral 2” Exascale 级别超算系统计划很可能会有一台AMD EPYC系统。这个目前还没有公布。

Coral-2项目计划三台Exascale超算,第一台是已经跳了票的Aurora A21超算,是Intel/Cray的。
后面两台是ORNL的“Frontier” 和LLNL的“El Capitan”。Aurora已经跳到了2021年,后面两台只会更晚。


MOEPC.NET整理编辑,转载请保留出处。
EPYC2 图源:computerbase
AMD Zen2 IPC声明:AMD via notebookcheck
Rome 原型主板图:stocktwits
Shasta超算信息:tomshardware
HAWK超算信息:anandtech

最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 09:28 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

马利奥 发表于 2019-1-5 09:22
呼叫黄老邪,有人来砸场子了……


你插楼之后我都不知道怎么搞了
不过话说这个转帖确实不方便,懒得一点一点修改了
有兴趣去原贴看看
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 11:39 | 显示全部楼层
上个月出差闲着没事上网看了看锐龙3规格,3代锐龙桌面版最低6核起,800块钱买6核12线程,1500买8核16线程,2200买12核24线程,3000多能买到16核32线程,这个以后个人桌面机到处都是8核12核的工作站配置了吧
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 13:16 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

和谐电3D 发表于 2019-1-5 11:39
上个月出差闲着没事上网看了看锐龙3规格,3代锐龙桌面版最低6核起,800块钱买6核12线程,1500买8核16线程, ...

多亏了按摩店,否则还不被英特尔坑死
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 14:03 超大游击队员 | 显示全部楼层
拳打英特尔,脚踢英伟达
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 14:04 | 显示全部楼层
好像最近英特尔从按摩店挖了不少大牛,zen1的设计师也被挖走了?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 14:35 | 显示全部楼层
amd,yes   
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 15:17 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息


12核24线程的3700美国卖299美金,到中国估计至少2600~2800这种价位吧,频率更高的3700X估计要上3500;16核32线程的R9在我国估计4500~5000的价位
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 15:20 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

很讨厌超大 发表于 2019-1-5 14:04
好像最近英特尔从按摩店挖了不少大牛,zen1的设计师也被挖走了?

没办法,大牛就是大牛
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 15:21 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

飘渺一孤舟 发表于 2019-1-5 14:03
拳打英特尔,脚踢英伟达

等CES2019吧,到时候好坏都会见真章
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-5 15:21 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息


多亏了AMD,我等屌丝也才用得起电脑
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
头像被屏蔽
发表于 2019-1-5 15:59 超大游击队员 | 显示全部楼层
和谐电3D 发表于 2019-1-5 11:39
上个月出差闲着没事上网看了看锐龙3规格,3代锐龙桌面版最低6核起,800块钱买6核12线程,1500买8核16线程, ...

还是得有竞争啊,g4560价钱从开初的300块反而越来越贵翻了一倍,也就是现在新速龙才让人看到了低端市场的新活力。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 16:35 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

半截冰棍 发表于 2019-1-5 15:59
还是得有竞争啊,g4560价钱从开初的300块反而越来越贵翻了一倍,也就是现在新速龙才让人看到了低端市场的 ...

500以内还真没啥好用的东西,希望3代zen架构的4核低端apu能卖500左右
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-5 16:39 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

半截冰棍 发表于 2019-1-5 15:59
还是得有竞争啊,g4560价钱从开初的300块反而越来越贵翻了一倍,也就是现在新速龙才让人看到了低端市场的 ...

京东还有FX8300和技嘉970主板卖,8核的还是,而且D3内存也便宜,还支持win7
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
头像被屏蔽
发表于 2019-1-5 16:44 超大游击队员 | 显示全部楼层
和谐电3D 发表于 2019-1-5 16:39
京东还有FX8300和技嘉970主板卖,8核的还是,而且D3内存也便宜,还支持win7

家庭环境,单核性能还是好一些的好。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-7 22:02 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

半截冰棍 发表于 2019-1-5 15:59
还是得有竞争啊,g4560价钱从开初的300块反而越来越贵翻了一倍,也就是现在新速龙才让人看到了低端市场的 ...

和竞争无关,G4560涨价主要是因为支持WIN7
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-10 10:45 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

本帖最后由 zhuzhancheng 于 2019-1-10 10:48 编辑
半截冰棍 发表于 2019-1-5 16:44
家庭环境,单核性能还是好一些的好。



AMD 在现场也做了一下8C/16T Matisse 的实机打脸演示。
规格还不是最终版本,最终版本的性能会更高。
这颗有可能是上面那个65W 的ES4。
老少皆宜的Cinebench R15了。
对比Intel的9900K
Matisse 8C:2057cb
9900K: 2040cb
该分数没有问题,和默认9900K水平一致。两套系统除CPU和平台外配置都是一样的。
由于频率未定,最终版的8C/16T 性能应该会高于9900K。



接下来是重点:演示同时有显示系统功耗

9900K的系统功耗180W左右

Matisse 8C 系统功耗只有133W左右,低了26%,这是同等性能。

注意这是系统功耗。如果刨去其他部件只算CPU,功耗的差距还会更大,Matisse 的能效优势很明显。
那么问题来了:这颗Matisse 究竟跑在什么频率。
如果是和9900K一样的全核4.7GHz,IPC会和Skylake Client持平;
如果频率高于4.7,IPC会低于Skylake Client;
如果频率低于4.7,IPC就会高于Skylake Client
还要考虑AMD的SMT效率
而且AMD说还有提升余地。。。性能只会高不会低。

via:MoePC.net, 地址:http://www.moepc.net/?post=5161
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 18:13 超大游击队员 | 显示全部楼层
zhuzhancheng 发表于 2019-1-10 10:45
AMD 在现场也做了一下8C/16T Matisse 的实机打脸演示。
规格还不是最终版本,最终版本的性能会更高 ...

期待5nm EUV的Zen
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 21:14 | 显示全部楼层
8C/16T。。。还有提升余地。。。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 21:45 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

zhuzhancheng 发表于 2019-1-5 13:16
多亏了按摩店,否则还不被英特尔坑死

有竞争才有价格优惠
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-11 14:09 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息


光看不买有什么用?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 14:48 超大游击队员 | 显示全部楼层
本帖最后由 shinobiyan 于 2019-1-11 15:26 编辑
zhuzhancheng 发表于 2019-1-11 14:09
光看不买有什么用?


PC平台还真不一定买因为笔记本换代基本还是考虑Intel,XBOX2或PS5已经决定要来一台。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-12 08:26 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息

shinobiyan 发表于 2019-1-11 14:48
PC平台还真不一定买因为笔记本换代基本还是考虑Intel,XBOX2或PS5已经决定要来一台。

XBOX2和PS5已经决定要跟按摩店在一起了
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 08:57 超大游击队员 | 显示全部楼层
zhuzhancheng 发表于 2019-1-12 08:26
XBOX2和PS5已经决定要跟按摩店在一起了

你才知道啊。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
 楼主| 发表于 2019-1-12 10:05 | 显示全部楼层

RE: AMD Next Horizon活动汇总:发布首款7nm GPU Vega 20,揭晓更多Zen 2架构信息


我以为你才知道
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 17:44 超大游击队员 | 显示全部楼层
Intel家的12代GPU和按摩店的NAVI有冲突吧
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 18:34 超大游击队员 | 显示全部楼层
shinobiyan 发表于 2019-1-12 17:44
Intel家的12代GPU和按摩店的NAVI有冲突吧

按摩店GPU部门今年是放弃治疗了。CES根本没有NAVI的消息。就发布了个Radeon 7。三百瓦的电老虎,性能只和2080持平。16GB显存对游戏玩家来说似乎没什么卵用…
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-14 08:50 超大游击队员 | 显示全部楼层
ericcui1 发表于 2019-1-12 18:34
按摩店GPU部门今年是放弃治疗了。CES根本没有NAVI的消息。就发布了个Radeon 7。三百瓦的电老虎,性能只和 ...

确实,7nm VEGA就是个优化版,架构还是老的。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
您需要登录后才可以回帖 登录 | 加入超大军事

本版积分规则

指挥中心大屏幕

监狱|手机|联系|超级大本营军事论坛 ( 京ICP备13042948号 | 京公网安备11010602010161 )

声明:论坛言论仅代表网友个人观点,不代表超级大本营军事网站立场

Powered by Discuz © 2002-2019 超级大本营军事网站 CJDBY.net (违法及不良信息举报电话:13410849082)

最具影响力中文军事论坛 - Most Influential Chinese Military Forum

GMT+8, 2019-1-20 12:57 , Processed in 0.080580 second(s), 8 queries , Gzip On, Redis On.

快速回复 返回顶部 返回列表