请选择 进入手机版 | 继续访问电脑版

超级大本营军事论坛

 找回密码
 加入超大军事

QQ登录

只需一步,快速开始

收起左侧

华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

[复制链接]
发表于 2019-1-10 17:25 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-10 16:50
我说的是ipc,现在A12同频性能比Skylake高3成到7成。

那还到不了POWER9的等级啊
Intel E3-1280 (3.9GHz)的SPEC CPU 2017 得分只有29.0-31.0
和POWER9  (最高3.8GHz)的 392-475 比完全是被碾压的差距。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 17:25 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

本帖最后由 水果派派88 于 2019-1-10 17:27 编辑

重复删除      
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 17:46 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

水果派派88 发表于 2019-1-10 17:25
那还到不了POWER9的等级啊
Intel E3-1280 (3.9GHz)的SPEC CPU 2017 得分只有29.0-31.0
和POWER9  ( ...

http://spec.org/cpu2017/results/res2018q3/cpu2017-20180805-08109.html

这不是挺正常,难道e3-1280一个4核u的跑分要赶上4路共40核P9才正常吗?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 18:23 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-10 17:46
http://spec.org/cpu2017/results/res2018q3/cpu2017-20180805-08109.html

这不是挺正常,难道e3-1280 ...

你不是在比IPC吗?
四百多就算除4再和1280去比也比Skylake的170%高很多啊
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 19:50 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

水果派派88 发表于 2019-1-10 18:23
你不是在比IPC吗?
四百多就算除4再和1280去比也比Skylake的170%高很多啊

40核和4核比为啥除以4?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 21:11 | 显示全部楼层
ARM架构的服务器CPU
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 23:10 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

壮东风 发表于 2019-1-10 14:17
我没否认微架构的作用。
处理器的性能是一系列因素的综合,缓存是非常重要的一环。
现在麒麟980、猎户 ...

今天看评测的时候想到一个问题,spec speed测试是单线程的,意味着即便是Cortex芯片在测试时负载大核也能用上至少2M L2,980的核心干脆能用4M,早就不会形成瓶颈了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 23:15 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-10 23:10
今天看评测的时候想到一个问题,spec speed测试是单线程的,意味着即便是Cortex芯片在测试时负载大核也能 ...

麒麟980一个大核只能用到512K L2,而4M L3不仅隔了一层,速度还慢。
L3主要是为了数据命中的,这也是至强铂金按核心数配置L3的原因(锐龙也是这个套路,配得还更多)。
苹果因为已经有了足够的L2,还是共享的,就没必要配L3了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-10 23:43 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

壮东风 发表于 2019-1-10 23:15
麒麟980一个大核只能用到512K L2,而4M L3不仅隔了一层,速度还慢。
L3主要是为了数据命中的,这也是至 ...

一回事儿,core架构多少年用的就是这种3级缓存体系,在spec speed测试里是没什么瓶颈可言的。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 09:12 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-10 12:37
A12x的CPU性能远高于x1x,GPU比x1x差一大截。

有出处吗?

Google a12x vs i7-6700HQ,只看到了GeekBench的测试对比。但是GB对于x86的性能评估有问题(参考Linus的吐槽)

其它测试(比如https://www.laptopmag.com/reviews/laptops/new-ipad-pro-2018-129-inch)应该是GPU以及专用DSP的使用有关有关吧?不知道他的测试条件。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 09:46 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-10 23:43
一回事儿,core架构多少年用的就是这种3级缓存体系,在spec speed测试里是没什么瓶颈可言的。

Core i7 Xeon 5500 Series Data Source Latency (approximate)               [Pg. 22]

local  L1 CACHE hit,                              ~4 cycles (   2.1 -  1.2 ns )
local  L2 CACHE hit,                             ~10 cycles (   5.3 -  3.0 ns )
local  L3 CACHE hit, line unshared               ~40 cycles (  21.4 - 12.0 ns )
local  L3 CACHE hit, shared line in another core ~65 cycles (  34.8 - 19.5 ns )
local  L3 CACHE hit, modified in another core    ~75 cycles (  40.2 - 22.5 ns )

remote L3 CACHE (Ref: Fig.1 [Pg. 5])        ~100-300 cycles ( 160.7 - 30.0 ns )

local  DRAM                                                   ~60 ns
remote DRAM                                                  ~100 ns

指令级的数据如上,实际根据不同应用对性能的影响差距很大,看命中率
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 13:08 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

汉唐风月 发表于 2019-1-8 13:34
柳总:创新就是找死。

hahaha


在找死和等死之间,总有勇者在前进
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 13:12 超大游击队员 | 显示全部楼层
leekkeek 发表于 2019-1-11 13:08
hahaha



柳总:你们找死去吧,我等死好了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 17:07 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

本帖最后由 deam 于 2019-1-11 17:09 编辑
keeperx1 发表于 2019-1-11 09:12
有出处吗?

Google a12x vs i7-6700HQ,只看到了GeekBench的测试对比。但是GB对于x86的性能评估有问题 ...


PS Lightroom是纯CPU测试:https://www.laptopmag.com/articles/new-ipad-pro-benchmarks

贴吧还有vp9 8k视频解码,大约相当于7700hq水平;
国外一个关于科学计算的测试:https://homes.cs.washington.edu/~bornholt/post/z3-iphone.html,6700k水平
贴吧最近一个贴是ppsspp模拟器测试,也是7700hq水平
最后就是anand的spec int测试,单线程跑45分,和4g Skylake的gcc跑分差不多。

另外linus吐槽gb是在gb3时代,主要说的是gb3的测试项目里加密解密一项占比略高影响公平性。但gb4不仅修正了这个问题,而且intel cpu的gb4加密解密测试分数一直很高。从已有的一些跨平台应用项目来看,gb4实际上已经是非常有代表性的跨平台测试集了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 21:29 超大游击队员 | 显示全部楼层
deam 发表于 2019-1-11 17:07
PS Lightroom是纯CPU测试:https://www.laptopmag.com/articles/new-ipad-pro-benchmarks

贴吧还有v ...

这个测试我也看到了,但是上面没有说是纯cpu。按照以前的经验,ipad上由于硬件配置比较确定,GPU加速几乎是肯定的。按照apple的说法,a12x是xbox one s级别的GPU,比i7强不少的。这个是苹果设备的一大优势。

GB4 linus也有吐槽,一个是camera测试,一个是内存测试。当然他认为比3好很多。但是具体数值有多少偏差,就不知道了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 21:59 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

keeperx1 发表于 2019-1-11 21:29
这个测试我也看到了,但是上面没有说是纯cpu。按照以前的经验,ipad上由于硬件配置比较确定,GPU加速几乎 ...


贴吧有人试过,Lightroom就是纯CPU运算。GPU加速的是Pr rush,那个优势大的不可思议。

任何测试集都有自己的优势和缺陷,这是免不了的。而从现有的跨平台重负载应用测试来看gb4算是代表性非常好了,实际上将来更多应用移植到iOS上以后A12x的平均优势还会更大,以后gb4恐怕就是A12x跑分优势最小的项目之一了。

这代iPad我没买所以没法验证其它几个项目,但从一些信息来看7zip、文明6的回合解算、x265编码这些测试里A12x也能跑到至少6700hq的水平。众所周知6700hq满载功耗在40w以上,而A12x的CPU满载只有12w上下。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 22:45 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-11 21:59
贴吧有人试过,Lightroom就是纯CPU运算。GPU加速的是Pr rush,那个优势大的不可思议。

任何测试集都 ...

lightroom纯CPU我不太相信啊,有GPU不用是犯罪。印象中adobe的软件在用外置显卡的PC上还可以启用CPU自带的GPU。

文明6为了移植switch做了不少工作,ARM版本AI上是否有简化(几乎肯定有)不是很清楚。毕竟在switch上跑的很流畅。X265编码完全看是否用到专用电路,或者GPU,除非可以确定只使用了CPU - 我估计只能开源软件自己关闭相应选项,自己编译测试了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-11 23:05 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

本帖最后由 deam 于 2019-1-11 23:09 编辑
keeperx1 发表于 2019-1-11 22:45
lightroom纯CPU我不太相信啊,有GPU不用是犯罪。印象中adobe的软件在用外置显卡的PC上还可以启用CPU自带 ...


有一个Mac应用叫gamebench可以检测与Mac链接的iOS设备的应用运行时的CPU和GPU利用率,从这里可以知道lr在raw转jpg时的确没用gpu。

x265编码也是确定完全只用了CPU,实际上在iOS上测这个只能使用一些小开发者的ffmpeg移植版,这些移植版根本就没能力做Metal或OpenCL加速移植。之前我自己跑过这类应用,的的确确就是纯CPU编码。反过来说在其它能够支持GPU编码的应用中A12x的优势就不是一点半点了,Pr rush就是典型的例子。

文明6的话,任何版本跑到百回合以后必然会出现每回合运算很久的情况,iOS也不例外。如果做了简化压根就不会有这种现象,事实上也没必要。

总之,现有的能够进行跨平台对比的重负载应用,A12x都能表现出至少满载6700hq的性能,一些情况下追上6700k都能做到。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 01:28 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-11 23:05
有一个Mac应用叫gamebench可以检测与Mac链接的iOS设备的应用运行时的CPU和GPU利用率,从这里可以知道lr ...

即使作为半个果粉(已经有好一阵没有升级iphone,ipad了)对这个测试结果仍然表示怀疑。没有时间查其它测试对照子系统的配置,但是我怀疑这仅仅是CPU性能差距的结果。

检查CPU,GPU使用率,Xcode应该更可信吧。不过我很多年没用了。

编码和转码主要是测CPU浮点部分性能(应该是Neon SIMD性能),A12X的浮点性能如此强劲,难道Neon的发射数提高了?

简化AI其实很容易的,比如设置较浅搜索深度就可以了。

现在的基准测试还是太少,我准备还是等等再下结论。另外,A12X与i9的性能差距巨大,所以估计apple笔记本和MAC还不会切换到自家芯片上,但是未来如何发展不好估计。我觉得大概率这个差距不可能被弥补。

其实我更关注Arm公版对X86的性能比较。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 01:44 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

本帖最后由 deam 于 2019-1-12 01:45 编辑
keeperx1 发表于 2019-1-12 01:28
即使作为半个果粉(已经有好一阵没有升级iphone,ipad了)对这个测试结果仍然表示怀疑。没有时间查其它测 ...


gamebench就是利用了Xcode接口来检测使用率的,相当于一个壳。

编码和转码主要考验整数矢量性能(浮点占比不是特别大),A9开始的苹果核心都有3个矢量单元,跑128bit指令时同频理论效率比Core高一半,而实际输出时因为其它方面的架构优势效率会更高些。所以即便现在ffmpeg已经为avx2指令集做了很多优化,A12x依旧表现出惊人的性能优势。类似的情况出现在ppsspp模拟器测试中。

Anand测试iOS的文明6时发现iOS版本仅仅是PC版本的简单移植,而且做的比较粗糙。换句话说开发商根本就没做什么优化。

A12x仅仅有4个大核,在2.5G频率下就能跑出3.5g甚至更高水平的4核Core的性能,功耗却只有1/3。也就是说只要继续增加核心并稍稍提升一下主频,苹果就能做出在笔记本到工作站上碾压对手的CPU来。这也就是为什么众多消息都指出Mac在2020年就会开始换芯了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 03:42 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

deam 发表于 2019-1-12 01:44
gamebench就是利用了Xcode接口来检测使用率的,相当于一个壳。

编码和转码主要考验整数矢量性能(浮 ...

Neon SIMD就是矢量部分。一般有合适的优化,这部分计算吞吐量可以做到和理论值接近。我怀疑ipad pro的存储读写速度是否快不少?从设计取向看来,apple准备把ipad搞成专业多媒体内容制作设备?

我可以查到的Anand文明6测试只有fps测试,没有看到turn time的测试。AI的调整可能就是一个参数调整,不算深度优化。不过没有接触源代码,所以很难说到底是什么原因。但是我倾向于开发商至少为switch做过优化调整。

A12X的晶体管数量已经很高了,不知道Apple内部风冷可以跑到多少频率。不过有的时候,频率不容易简单提升,和设计取向有很大关系。拭目以待吧。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 03:57 | 显示全部楼层

RE: 华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz 性能创纪录

本帖最后由 deam 于 2019-1-12 04:00 编辑
keeperx1 发表于 2019-1-12 03:42
Neon SIMD就是矢量部分。一般有合适的优化,这部分计算吞吐量可以做到和理论值接近。我怀疑ipad pro的存 ...


这几个测试和存储没什么关系,对比设备都配备高性能ssd,也不是瓶颈。

给switch做优化和iOS上的无关,因为anand发现iOS版本就是pc版直接移植过来的。没有那么多“原因”,简单来说就是A12x性能强而已。倘若iOS版本的ai是劣化的早就被玩家发现了,但并没有任何这类报告。

以现在苹果架构的高ipc来说,频率再提升一点就足够了。而塞很多核心则是轻而易举的事情。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
发表于 2019-1-12 09:17 超大游击队员 | 显示全部楼层
deam 发表于 2019-1-12 03:57
这几个测试和存储没什么关系,对比设备都配备高性能ssd,也不是瓶颈。

给switch做优化和iOS上的无关 ...

塞很多核心也不算轻而易举吧。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
您需要登录后才可以回帖 登录 | 加入超大军事

本版积分规则

指挥中心大屏幕

监狱|手机|联系|超级大本营军事论坛 ( 京ICP备13042948号 | 京公网安备11010602010161 )

声明:论坛言论仅代表网友个人观点,不代表超级大本营军事网站立场

Powered by Discuz © 2002-2019 超级大本营军事网站 CJDBY.net (违法及不良信息举报电话:13410849082)

最具影响力中文军事论坛 - Most Influential Chinese Military Forum

GMT+8, 2019-1-22 16:46 , Processed in 0.056419 second(s), 8 queries , Gzip On, Redis On.

快速回复 返回顶部 返回列表