▼Threadripper 3990X:让你见识什么叫真正的“发烧级CPU”
先对比一下三款发烧级平台旗舰的规格、再加上与之规格非常相似的EPYC 7742。

CPU参数点评:
从规格上看,Threadripper 3990X与EPYC 7742比较相似,同样基于7nm ZEN2架构,同样为64核128线程,三缓均为256MB,都支持PCIe Gen4。

而不同的地方,就是通道(包括PCIe和内存)的数量,内存容量上限与基础频率等地方了。至于为什么做这样的变动,这就关乎到两种处理器面对的应用场景需求了。

简单讲讲,服务器通常需要面对大量的并行数据处理情景,比如多虚拟机同时运作,四通道的内存带宽就可能不够数量众多的虚拟机同时使用,PCIe通道数量同理。
同时,AMD要区分两款处理器的定位,64核不能动(因为要进一步拉大AMD在HEDT平台中的优势),频率也要提高(服务器低频是为了稳定性,发烧级平台就可以将频率提高获得更好性能了),就只能动一下上述大多数消费者都不会用到的地方了。

左3990X,右3970X
3990X的CCD比3970X多了4个,每个CCD对应8个核心,之前EPYC ROME的官方开盖图就展示过,里面有9片DIE,真是佩服这种封装方式。
说回大家关心的价格,29999元,看着很多钱,不过仔细算一笔账其实还不算很贵。

EPYC 7742:64核,48529元,每个核心758元;Threadripper 3990X:64核,29999元,每个核心468元。
Xeon Platinum 8280:28核,10009美元,每个核心2497元;i9-10980XE:18核,12999元,每个核心722元。
这样看来AMD这边的每个核心性价比要比Intel高很多。
说实话,这回AMD真的有点要抹杀对手的感觉了,核心数量比Intel多,每个核心的价格卖得还便宜(由于没有相同核心的产品来对比,所以没法断定Intel的64核会卖多少)。甚至有可能会升级成理财产品,毕竟市面上就这一家卖64核,万一没货了还会给人炒高价格。
说了一堆,也是时候上菜了。
评测项目简介
一、传统软件性能测试:本项综合传统跑分软件与一些对内存容量不敏感的软件进行对比,如CPU-Z,CineBench R15、R20等。该项会使用幻光戟与皇家戟内存搭建四通道,共32GB,颗粒均为三星B-Die,频率时序3200MHz C14-14-14-34。
二、生产力性能测试:本次测试加入PR、AE与AME导出视频速度的对比。该项会将四种内存混搭凑成96GB总容量,为确保兼容性,频率时序为默认2133MHz C15-15-15-36。
三、发热与功耗测试:TDP 280W?不存在的,开PBO解锁高频才是这块CPU的正确打开方式,我们来看看64核能不能让电表倒转?
四、娱乐测试环节:针对这款稀有物种,我们也想到了各种办法去折腾它,榨干它的性能。
测试前的平台介绍
不用测都可以猜到,Threadripper 3990X单靠核心数就已经可以手撕绝大部分的处理器,包括英特尔的服务器CPU至强铂金,所以理论上我们要拿出两边阵营最强的处理器来进行对比。

但比较遗憾的是,我们弄不到双路C621和两块至强8280,也搞不到EPYC 7742(买不起...)所以我们只能选择两边阵营均比较高端的发烧级处理器进行对比,大家都是HEDT平台处理器的最高端型号,应该还是有代表性的。另外我们还会加上Ryzen 5 3500X来代表主流处理器的水平,看看这些很多人都买不起的怪物与平时用的CPU差距有多大。

说配置之前,也介绍一下我们的测试系统。

最近看了很多新闻,外媒Anandtech在测试Threadripper 3990X时出现了Windows 10系统下CPU规格识别错误的问题,大致意思就是家用Windows 10系统(Windows 10 Pro或更低版本)不能将Threadripper 3990X识别为完整的一颗CPU,而会将它分成两块独立的64线程CPU。AMD建议是,安装Windows 10 Pro Workstation或者Windows 10 Enterprise。

我们也遵循建议安装了Windows 10 Pro Workstation进行测试,在任务管理器中,系统也成功识别出为1个处理器而不是双路。

通过上面任务管理器的逻辑线程数也可以看到,Pro Workstation是可以支持这款64核怪物的,但首要条件是需要安装上最新版本与补丁,我们的补丁也是当天最新的版本了。

讲回配置,平台主板这次选用了技嘉TRX40 AORUS XTREME,为该品牌最强的TRX40芯片组主板。

供电方案升级,16相英飞凌直出式供电,每相提供90A的负载能力,足以应付瞬时负载极高产生大量功耗的的Threadripper 3990X。

散热部分装载了高密度的散热鳍片,提供更大的散热面积,加上8mm热管为供电模组散热,热管连接了I/O装甲与供电模块,提高了散热鳍片的利用率,如果它压制Threadripper 3990X都有问题,那可能就没有主板能驾驭这颗U了。
扩展卡的设计很有质感,体现了技嘉最高端主板的诚意,整个金属片用料厚实,即使4个PCIe 4.0 SSD同时运行,也能有效地把热量带走。

简单拆解,内置4个NVMe M.2接口,最高支持4块PCIe Gen4 SSD组建阵列。可惜目前手上没有4片高端的NVMe SSD,之后如果能凑出来的话,一定要Raid一个试试。

电源选用了鑫谷昆仑的1080W,本应打算用1600W的电源,奈何手上没有这么高功率的电源。在之前某韩国博主评测这块CPU时瞬时功耗曾达到800W,所以用1080W应该没什么问题。

内存则是芝奇的两根幻光戟与两根皇家戟为主。

超频三凌镜GI-CX360一体式水冷散热器
它应该是评测室里比较好的一体式水冷了,能支持TDP 350W的处理器,就是说满载的情况下可以压制更高频率的Threadripper 3990X(默认全核2.9GHz,TDP是280W)。
我们想过拆了MOD主机上的Bykski分体360冷排来用,但因为冷头没有AMD扣具,且拆装要重新注水比较麻烦,就放弃这个想法了。
以下为整套测试的系统设置:
Intel与AMD阵营,电压设置为Auto,关闭防掉压。
Intel的睿频,AMD的Core Performance Boost默认自动。AMD的处理器打开PBO选项,Package Power Limit Control调整为1000W,Intel的处理器开放功耗墙。
常规测试项目,使用皇家戟与幻光戟组四通道,调整内存频率时序为3200MHz C14-14-14-34。
生产力测试项目,内存插满,频率默认2133MHz。
传统软件性能测试
理论性能测试会简单粗暴的通过跑分软件对比处理器之间的算力差距,不同处理器之间的单线程与多线程的性能差距都能通过该测试反馈出来。
为了让大家对这种超级多核怪兽的测试数据有更直观的理解,我们加入了一款AMD中端级别的处理器Ryzen 5 3500X,请往下看吧。
CPU-Z

TR 3990X的CPU-Z成绩继TR 3970X之后,又创下了新的PConline评测室历史记录,将近三万分,是i9-10980XE的三倍!比TR 3970X也要高出近一万分。
单线程分数,由于BOOST频率有4.3GHz,TR 3990X的单线程跑分也比较高,有520分,已经接近高频游戏处理器的水准了。
CineBench R15

跑CineBench R15的时候,我感觉这不是在渲染,而是在双击打开一张图片:仅仅几秒钟的时间就已经跑完测试。

TR 3990X以高达12775分的超高分数秒杀i9-10980XE,也是后者3倍的性能。
单线程方面,TR 3990X也是略微落后于其余两款CPU,但基本上都是相近的水准了。
CineBench R20

CineBench R20的分数也同样震撼,十几秒就渲染完毕。

TR 3990X在CineBench R20中跑出了三万的高分,是i9-10980XE的三倍有多。

测试期间记录了各CPU的频率情况,核心数最少的Ryzen 5 3500X的全核加速频率最高,其次就是Threadripper 3970X,单核则是i9-10980XE拔下头筹。
因为CineBench R20对Threadripper 3990X来说,负载较小,在温度还没跑起来,就已经跑完测试,测得最低全核频率为3.75GHz,对于64核怪兽来说,这频率也很高了。

前三项测试的综合性能对比
小结:到这里为止,三项测试均可以吃满Threadripper 3990X的多核心性能,性能表现符合预期情况。在面对较短时间的高负载,Threadripper 3990X不会产生幅度太大的降频,所以可以很高效的跑完测试。
由于64核128线程确实是比软件系统超前了许多,很多软件都未能对128线程进行优化,也就会出现处理器利用率不高的情况,下面抽取了几款比较有代表性的软件。
X264 FHD Benchmark

X264 Benchmark不能跑满CPU所有核心,核心占用比较分散。
7-Zip 基准测试(字典64MB)

7-Zip能识别128线程,但只能调用64个线程
7-Zip虽然能支持(识别)128线程,软件左下角也能认出64 128T,但后面斜杠的线程数也反映出问题:只调用到64个线程,就算自己选择128线程也无济于事。
3DMark Time Spy Extreme

UL Benchmark之前有讲过,Time Spy Extreme是能支持8核以上的处理器,最高到64线程(也就是128的一半)。

但实测了一下发现也只是发挥了64线程的性能。
小结:目前多核心处理器依然面对着软件多核优化差的问题,这种情况只能静待软件厂商进行适配优化,毕竟这款64核怪物推出得比较突然,软件厂商可能也在加班加点更新软件了。另一方面,这也许也要AMD主动去推进这一块的生态发展,毕竟超高线程处理器的市占率也不会很高,软件厂商自发的动力也许不会太强。
生产力性能测试
生产力测试会选取Adobe全家桶中的三款软件:Premiere Pro(以下简称PR)、After Effect(以下简称AE)与Media Encoder(以下简称ME),使用4K与8K素材测试渲染导出速度。

上次借来测试的4根美光32GB内存还回去了,所以只能凑出4根8GB与4根16GB内存混插达到96GB总内存容量,为了稳定,频率默认2133MHz。

4K与8K素材是从RED Digital官网下载的样片,电影机买不起,样片还是能看看的。
PR导出

Threadripper 3990X PR导出8K占用

Threadripper 3970X PR导出8K占用

PR导出,几款处理器的占用率都比较低,Threadripper 3990X与Threadripper 3970X时长差不多。结论就是PR对多线程处理器的优化也是有限。
AE导出

Threadripper 3990X AE导出8K占用

Threadripper 3970X AE导出8K占用

AE导出,CPU占用率同样很低,这里Threadripper 3990X反而不敌Threadripper 3970X,i9-10980XE速度要慢不少。
ME导出PR工程

可以看到核心占用率依然不高,按25%占用率算,就是16个线程,所以有100多个线程是没能被利用上的。

用Media Encoder导出PR序列与之前直接用PR导出的结果比较相近,两颗撕裂者强于i9。
https://u.jd.com/tmH0WmS
先对比一下三款发烧级平台旗舰的规格、再加上与之规格非常相似的EPYC 7742。

CPU参数点评:
从规格上看,Threadripper 3990X与EPYC 7742比较相似,同样基于7nm ZEN2架构,同样为64核128线程,三缓均为256MB,都支持PCIe Gen4。

而不同的地方,就是通道(包括PCIe和内存)的数量,内存容量上限与基础频率等地方了。至于为什么做这样的变动,这就关乎到两种处理器面对的应用场景需求了。

简单讲讲,服务器通常需要面对大量的并行数据处理情景,比如多虚拟机同时运作,四通道的内存带宽就可能不够数量众多的虚拟机同时使用,PCIe通道数量同理。
同时,AMD要区分两款处理器的定位,64核不能动(因为要进一步拉大AMD在HEDT平台中的优势),频率也要提高(服务器低频是为了稳定性,发烧级平台就可以将频率提高获得更好性能了),就只能动一下上述大多数消费者都不会用到的地方了。

左3990X,右3970X
3990X的CCD比3970X多了4个,每个CCD对应8个核心,之前EPYC ROME的官方开盖图就展示过,里面有9片DIE,真是佩服这种封装方式。
说回大家关心的价格,29999元,看着很多钱,不过仔细算一笔账其实还不算很贵。

EPYC 7742:64核,48529元,每个核心758元;Threadripper 3990X:64核,29999元,每个核心468元。
Xeon Platinum 8280:28核,10009美元,每个核心2497元;i9-10980XE:18核,12999元,每个核心722元。
这样看来AMD这边的每个核心性价比要比Intel高很多。
说实话,这回AMD真的有点要抹杀对手的感觉了,核心数量比Intel多,每个核心的价格卖得还便宜(由于没有相同核心的产品来对比,所以没法断定Intel的64核会卖多少)。甚至有可能会升级成理财产品,毕竟市面上就这一家卖64核,万一没货了还会给人炒高价格。
说了一堆,也是时候上菜了。
评测项目简介
一、传统软件性能测试:本项综合传统跑分软件与一些对内存容量不敏感的软件进行对比,如CPU-Z,CineBench R15、R20等。该项会使用幻光戟与皇家戟内存搭建四通道,共32GB,颗粒均为三星B-Die,频率时序3200MHz C14-14-14-34。
二、生产力性能测试:本次测试加入PR、AE与AME导出视频速度的对比。该项会将四种内存混搭凑成96GB总容量,为确保兼容性,频率时序为默认2133MHz C15-15-15-36。
三、发热与功耗测试:TDP 280W?不存在的,开PBO解锁高频才是这块CPU的正确打开方式,我们来看看64核能不能让电表倒转?
四、娱乐测试环节:针对这款稀有物种,我们也想到了各种办法去折腾它,榨干它的性能。
测试前的平台介绍
不用测都可以猜到,Threadripper 3990X单靠核心数就已经可以手撕绝大部分的处理器,包括英特尔的服务器CPU至强铂金,所以理论上我们要拿出两边阵营最强的处理器来进行对比。

但比较遗憾的是,我们弄不到双路C621和两块至强8280,也搞不到EPYC 7742(买不起...)所以我们只能选择两边阵营均比较高端的发烧级处理器进行对比,大家都是HEDT平台处理器的最高端型号,应该还是有代表性的。另外我们还会加上Ryzen 5 3500X来代表主流处理器的水平,看看这些很多人都买不起的怪物与平时用的CPU差距有多大。

说配置之前,也介绍一下我们的测试系统。

最近看了很多新闻,外媒Anandtech在测试Threadripper 3990X时出现了Windows 10系统下CPU规格识别错误的问题,大致意思就是家用Windows 10系统(Windows 10 Pro或更低版本)不能将Threadripper 3990X识别为完整的一颗CPU,而会将它分成两块独立的64线程CPU。AMD建议是,安装Windows 10 Pro Workstation或者Windows 10 Enterprise。

我们也遵循建议安装了Windows 10 Pro Workstation进行测试,在任务管理器中,系统也成功识别出为1个处理器而不是双路。

通过上面任务管理器的逻辑线程数也可以看到,Pro Workstation是可以支持这款64核怪物的,但首要条件是需要安装上最新版本与补丁,我们的补丁也是当天最新的版本了。

讲回配置,平台主板这次选用了技嘉TRX40 AORUS XTREME,为该品牌最强的TRX40芯片组主板。

供电方案升级,16相英飞凌直出式供电,每相提供90A的负载能力,足以应付瞬时负载极高产生大量功耗的的Threadripper 3990X。

散热部分装载了高密度的散热鳍片,提供更大的散热面积,加上8mm热管为供电模组散热,热管连接了I/O装甲与供电模块,提高了散热鳍片的利用率,如果它压制Threadripper 3990X都有问题,那可能就没有主板能驾驭这颗U了。
扩展卡的设计很有质感,体现了技嘉最高端主板的诚意,整个金属片用料厚实,即使4个PCIe 4.0 SSD同时运行,也能有效地把热量带走。

简单拆解,内置4个NVMe M.2接口,最高支持4块PCIe Gen4 SSD组建阵列。可惜目前手上没有4片高端的NVMe SSD,之后如果能凑出来的话,一定要Raid一个试试。

电源选用了鑫谷昆仑的1080W,本应打算用1600W的电源,奈何手上没有这么高功率的电源。在之前某韩国博主评测这块CPU时瞬时功耗曾达到800W,所以用1080W应该没什么问题。

内存则是芝奇的两根幻光戟与两根皇家戟为主。

超频三凌镜GI-CX360一体式水冷散热器
它应该是评测室里比较好的一体式水冷了,能支持TDP 350W的处理器,就是说满载的情况下可以压制更高频率的Threadripper 3990X(默认全核2.9GHz,TDP是280W)。
我们想过拆了MOD主机上的Bykski分体360冷排来用,但因为冷头没有AMD扣具,且拆装要重新注水比较麻烦,就放弃这个想法了。
以下为整套测试的系统设置:
Intel与AMD阵营,电压设置为Auto,关闭防掉压。
Intel的睿频,AMD的Core Performance Boost默认自动。AMD的处理器打开PBO选项,Package Power Limit Control调整为1000W,Intel的处理器开放功耗墙。
常规测试项目,使用皇家戟与幻光戟组四通道,调整内存频率时序为3200MHz C14-14-14-34。
生产力测试项目,内存插满,频率默认2133MHz。
传统软件性能测试
理论性能测试会简单粗暴的通过跑分软件对比处理器之间的算力差距,不同处理器之间的单线程与多线程的性能差距都能通过该测试反馈出来。
为了让大家对这种超级多核怪兽的测试数据有更直观的理解,我们加入了一款AMD中端级别的处理器Ryzen 5 3500X,请往下看吧。
CPU-Z

TR 3990X的CPU-Z成绩继TR 3970X之后,又创下了新的PConline评测室历史记录,将近三万分,是i9-10980XE的三倍!比TR 3970X也要高出近一万分。
单线程分数,由于BOOST频率有4.3GHz,TR 3990X的单线程跑分也比较高,有520分,已经接近高频游戏处理器的水准了。
CineBench R15

跑CineBench R15的时候,我感觉这不是在渲染,而是在双击打开一张图片:仅仅几秒钟的时间就已经跑完测试。

TR 3990X以高达12775分的超高分数秒杀i9-10980XE,也是后者3倍的性能。
单线程方面,TR 3990X也是略微落后于其余两款CPU,但基本上都是相近的水准了。
CineBench R20

CineBench R20的分数也同样震撼,十几秒就渲染完毕。

TR 3990X在CineBench R20中跑出了三万的高分,是i9-10980XE的三倍有多。

测试期间记录了各CPU的频率情况,核心数最少的Ryzen 5 3500X的全核加速频率最高,其次就是Threadripper 3970X,单核则是i9-10980XE拔下头筹。
因为CineBench R20对Threadripper 3990X来说,负载较小,在温度还没跑起来,就已经跑完测试,测得最低全核频率为3.75GHz,对于64核怪兽来说,这频率也很高了。

前三项测试的综合性能对比
小结:到这里为止,三项测试均可以吃满Threadripper 3990X的多核心性能,性能表现符合预期情况。在面对较短时间的高负载,Threadripper 3990X不会产生幅度太大的降频,所以可以很高效的跑完测试。
由于64核128线程确实是比软件系统超前了许多,很多软件都未能对128线程进行优化,也就会出现处理器利用率不高的情况,下面抽取了几款比较有代表性的软件。
X264 FHD Benchmark

X264 Benchmark不能跑满CPU所有核心,核心占用比较分散。
7-Zip 基准测试(字典64MB)

7-Zip能识别128线程,但只能调用64个线程
7-Zip虽然能支持(识别)128线程,软件左下角也能认出64 128T,但后面斜杠的线程数也反映出问题:只调用到64个线程,就算自己选择128线程也无济于事。
3DMark Time Spy Extreme

UL Benchmark之前有讲过,Time Spy Extreme是能支持8核以上的处理器,最高到64线程(也就是128的一半)。

但实测了一下发现也只是发挥了64线程的性能。
小结:目前多核心处理器依然面对着软件多核优化差的问题,这种情况只能静待软件厂商进行适配优化,毕竟这款64核怪物推出得比较突然,软件厂商可能也在加班加点更新软件了。另一方面,这也许也要AMD主动去推进这一块的生态发展,毕竟超高线程处理器的市占率也不会很高,软件厂商自发的动力也许不会太强。
生产力性能测试
生产力测试会选取Adobe全家桶中的三款软件:Premiere Pro(以下简称PR)、After Effect(以下简称AE)与Media Encoder(以下简称ME),使用4K与8K素材测试渲染导出速度。

上次借来测试的4根美光32GB内存还回去了,所以只能凑出4根8GB与4根16GB内存混插达到96GB总内存容量,为了稳定,频率默认2133MHz。

4K与8K素材是从RED Digital官网下载的样片,电影机买不起,样片还是能看看的。
PR导出

Threadripper 3990X PR导出8K占用

Threadripper 3970X PR导出8K占用

PR导出,几款处理器的占用率都比较低,Threadripper 3990X与Threadripper 3970X时长差不多。结论就是PR对多线程处理器的优化也是有限。
AE导出

Threadripper 3990X AE导出8K占用

Threadripper 3970X AE导出8K占用

AE导出,CPU占用率同样很低,这里Threadripper 3990X反而不敌Threadripper 3970X,i9-10980XE速度要慢不少。
ME导出PR工程

可以看到核心占用率依然不高,按25%占用率算,就是16个线程,所以有100多个线程是没能被利用上的。

用Media Encoder导出PR序列与之前直接用PR导出的结果比较相近,两颗撕裂者强于i9。
https://u.jd.com/tmH0WmS