CPU版月度推出,正视super pi对多核处理器评测的准确性

2008-06-09 14:31:20 “乘风逐云”把此帖设为精华,作者得到50经验:)

CPU版月度推出,正视super pi对多核处理器评测的准确性

这个帖子大象写了3个小时。。希望关注的各位网友,积极拍砖,欢迎评价,本人水平有限,观点不对的地方,欢迎指正,也渴望高手来一起交流。





super pi,历史很久的CPU测试软件,好多人评价CPU都会参考这个测试软件,以至于在多核处理器存在的今天,好多人依旧喜欢把super pi的测试成绩来评价这个处理器,也有很多人,以这个测试来证明AMD处理器不如酷睿构架的INTEL处理器。

我不是一个AMD的支持者,同样我也不是INTEL的爱好者,去年的这个时候,K8处理器对酷睿核心处理器测试上面的溃败,让我对K10非常期待,但是出现后,平庸的,单核性能,超频能力,让很多期待的人,包括我,丧失对他最开始的热情。我觉得适合自己的才是最正确的。下面我就把我对AMD处理器在pi这个软件不如INTEL处理器这个问题,用自己的看法,来做一个评价。

好多人说酷睿构架好,是因为流水线短啊之类的,所以低频高能,当然说这些话的人都是对U比较了解的人,但是为什么在pi这个测试单元,酷睿会比AMD高呢,我认为的2个方面,命中高的缓存构架,增加了处理指令集的解码单元。

酷睿的缓存构架问题,从奔腾开始,INTEL的缓存构架就以高命中而占有优势,为什么INTEL处理器命中高,除了构架方面的原因就是INTEL跟AMD侧重点不一样,去年刚做产品版主时写过一篇浅谈AMDcpu的2级缓存,的文章,里面有过简单的说明,

以下是当时的原文的部分内容:“INTEL的缓存跟AMD的缓存是不同的,INTEL的缓存1,2级分明,数据缓存+指令追踪缓存 1级作为记录数据的主要信息储存,相当于书目,2级缓存及内存作为储存内容,CPU调用信息时,首先调用1及缓存中书目的内容,来调用2及缓存和内存中的内容,所以INTEL的U对一级缓存要求速度块,单容量不要求大,对2缓存的要求就是越大越好,特别是处理大容量内容的时候。

AMD的缓存1.2级的差别分的就不是很清楚了,没有书目,1及缓存2级缓存都放内容,根据即将调用顺序,1级放满了放2级,2级放满了放到内存中,所以AMD对缓存的结构和INTEL是不一样的,所以这就是为什么AMD虽然没有INTEL缓存大但是性能不弱的主要原因之一。”

原文:浅谈AMDcpu的2级缓存
http://group.zol.com.cn/4/28_37563.html

上文中我提到了INTEl的缓存构成,,是由数据缓存+指令追踪缓存组成,这样的缓存构成,相对AMD的通用仓库的缓存构成命中率要有很大提高,在流水线较长的PD时期,一旦数据未能命中,等待的周期是很长的,所以造成了当时PD时期频率高,性能低的问题。

回到pi这个软件上来看,PI是一个圆周率的计算软件,他的数据调用时很庞大的,精确度是非常高的。所以在缩短了流水线的情况下,CPU缓存的高命中率也是酷睿构架,相比AMDK8处理器在计算pi时一个非常大的优势。所以我把酷睿的缓存构架作为INTEl在计算pi时比AMD速度快的一个原因之一。


酷睿的新解码器,我们经常看到一个名词X86处理器,X86我的理解就是符合这个标准的机器语言的指令合计。说白了也就是不管AMD还是INTEL都是处理相同标准的指令合集,AMD和酷睿出现的性能差距还一个重要原因就是这个,当然现在的X86处理器的执行单元真正执行的指令是解码后的微指令,而不是X86指令。

其实最早提出amd现在采用的HT总线构架的是INTEL,但是HT总线构架在INTEL处理器上开发失败,才让INTEL转向多路解码单元这个这个上面来,早期AMD曾经在多路解码单元上失败过,没想到,INTEL竟然成功了。

这也是酷睿构架最成功的地方,多路解码单元,让他在计算pi的时候相对于AMD处理器在微指令的处理上速度更快。。

在一般情况下,它每个时钟周期可以解码4条X86指令,加上宏指令融合技术的话则最多可以解码5条X86指令。

以上就是我个人的看法在构架上INTEL在计算pi比AMD快的原因,但是PI计算速度越短性能就越强吗?我做2个4核U的测试对比,都是pi的成绩,测试平台不同会有差距,但是都是965芯片组。我还是发上来,给大家看看做一个比较,pi成绩对U主频十分敏感。。

pi跑的快就一定是好U?




这个是3.6G的Q6600的pi测试成绩pi成绩14。2秒






这个是X3210超频到3。44的成绩,这个U并没极限,很遗憾我没找到3.6的成绩,当然这个UOC4G的很多。成绩14秒9



以上2个UQ66是2路FSB的4核处理器成绩,3.6G pi14.2秒,X3210是1路FSB的4核处理器 3.44Gpi成绩14.9秒,
从pi的成绩看好想我们应该选择X3210吧,但是实际技术水平我就不需要再赘述了吧,,4个U同时处理大容量数据的时候单路FSB肯定不如Q6600下面发图给大家,,





这个是X32104核同测pi的测试成绩,18-19秒
相对单核的14.9秒差距还是很明显的,4秒的差距,对酷睿是多少的主频差距呢?对AMD处理器是多少主频的差距,熟悉的玩家不需要我做过多解释吧。。

为什么会产生着4秒的pi差距,很简单就能回答,单路的总线带宽影响的U的性能。。

很遗憾我没有找到Q66的4pi同测的图片。如果有3.6G的Q66玩家愿意测试的话欢迎发图

所以通过X3210的这个pi测试,我感觉,很可观的评价了pi软件对多核处理器的真实评测水平,就是对于单核性能的测试,并不能代表U整体的性能。


以上的观点也是我的个人观点,pi老了,,单U测试的pi成绩不适合现在的CPU性能对比了,如果还有继续用多核处理器来测试pi的,我只能说你的测试客观吗??

对于现在的处理器测试我喜欢参照的测试软件是CineBench R10跟国际象棋测试。



CineBench R10测试


45nm Wolfdale 双核测试成绩



65nm Conroe 双核测试成绩

摩托车渲染项目中。 45nm Wolfdale也获得了不少的性能提升,比65nm Conroe处理器提升了14秒之多,性能提升百分比约为7个百分点。



从这个软件中,同构架,增加了SSE4.1指令集的Wolfdale比Conroe核心增加了3百多分,所以,CineBench R10更能体现CPU性能的真实成绩,,比单纯的pi测试要好的多。。
下载地址:
ftp://ftp.maxon.net/pub/benchmarks/CINEBENCHR10.zip



最后总结:pi这个软件,是针对单核的专业CPU测试软件,可以反映构架性能,超频稳定性,以及核心差距,但是,对于多核U来说,单纯的测试pi这个软件来评价U的性能我感觉是不科学的,,,相信仔细看了这个帖子的pi组们或者经常拿pi来说事的网友们,不要再炫耀自己的pi成绩了,,玩pi找X3210吧,2.13G OC3.6,OC4G的,可以让pi跑的更快,,但是整体性能呢?多核共用呢?


PS:希望在本版争论的各位网友,不要把pi作为评价多核处理器的综合指标了。。另外AMD处理器不如酷睿处理器,也并不输在pi上,,所以那些拿pi来秒杀AMD的玩家们就此闭嘴吧。


这个帖子大象写了3个小时。。希望关注的各位网友,积极拍砖,欢迎评价,本人水平有限,观点不对的地方,欢迎指正,也渴望高手来一起交流。









ZOL-CPU终极交流群,200人高级会员群,群号:41662817。





  CPU版官方群:41662817,CPU:INTEL I7 920 D0 1.216V 4G,GIGABYTE EX58-EXTREME,G.Skill π 1600 CL8 2GB x3 ,4XST160G raid0,UNIKA 9800GTX SLI 核心760 SP1900 显存2240。 INTEL E2160OC4G ASUS P5Q Turbo,ONDA GTS250 1024MB,TEAM XTREEM DDR2-800 C4DC 1GX2, ST  

回复     TOP  

先占个沙发.再细看,
     

回复     TOP

昏,赶快占个板凳再说!!!
  级别不够,暂不显示签名。

回复     TOP

CPU版月度推出,正视super pi对多核处理器评测的准确性

居然没坐沙发,忘记关音箱了,你的信息把握从睡梦中吵醒.起床回你吧. 观点非常有见地,赞成
  Core2 Q6600,TT大台风,IN9 32X MAX WiFi,红色威龙2GB DDR2 800+*4,ST7200.10 250G*4 RAID0,迪兰恒进 HD3850北极星2代 512M,永阳宝瓶5604,航嘉冷静王至尊版2.3版,先锋126P+112XL,DELL2407   

回复     TOP

牛简直是牛人啊
  欢迎加入:终极硬件DIY超频群14064499。E8400散,技嘉EP45-DS4,金泰克 速虎2G*2,希捷 320G+WD 640G黑盘 ,索泰N260-896D3极速版,索尼DRU-G190A,明基G2410HD,Tt Bach VX(VF4000BWS开窗),长城 双卡王BTX-500SE专业版,多彩迅雷无限DL-K8000G+M505GB+GC18UF。极限:4.6G  

回复     TOP

帮顶一下~~~至于X86最后实现啥那是CPU内部实现的问题感觉~恩 AMD跟INTEL还是有距离啊~~X86完了还有安腾呢
  级别不够,暂不显示签名。

回复     TOP

又见大象的强帖 分析的好全面啊
  http://wowok.com.cn/ 我的摄影博客!  

回复     TOP

半夜三更的发贴... 大象真是辛苦了.文中涉及的不少内容乘风以前也学习过,但是现在都淡忘了,还是大象基本功扎实啊,霍霍. 还有那国际相棋测试软件,好象是antitrust最喜欢的啊,这个应该是AMD全面领先的项目,但也并不能说K8比扣肉强啊.
  E5200 OC 4G/ASUS P5Q Turbo/南海/万紫千红800 1G*2/蓝宝4870毒药1代/创新a2zs/WD5001ABYS/酷冷Real Power Pro 1000W  

回复     TOP

仔细拜读了 觉得分析的很客观 自己同时也加深了认识和了解 呵呵
  级别不够,暂不显示签名。

回复     TOP

对 第7楼 乘风逐云 说:
=========================

其实AMD真傻得可爱啊!我出的4200+的价,让我受用的是5600+的性能(经EVEREST认证,原盒风扇,长期稳定使用.)这可不是肉能比的. 项目 数据 中央处理器(CPU) 处理器名称 DualCore AMD Athlon 64 X2 5600+ 核心类型 Brisbane 制程步进 BH-G2 Engineering Sample 否 CPU 名称 AMD Athlon(tm) 64 X2 Dual Core Processor 4200+ 修订版本 00060FB2h CPU 速度 主频 2926.2 MHz  (原始频率: [ TRIAL VERSION ] MHz, overclock: 33%) 倍频 11x 处理器外部总线频率 266.0 MHz  (原始频率: 200 MHz, overclock: 33%) HyperTransport(超传输)时钟频率 1330.1 MHz 内存总线频率 487.7 MHz DRAM:FSB 比值 CPU/6
  无签名  

回复     TOP

对 第7楼 乘风逐云 说:
=========================

项目 数据 传感器 传感器类型 Winbond W83627DHG  (ISA A10h) 机箱入侵检测 是 温度 主板 27 癈  (81 癋) 中央处理器(CPU) 32 癈  (90 癋) CPU 1/核心 1 40 癈  (104 癋) CPU 1/核心 2 37 癈  (99 癋) Aux 52 癈  (126 癋) Hitachi HDP725032GLA360 [ TRIAL VERSION ] 冷却风扇 中央处理器(CPU) 3245 RPM 电压值 CPU 内核 1.36 V Aux 1.89 V +3.3 V 3.28 V +5 V 5.48 V +12 V [ TRIAL VERSION ] -12 V -2.00 V +5V 待机 4.97 V VBAT 电池 3.28 V
  无签名  

回复     TOP

快速回复主题

登录用户,才可发言...  登录    注册

ZOL简介 | 用户注册 | 广告服务 | 人员招聘 | ZOL历程 | 互动营销中心 | 站点地图 | 联系方式 | 欢迎投稿 | RSS订阅 | 友情链接
Copyright ©1999 - ZOL. All rights reserved. 中关村在线 版权所有.