您的位置:首页精文荟萃硬件报道 → “芯”要龙腾虎跃:2003年CPU年终大盘点

“芯”要龙腾虎跃:2003年CPU年终大盘点

时间:2004/10/8 13:53:00来源:本站整理作者:蓝点我要评论(5)

  一、Intel技术回顾



  2M L3缓存技术



图1



  桌面领域首次出现了2M三级缓存的处理器



   在IDF2003上发布了Pentium4(以下简称P4) Extreme Edition。11月正式上市时被更名为P4XE,中文名称为“P4至尊”。作为P4的终极版本,P4XE采用0.13微米工艺制造,主频率为3.2G,支持HT,值得注意的是P4 XE加入了2M三级缓存技术。在频率提升困难的情况下,增加缓存的容量是提高性能的捷径。特别是P4的超长流水线结构,缓存容量的增加可以减少分支预测失败后造成的效率损失。但是大容量缓存的弊端也很明显:发热量,功耗增大,对散热要求提高。




图2



  可以看到,由于加入了2M的缓存,与频率相同的P4 3.2G相比,P4 XE 3.2G晶体管数目暴增,功耗也增大了10.1W。可见缓存的增加对现有的主板的供电系统是不小的考验。缓存的增加也对CPU的散热提出了更高的要求。核心最高温度下降到了64℃,散热器的热阻至少要求达到0.25℃/W,超频也更加困难。



  Hyper-threading(超线程技术)




图3


  HT技术第一次被引入PC是2002年11月发布的P4 3.06G,2003年P4C系列将HT技术带入了3G以下的CPU。Pentium 4是超长流水线、高主率的处理器。运行一般软件时,处理器中很多运算单元暂时闲置,浪费大量资源,而且频率越高浪费越大。HT技术的设计思想是让闲置的运算单元并行执行其他线程的运算,最大限度的利用处理器资源。因此,理论上,具备HT技术的处理器要比不具备该技术的处理器拥有更高的执行效率。HT技术在一个物理处理器核心的基础上虚拟两个逻辑处理器核心,每个逻辑处理器核心拥有独立的寄存器。两套寄存器协同处理多个线程,使处理器具备同时运行两个程序,或者是一个程序中两个线程的并行运算能力。除了处理器,HT技术的实现还需要主板BIOS,操作系统和应用软件的支持。从845PE起,Intel的芯片组均提供了HT支持。WINXP和WIN2000SP4也提供了HT支持P4 2.4C以及P4 2..6C的普及解决了HT推广的硬件方面。HT现在最需要应用软件的支持。



  由于不是真正的双处理器技术,HT的应用存在一定的局限性。比如,在低频的处理器本身性能不强,没有那么多“空余”的资源可以再利用,此时采用HT技术就会拖后腿。如果出现资源不足的情况(包括内存带宽和周边设备的缺陷),HT技术开启后某些应用也会出现性能下降的情况,Intel也已经承认确实存在极少数性能下降的情况。但绝大多数应用程序的性能会有所提高,特别是使用多线程应用程序和同时运行两个应用程序时。



  二、AMD技术回顾




图4



  64位计算技术



  AMD正在探寻一条与Intel不同的技术道路。2003年3月AMD的K8终于亮相——面向服务器的Opteron。9月份,原来代号为ClawHammer的桌面级64bit处理器Athlon 64和以及SledgeHammer的Athlon FX也与世人见面。AMD开始了64bit计算的推广之路。



  AMD推广的64bit计算技术是“X86-64”。作为X86-32的延伸,AMD认为其最大的优势是对现有系统的完美兼容。通常所说的64位指令,并不是指指令的全长或操作码的长度为64位,而是指操作数所能达到的最大位数为64位。由于操作数一般需要存放在通用寄存器中,因此64位处理器通用寄存器的尺寸也必须是64位。相比传统的X86处理器,K8在进行64位扩展的时侯,把8个通用寄存器增加到了64位,同时增加了指令指针寄存器的位数为64位。



  K8的架构与相比原来的Barton核心相比没有发生实质性的变化。Athlon 64和Athlon FX的强劲性能很大程度上得益于集成的内存控制器。但是12级流水线和SOI工艺可以使K8的主频继续提升。



  AMD还不足以推动整个PC向64bit过渡,所以AMD将64bit计算的先进性与对现有系统的兼容性同等重视。作为推广的最终目标和现实努力,AMD希望能先于Intel之前掌握64位平台的住的主导。如果成功,AMD可能会翻身;即使推广失败,那么Athlon 64和Athlon FX仍然是性能很强的32bit处理器。



  集成的内存控制器



  Athlon64/ AthlonFX处理器使用了全新的北桥架构,把旧有北桥一分为二:内存控制器,北桥总线接口直接集成到了处理器内部;传统北桥中的AGP控制器,与南桥进行数据交换的接口界面则外置。新的北桥架构通过外置Hypertransport总线(最大位宽16bit,最大运行频率800MHz的双向传输)将北桥的内置部分同外置部分的AGP控制器等连接在一起。峰值带宽达到了6.4GB/s,与Intel的P4的6.4GB/s持平。



  集成内存控制器是AMD的一个创举。这种结构可以最大限度的减少内存与处理器之间传递数据的延迟。Athlon64整合了单通道DDR400控制器,AthlonFX则可以支持双通道Registered DDR400内存。K8的基本结构没有发生质变,能够在比Barton更低的频率下就击败P4 3.2G,新的内存控制器功不可没。



  三、2003年CPU的特点



  作为PC的核心部件,CPU的升级换代引领着其他部件的升级浪潮。2003年的CPU市场依然是Intel和AMD你争我夺。整个市场依然是Intel强AMD弱。回顾2003年的CPU发展的特点还是很鲜明的。



  主频提升困难



  Intel在2002年底发布了P4 3.06G,到截稿时Intel发布的最高频率是P4 3.2G,一年之中频率只提升了200MHz不到。这种提升的幅度在Intel的近两年的历史上是罕见的。Athlon XP的实际频率也徘徊在2.2G左右。造成这种情况的原因可能有两个:首先是风冷条件下现有处理器的频率已经接近0.13微米工艺的极限。Intel将再次面临制造工艺的提升。不过Intel已经表示0.09微米工艺已经成熟,很快就可以投入量产。AMD的问题要大一些,K7的架构已经到了极限,由于K7采用了十级流水线设计,继续提高频率很可能造成每级流水线的负担增大。(Barton核心的Athlon XP在风冷条件下的极限频率在2.6G左右,P4则可以突破4G)



  另外一个原因是处理器的功耗已经非常大了,如果继续提升主频,将增加主板的设计难度和制造成本。原本设计865/875的时候考虑了对Prescott的支持,但Prescott 100W以上的功耗使得这一想法成了悬案。即使是2.8G的Prescott都可能达到100W,只有符合FMB1.5或以上规范的主板才能支持Prescott。



  前端总线提升非常明显



  2003年P4的前端总线(FSB)从533 MHz提升到了800 MHz,AMD也发布了FSB为400MHz的Athlon XP,同时Athlon64也都采用了800MHz总线的设计。



  总线的提升对有利于提升性能,在主频提升困难的情况下,提升总线频率是一个非常好的过渡办法。而且Intel将FSB提升到800MHz,对主板MCH芯片要求高了很多。Intel可以利用自己的制造工艺上的优势来打压台系厂商(台系厂商的北桥芯片的制造工艺与Intel比还存在一定的差距)。Intel还计划将总线频率提升至1.2G。



  四、芯片组新技术的回顾



  PAT技术



  PAT的全称是Performance Accelerate Technology,直接的翻译是“性能加速技术”。它出现在2003年4月份发布的875P芯片组中。这种技术主要被用来改进芯片组的性能。PAT对芯片组性能的提升是通过减少了芯片组内部FSB和系统内存之间延迟来实现的。PAT技术一共减少了两个传输周期的延迟,其中从CPU到内存控制器的数据传输减少了一个时钟周期,从内存控制器到内存的片选又减少了一个时钟周期。PAT技术必须依赖芯片组和BIOS,865芯片组系列就不能实现PAT。最初普遍认为PAT是875P的独门秘籍。但是Intel宣布865PE芯片组已经预留了PAT的相关电路只是没有打开后,主板厂商便开始在865PE中打开所谓“内存加速模式”来达到和PAT同样的效果。PAT技术对提生内存带宽是非常有帮助的。只是这种技术对内存的品质提出苛刻的要求。普通的应用中用户是很难体会到PAT和类PAT技术带来的好处,所以在选择865PE主板时不必太在意是否提供了类PAT的内存加速技术。



  Dual DDR



  2003年Intel彻底放弃了叫好不叫座的RAMBUS,大力推广Dual DDR(双通道DDR)来满足P4的庞大内存带宽需求。Intel在年初上市了入门工作站级别的E7205芯片组,支持HT技术,533FSB和Dual DDR266。



  4月23日,Intel又发布800FSB的P4处理器和支持Dual DDR400的875芯片组,后续发布的865PE/G/P均以Dual DDR为卖点。不过实现双通道需要有一些要求,比如要将两根内存分别插如同一组内存插槽内才能实现双通道,内存的批号,容量,速度也要尽可能一致。



  除了Intel,Dual DDR也染指了AMD平台。nForce2的前身nForce第一次将双通道的概念引入PC。但是和Intel的Dual DDR不同,Athlon XP的FSB带宽需求单通道DDR即可满足。nForce2含有两个内存控制器,可以同时为两个设备提供数据,与以往的单个内存控制器相比,nForce2提高了多任务处理能力。也因为这个原因,nForce2组成的双通道的形式要灵活的多---不同容量和不同规格的内存都可以。这种实现方式的弊端是带宽提升就很难实现了。nForce2双通道的实际效果不如865/875就很自然了。



  我们到底需要多快的CPU?



  处理器发展到现在,最高主频已经突破了3GHz,达到3.2GHz,而且在不久的将来,更高主频的CPU还将陆续出现。不过越来越多的用户就会提出这样一个疑问:这么快的CPU对我来说究竟有哪些好处?难道我花几千元买到一颗3.2G的P4或者Athlon64 3200+仅仅是为了看看测试得分吗?到底在哪些方面才能真真切切的体会到这些高速处理器的优势来?



  为了回答这个问题,我们就得从日常应用的角度去分析了。



  视频、音频编码压缩



  首先,大家买电脑都是为了使用而不是测试的,所以测试的分数只能给用户以指导,但是代替不了实际的应用。在日常的应用中,也许大家把大部分时间都用在了上网、聊天、看DVD以及玩游戏上。但是随着视频、音频技术的高速发展以及数码产品的普及,现在的应用发生了巨大的变化。下面列举几个实际应用的例子。



  用户甲:最近从同学那里借来《终结者III》、《黑客帝国2》等几部DVD大片,看了之后觉得十分不错。想保存在机器上,不过由于拷贝DVD占用空间实在太大,自己又不想去再买碟,于是通过XMPEG软件来压缩转换DVD影片。可是刚一转换就发现问题了,原来的P3 700已经力不从心了,转换时间居然长达8个多小时,而且会遇到中途死机的问题。平时上网、打字都觉得这个机器速度和同学那台P4相差无几,但是现在……



  用户乙:最近老爸新买了一台数码摄像机,因此出去游玩的机会增多了。每次游玩归来的时候老爸都交给我一项艰巨的任务,将DV里的东西保存在电脑上。可是DV输出到电脑上的AVI文件十分巨大,少则几百兆,多的话高达几个GB,如果不压缩的话,硬盘空间根本不够。可是每次压缩就感觉电脑慢如蜗牛,我的机器可是当时红极一时的Athlon XP 1500+呀……



  上述两个案例都真实的反映出视频、音频的编码压缩对CPU速度的需求是无止境的。而且即使目前最快的Pentium43.2G也满足不了需求,明白了这个我想你就明白了为什么还要选择那么高速的CPU。




  测试说明



  光说不做那可不行,要反映实际性能还得通过测试来说明。为了全面的反映处理器性能,我们选择了目前主流的视频、音频编码压缩软件。



  1、Main Concept Mpeg Encoder




图1



  这是一个功能强大的MPEG编码软件,可以帮助你快速的将AVI文件压缩并重新编码为高品质的MPEG视频文件,压缩速度很快,支持批处理操作,支持将多个MPEG文件合并为一个MPEG文件,程序界面友好,操作非常简单。我们测试是一个5分26秒(31.7MB)的AVI文件,参数设置为“720×540,25FPS,PAL”。



  2、Xmpeg+Divx 5.02




图2



  XMPEG是FlaskMPEG的修改版,是一款优秀的DVD编码工具。Lang目录下chinese.lang.Xmpeg为中文语言包,只要把其它语言文件移除即可显示中文。除了支持MPEG2的解压缩之外,稳定性也高一些,在编码中的处理功能还是很强大的。我们测试的是一个2分6秒(107MB)的VOB文件,参数设置为“720×480,29.97FPS,NTSC”,其他为默认设置。



  3、Windows Media Encoder9




图3


  这是一套容易使用,而且功能强大的软件,提供使用者自行录制影像的功能,可以从影像捕捉设备或桌面画面录制,亦提供文件格式转换的功能。主要的特色在于容易使用、高品质编码、增强的可程序化与管理。特点为:新的使用者界面和向导,更容易设定与制作影片,用来提供网络现场播放或需求播放,并支持多重来源,可以立即切换来源,并可监视编码程序进行时的资料,如影像大小、资料流量等等。新的编码能力,支持de-interlacing、inverse telecine和屏幕捕捉,能有更好的输出品质,能从320×240×60fps到640×480×30fps,捕捉文件最大可到30GB,支持的捕捉设备包括Winnov、ATI、Hauppauge,以及USB视讯摄影机等。Windows Media Encoder SDK提供网站开发者全自动的编码控制,可从网络(LAN)远端控制,或透过API存取或ASP控制。我们测试是一个2分6秒(13.7MB)的AVI文件,参数设置为“DVD质量视频(1Mbps VBR峰值),640×480”。



  4、TMPG Encoder 2.59




图4


  TMPGEnc是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。该软件不光生成的MPEG文件的图象质量非常好,而且还是免费软件(注,Plus版本是收费的)。我们测试的是一个26.6MB的文件,参数选择为“Non-interlace,4:3,625line(PAL,704×576)”。



  5、Lame 3.93




图5


  这是一个非常著名的HIFI级mp3制作工具,可以说是MP3历史上革命性的东西。MP3最受争议的就是音质问题,其高频损失很大,很多mp3编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节。Lame具有动态压缩的特点,可以尽可能的保持音质的纯正。我们测试的是一个669MB的WAV文件,参数设置为“-b320 -h -q 0”。



  6、Real9编码压缩




图6


  本软件可以实现多媒体文件的大比例压缩,使你的硬盘成为海量多媒体库。同时,本软件具有输出文件大小预算功能,让用户未压缩先知道其预计输出大小,为控制其大小可调节音频或总压缩速率选项。精确的剩余时间计算功能,让用户可以预知其剩余压缩时间。我们测试的是一个4分21秒(163MB)的MPG文件,参数设置为默认。



  由于时间关系,我们不可能测试更多的软件,不过以上各软件可以代表目前市面上主流的编码压缩软件。



  测试平台:



  CPU:



  Pentium4 XE3.2G(200×16/2M三级缓存)



  Pentium43.2G(200×16/HT)



  Pentium4 2.6C(200×13/HT)



  Pentium4 2.4B(133×18)



  Celeron3.2G(133×24)



  Celeron2.4G(100×24)



  Athlon64 3200+(200×10)



  AthlonXP 3200+(200×11/Barton)



  AthlonXP 2700+(166×13/Thoroughbred)



  AthlonXP 2500+(166×11/Barton)



  AthlonXP 1700+(133×11/Thoroughbred)



  Duron2.0G(200×10)



  Duron 1.6G (133×12)



  内存:



  Kingston DDR400 256MB×2(内存参数:2.5-8-3-3)



  显卡:



  GeForce FX 5900标准版(Forceware 52.16版)



  硬盘:



  希捷7200.7 80G



  主板:



  青云Albatron 865PE ProII(865PE芯片组,Pentium4、Celeron平台)



  华硕A7N8X 2.0(nForce2芯片组,AthlonXP、Duron平台)



  联想K8V800(K8T800芯片组,Athlon64平台)



  操作系统:



  WinXP+SP1+DX9.0b



  测试中我们共使用了多达13种组合的CPU频率,不同的玩家可以对号入座,若型号不在列举范围之内,则可以选择频率比较接近的CPU频率作成绩参考。




  2003年最受关注的CPU



  一、性能之王



  今年Intel和AMD发布的最强劲的面向PC的CPU都定位在3200这个数字上。AMD抢先发布了PR值为3200的AthlonXP处理器。Intel自然不会放手让频率之王被AMD夺得。6月23日,Intel正式推出第五款800FSB的P4,也是频率最高的——P4 3.2G。



  3个月之后,AMD再次出马,发布了其跨时代的产品——K8,其中包括了面向主流市场的Athlon64 3200+。




图1



  Pentium4 3.2G




图2


  作为对AthlonXP 3200+的回应,6月23日Intel正式发布了最新的3.2G Pentium 4处理器,为800MHz前端总线版本的Pentium 4家族再添一丁,刷新了x86处理器的频率新纪录。至截稿时Intel没有发布更高频的P4处理器。Pentium 4 3.2G也将成为今年的P4性能之王。Intel对AMD的绝对频率优势也将继续下去。3.2GHz的Pentium 4处理器的核心电压为1.550V,与3.0GHz Pentium 4一样;设计功耗为82.0W,与3.0GHz Pentium 4的81.9W相比只增加了0.1W,看来Intel在对功耗的控制方面是相当令人满意的(依然是个惊人的数字)。



  Athlon64 3200+



图3


  身为AMD K8家族的一员,Athlon64 3200+是对抗P4的最重要武器,与同门师兄Athlon FX不同,内置1MB二级缓存,内置的内存控制器仅支持内存单通道,新增对SSE2以及X86-64指令集的支持。Athlon64使用了较新的C0制程,而早期的Opteron使用的是B3制程。新的制程也提升了Athlon64的超频性能。支持单通道的Athlon64平台,至多只能支持3条普通Unbuffered内存。当需要使用4条内存条时,就必须使用Registed内存。作为Intel和AMD的旗舰产品,他们的品质不容质疑。他们也是0.13µm工艺的颠峰之做。



  二、超频极品:



  Pentium4 2.4C



图4


  每一款P4 2.4都有超频极品诞生,400FSB有编号SL6GS,533FSB有SL6EF,P4 2.4C有SL6WF。从整体的超频幅度看,P4 2.4C是最出色的。因为P4 2.4C采用的是D1核心,相比C1核心的P4,整体品质有了很大的提高。几乎所有的P4 2.4C都可以超越3G。一般的导致P4 2.4C超频失败最可能的原因在于主板和内存的设置。P4 2.4C的倍频是12,要达到3G,那么MCH的频率就要到250MHz。能提供这么高的频率的主板一般都价格不菲。这也是低倍频CPU超频的最大弱点。此外还要注意内存设置,如果设成同步的话,后果不堪设想。所以超频的时候要将FSB:DRAM设成3:2或者5:4



  目前P4 2.4C的风冷超频极限在3.8—3.9G左右。超到3.4G以上的可能性不低。选择P4 2.4C还因为它是支持HT技术中的P4中最便宜的。HT是一样非常有用的技术,虽然现在还不能通过测试软件进行量化,但是未来的前景还是很好的。当超频到3G以后,HT的效果更加明显。



  我们找了国内和国外两款属于极品的P4 2.4C的超频记录:



  Intel P4 Northwood 2.4CGhz (D1 Stepping)



图5


  AthlonXP1700+



图6


  Athlon XP1700+是Thoroughbred B核心的XP中的频率最低的型号。AMD制造工艺的进步使Thoroughbred B核心相比Thoroughbred A核心品质提高了不少。而且Athlon XP1700+的超频能力随着电压的提升而增强。加电压之后Athlon XP1700+至少可以上2400+(2.0G),超到2600+和2800+的概率也比较高,挑选Athlon XP1700+要特别注意编号。



  AthlonXP 2500+



图7


  超频极品有一个共同点:它们都是同系列中频率最低的。虽然它们的绝对超频记录不如高频CPU,但是超频幅度和价格的优势使它们成为超频极品。Athlon XP 2500+是Barton核心的最低型号,由于增加了256K L2 Cache,超频后的性能提升明显。Athlon XP 2500+大多可以超到3200+的频率(2.2G);体质更好的可以在风冷条件下达到2.3--2.4G的频率。受到0.13微米极限的限制,要继续提高一般需要采用液冷的方式。需要注意的是在超频Athlon XP系列要选择好的内存。



  三、另类产品



  Pentium 4XE



图8


  从本次测试来看,P4 XE应该算上目前桌面处理器上的性能之王,不过考虑到它的本身特点,我们这里将它归类为另类产品。说它另类是因为它比普通的P4多出了2MB的三级缓存。由于Intel意识到现有的P4在性能方面很难与Athlon64/ AthlonFX抗衡。在频率提升困难,Prescott延期的情况下,加大缓存容量来增强处理器的游戏的性能不失为捷径。和Athlon FX与Opteron的关系一样,P4XE也是由面向服务器的Xeno简化而来。昂贵也是P4XE的特征之一:OEM的每千颗单价达到了740美元,零售价格达到900美元(国内报价为8900元)。



  Applebred和Thorton



图9


  新Duron 1.6G



图10


  Thorton核心AthlonXP 2000+



  这两款产品也与CPU的缓存有关。为了填补老Duron和Athlon XP1700+/1800+的停产形成的低端市场上的真空,AMD发布了采用Applebred核心的Duron处理器和Thorton核心的Athlon XP处理器。Applebred核心的Duron处理器是屏蔽掉192K L2 Cache的Thoroughbred-B核心的XP处理器。与P4 Celeron相比,新Duron的性能优势和价格优势明显。新Duron还有一个卖点便是可以通过连通L2金桥打开被屏蔽的192K缓存,修改成功之后新Duron就摇身变成了Thoroughbred核心的Athlon XP了。



  Thorton是由Barton简化而来的,L2 Cache从Barton的512K减至256K,因此Thorton也有改造的潜力。方法与新Duron一样。Thorton的起跳频率为2000+(1.667G),不久又发布了2400+(2.0G)。Thorton的品质普遍不错,大多可以超到2G以上。




IT168.com

相关阅读 Windows错误代码大全 Windows错误代码查询激活windows有什么用Mac QQ和Windows QQ聊天记录怎么合并 Mac QQ和Windows QQ聊天记录Windows 10自动更新怎么关闭 如何关闭Windows 10自动更新windows 10 rs4快速预览版17017下载错误问题Win10秋季创意者更新16291更新了什么 win10 16291更新内容windows10秋季创意者更新时间 windows10秋季创意者更新内容kb3150513补丁更新了什么 Windows 10补丁kb3150513是什么

文章评论
发表评论

热门文章 谷歌眼镜拆解详细图

最新文章 Intel 12代酷睿低功耗AMD RX 6500显卡价格多 Intel ARC A380性能规格曝光 显卡ARC A380最小米12发布会在哪看 小米12新品发布会直播地小米9 Pro 5G手机价格 小米9 Pro 5G手机什么iPhone 11发布会直播地址 iPhone 11发布会中

人气排行 SSHD固态混合硬盘详细介绍三星Galaxy Alpha S7拆解图文教程 三星Gala软超频卷土重来——ClockGen全攻略cpu天梯图2013最新(7月)桌面超频人人都行 升技AI7主板之终极测试小米路由器3怎么样 小米路由器3配置评测小米笔记本Air玩游戏怎么样 小米笔记本Air玩一起来看世界上最昂贵的电脑机箱吧