【pconline评测】2006年中,amd做了一个震惊it业界的决定:耗资54亿美元收购ati。当时业界内外都纷纷议论cpu大厂与gpu大厂的结合能擦出什么样的火花,不久之后amd便给出了答案再见、和apu说你好了。
3回顶部
3、五大部件融合!apu架构解释
不同于传统的cpu,apu是cpu与gpu异架构融合后的产品,整体来说apu采用了全新微架构,本节我们会为大家解释amda系列apu的微架构。
五大部件大融合,a系列apu微架构解释:
a系列apu(llano)微架构
amda系列apu微架构由五大部分融合而成:cpu、gpu、北桥、内存控制器和输入输出控制器。如何用这些部件、尤其是cpu和gpu协调工作,amd下了不少功夫:整合北桥芯片作为枢纽,cpu通过北桥访问内存;采用fusioncomputelink来将北桥、gpu、io连接在一起,同时在gpu和北桥之间搭建radeonmemorybus,目的是让gpu与内存进行高速数据交换,从而提升3d性能与并行计算性能。
毕竟gpu没有内置显存或高速缓存,与内存的交互非常重要。当然,cpu与gpu争夺内存资源也是在所难免的,因此理论上用高速内存能获得更好的性能,而官方的内存支持度也提高到ddr3-1866。
cpu部分,husky微架构解释:
a系列apu(llano)cpu部分的hursky微架构
amda系列cpu部分采用husky微架构,它并非全新的cpu微架构,而是k10(或称为stars)微架构的改进版,主要改进部分包括升级32nm制作工艺、每个核心拥有1mb二级缓存和turbocore技术支持,还有一些如硬件预读取、硬件分割器等改进使ipc(每时钟周期指令数)6%。
简单来说,a系列的cpu性能和上代athlonii相比,在核心数、主频相同的情况下,前者的性能也会更强。当然,由于缺乏三级缓存,a系列的cpu依然比不过phenomii。
gpu部分,sumo架构解释:
代号sumo,a系列apugpu部分的架构
代号turks,hd6670/6570独立显卡采用的核心
amda系列的gpu部分采用代号为sumo的核心,它是源于amdhd5000/6000独立显卡的vliw4+1d架构,它拥有400个流处理器,采用uvd3高清解码引擎。相比桌面的hd6670/6570显卡所采用的turks核心,sumo除了流处理器少80个外,主要去掉了多屏技术、显存控制器、pci-e接口、交火接口。
由于没有了显存,所以通过北桥与内存进行高速数据交互先得很重要,因为内存要担任显存的角色。相比intel的hdgraphics系列核芯显卡,sumo最大的特点是支持dx11技术(曲面细分、directcompute11等)、opencl1.1运算。
uvd3.0解码引擎支持大部分常用视频格式
amd最新uvd3解码引擎除了支持最常规的格式外,还改进了mpeg-2解码方案,使得mpeg-2编码最复杂的软解码部分也可以支持硬解了,另外还加入流行的divx/xvid视频硬解码的支持,这些改进使cpu在播放高清视频时占用率降到最低。
4回顶部
4、第二代turbocore技术、山猫平台
第二代turbocore技术解释:
我们知道,intel的corei7/i5支持turboboost睿频加速技术,能智能调整cpu频率,以更好适应对多线程优化不足的环境。amd在phenomiix6中开始引入类似技术,叫turbocore,不过当时的turbocore相对intel的turboboost来说不太成熟,一年之后,amd在a系列apu中引入了第二代turbocore。
第二代turbocore技术
第二代turbocore相比第一代确实智能太多了,首先amd引入了apm模块,它会监测apu的功耗、温度以及当前任务的负载情况,判断下一步cpu和gpu的加速动作,降低用不上的cpu核心或gpu的频率,把能源留给正在执行任务的核心,智能提高其频率,只要功耗不超过tdp(热设计功耗),加速便一直有效。
第二代turbocore会根据实际情况智能调整cpu频率
举一些简单的例子吧,1、上网冲浪,一般情况只用到一到两个核心,此时用不上的gpu与其他cpu核心会降频,正在使用的那两个核心的频率会大幅度提升,给用户更好的上网体验。2、某3d游戏只用到两个核心,但gpu要满载,用不上的两个cpu核心就会降频,正在使用的核心频率会提升,但幅度相对较小,此时apu的功耗和温度比上网时要高。
turbocore不会对gpu进行超频,就是说gpu最高只能达到标准频率,至少笔者目前掌握到桌面平台的情况是这样。
amda系列需搭配a75/a55主板,原生支持usb3.0:
采用fm1接口的amda75主板
amda系列采用全新的fm1接口,不兼容am3/am3+cpu,也就是说,如果你正在使用am3平台,想升级a系列,就得换主板了。amda系列apu的配套主板是a75和a55,两者区别是a75有4个原生usb3.0接口。
主流3a平台山猫平台(lynx),由amda系列处理器、a75/a55主板和hd6000系列显卡组成。山猫平台最大的亮点是支持新的混合交火模式,apu中的gpu部分能与hd6000显卡进行混合交火,提升3d性能。
山猫平台的绝招免费的内置显卡有如此性能,确实没什么好挑剔了。要知道,amd还有更强的apu呢。
12、cpu性能评测,平台介绍及方法说明
amdfm1(apu)平台cpuamda6-3650(4核/4线程)主板映泰ta75a+(a75)内存宇瞻ddr3-13332gx2(8-8-8-24)硬盘日立1tb显卡蓝宝石hd6870(900/4200mhz)
amdam3平台cpuamdathloniix4645(4核/4线程)amdathloniix4645@2.6ghz(4核/4线程)amdathloniix3450(3核/3线程)主板微星890gxm-g65(890gx+sb850)内存宇瞻ddr3-13332gx2(8-8-8-24)硬盘日立1tb显卡蓝宝石hd6870(900/4200mhz)
intellga1155平台cpuintelcorei32100(2核/4线程)intelpentiumg620(2核/2线程)主板微星h61mu-e35(h61)内存宇瞻ddr3-13332gx2(8-8-8-24)宇瞻ddr3-10662gx2(7-7-7-20),g620硬盘日立1tb显卡蓝宝石hd6870(900/4200mhz)
软件平台操作系统windows7ultimatex64sp1驱动程序显卡:catalyst11.6评测软件软件:fritzchessbenchmark4.3aida641.80wprime2.04winrar4.0164bitphotoshopcs5cinebenchr11.564bittmpgenc4.7.73dmarkvantagev1.103dmark11v1.02游戏:使命召唤7:黑色行动(dx9)星际争霸2(dx9)侠盗车手4:自由城之章(dx9)生化危机5(dx10)
第二代部分评测是传统的cpu性能评测,主要评测对象仍是amda6-3650,根据它的定位,我们选择了上代的athloniix4645、athloniix3450以及竞争对手的corei32100和pentiumg620作为比较对象。此外,我们还特意加入把athloniix4645的频率设定为2.6ghz,比较与同频率下的a6-3650之间的差距。
本次评测项目包括理论多线程性能测试、常用软件测试、专业应用测试、游戏测试、超频测试以及功耗测试。考虑到搭配中高端显卡(消除显卡瓶颈),游戏分辨率将全部采用1920x1080,画质设置最高。由于驱动和主板均处于工程版阶段,所以不能组建混合交火进行测试。
13、cpu理论多线程性能评测
这部分的测试内容包括科学运算测试软件wprime和ai(人工智能)运算测试软件fritzchess,两款软件均对多核cpu进行大量优化,对cpu性能有较大的指导意义,由于只是理论运算,我们把它们归类为cpu理论性能测试。
fritzchess性能测试:
fritzchessbenchmark
《国际象棋》测试成绩
wprime2.04性能测试:
wprime
wprime2.04测试成绩
测试小结:在国际象棋和wprime的测试中,核心数、线程数对性能起决定性作用。四核的amda6-3650轻松战胜其他非四核的对手,和自家上代athloniix4645比较,后者更强,毕竟两者的cpu微架构区别不大,后者高出0.5ghz的主频。不过如果主频相同,a6-3650会稍微领先,主要得益于更大的l2缓存。
12回顶部
14、rar与ps,常用软件性能评测
rar文件解压缩和ps图片处理是普通用户的常用操作,我们选择了著名的winrar软件以及photoshop进行这部分的评测。
winrar4.01测试成绩
photoshopcs5图片处理测试:
photoshopcs5
photoshopcs5测试成绩
测试小结:winrar和photoshop是普通用户较常用的软件,它们对微架构、缓存大小、核心数/线程数与指令集的优化程度比较敏感,intel的sandybirdge系列cpu有不少优势。而k10微架构的a6-3650只是表现平平,这两个项目cpu核心数没有起到决定性作用。
13回顶部
15、专业软件,3d渲染与视频转换评测
这部分的测试内容包括cinebenchr11.53d渲染测试和tmpgenc视频转换测试,对于常进行3d图形渲染或视频转换的专业用户说来,很有指导意义。
cinebenchr11.564bit
cinebenchr11.53d渲染测试
tmpgenc视频软件
tmpgenc视频转换测试成绩
测试小结:在面向专业用户的3d渲染和视频转换软件,是对多核多线程cpu优化较好的应用型软件,四核a6-3650有不错的表现,同样是得益更大的l2缓存,性能比同频下的athloniix4645稍强。值得注意的是,由于intelcorei32100在sse等多媒体指令集上有更好的效率,加上高频、超线程技术,使其视频转换上能逼平、战胜amd四核。
14回顶部
16、理论测试:3dmarkvantage、3dmark11
3dmarkvantage
3dmarkvantage测试成绩
dx11测试软件3dmark11:
3dmark11
3dmark11是一款基于directx11的3d性能基准测试软件,款内置了三大测试项目:图形性能测试、物理性能测试和综合测试,分别测试显卡性能、cpu性能和cpu/显卡的综合性能。3dmark11的物理性能测试(cpu性能测试)改用了免费的bullet物理引擎。我们采用最新的1.02版,改进部分cpu的效能。
3dmark11测试成绩
测试小结:在3dmark系列测试,我们主要测试的是cpu的物理运算和人工智能运算,这两个项目对多核、多线程cpu有优化。a6-3650表现出应有水平,其中3dmark11中其表现尤其抢眼,甚至战胜默认频率的athloniix4645,这无疑是l2缓存的功劳。详情可参考《结果出乎意料!19款cpu决战3dmark11》一文。
值得一提的是,3dmark11v1.02版的物理测试部分改进了cpu效能,经测试笔者多次验证,证实以上amdcpu的得分均比之前版本测出的要高,而两款intelcpu却没有变化,由于本次评测的样品不足,是否有对intelcpu优化还不好判断,感兴趣的朋友可留意我们今后评测。
15回顶部
17、热门游戏测试:《星际争霸2》、《使命召唤7》
dx9游戏《星际争霸2》:
星际争霸2:自由之翼
《星际争霸2》是今年最受欢迎的pc游戏,虽然只支持dx9特效,但画面毫不逊色,游戏加入了大量ai运算,对cpu性能提出更高的要求。我们采用测试录像verschollenertempel四人图进行测试,对战种族人族对神族,录像从第13分30秒双方出现交战情况到14分30秒交战结束,测试耗时1分钟。
《星际争霸2》测试成绩
dx9游戏《使命召唤7》:
使命召唤7:黑色行动
《使命召唤》系列一直是最热门的fps游戏,最新作《使命召唤7:黑色行动》更是创下1100多万的销售纪录,可见其受欢迎程度。我们选取游戏中的s.o.g这关进行测试,当见到主角离开帐篷后开始测试,直到第二个飞机残片过头后为结束,用fraps记录平均帧数,测试三次取中间值。
《使命召唤7》测试成绩
18、经典游戏测试:《侠盗车手4:自由城之章》、《生化危机5》
dx9游戏《侠盗车手4:自由城之章》测试:
侠盗车手4:自由城之章
《侠盗车手4:自由城之章》测试成绩
生化危机5,采用自带benchmark测试
《生化危机5》测试成绩
19、内存性能测试
aida64的memorybenchmark
aida64的前身是everest,它是一款全面的系统检测软件,它可以详细的显示出pc每一个方面的信息。我们采用软件自带的memorybenchmark进行评测,可以直观显示出内存子系统的效能。
aida64内存性能测试融合型cpu占据?
入门显卡市场再一次被冲击
cpu与gpu的融合是趋势