cpu等于处理器cpu够用吗吗？

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>处理器 >>cpu等于处理器cpu够用吗吗？

cpu等于处理器cpu够用吗吗？

来源：蜘蛛抓取(WebSpider) 时间：2018-04-28 17:06 标签：微处理器是cpu吗

当前位置 & &
& 是时候升级你的CPU了如何选购适合自己的？
是时候升级你的CPU了如何选购适合自己的？
17:18:09&&出处：&&
编辑：鲲鹏 &&)
让小伙伴们也看看：
阅读更多：
好文共享：
文章观点支持
文章价值打分
当前文章打分0 分，共有0人打分
[06-22][06-22][06-22][06-21][06-21][06-21][06-20][06-20][06-20][06-20]
登录驱动之家
没有帐号？
用合作网站帐户直接登录抛开显卡的说：游戏中CPU看重的是频率还是核心数
　　【PConline导购】目前主流的游戏作品中，不论是单机游戏还是网络游戏，影响游戏性能的因素不再单单只是显卡这一部分。随着诸如DX12等底层API的优化，越来越多的游戏可以发挥出CPU多线程、多核心的优势。换而言之对CPU性能提出了更高的要求。如今早已不再是2核2线程的CPU都能通吃所有游戏的年代。&●对于游戏玩家来说，CPU的核心数重要还是主频重要？　　现在的游戏大致可以分为两种，一种是以《看门狗2》、《奇点灰烬》、《使命召唤》等3A级游戏大作为代表，这部分游戏往往需要CPU进行复杂的物理运算来控制游戏中的每一个AI，对于CPU的核显线程数当然是越多越好，而仅仅只有2核2线程的CPU往往只能吃到闭门羹，谢绝入场。　　另外一种是类似与《英雄联盟》、《坦克世界》、《守望先锋》等热门网游为代表，这部分游戏对于核心线程数并不敏感，但对于游戏的主频却是越高越好！高频的i3比低频的i5好、至尊版i7不敌4.2GHz的i7的情况在这部分游戏中属于相当&正常&的情况。　　所以对于游戏玩家，CPU的核心数重要还是主频重要？这个要视乎玩家究竟偏好玩什么游戏？所以今日小编就针对近期推出的3款热门游戏推荐3款能爽玩的CPU。&●《生化危机7Resident Evil 7》游戏类型：FPS推荐CPU：Core i3-7350K从1996年的《生化危机1》的开始，21年的时间，系列作品圈粉无数，更是陪着许多人走过了自己的青春。本作生化危机7，放弃了传统生化固有的第三人称视角，改为第一人称视角，主人公将会置身于美国南部的一间被废置的农舍，腐烂的墙身渗透着一股恐怖及孤独的氛围。玩家需要操控主人公完成一场亲身体验，务求塑造出一种&隔离视觉&的观感，此代游戏的恐怖感觉将会是空前。CAPCOM在制作生化7的时候，利用了全新的&RE引擎&，而这一专门为此游戏所开发的引擎，画面呈现能力更是堪比电影画面，并且此次的生化更是提供了VR版本试玩，大大的增加了游戏的沉浸式体验，当然这也间接提高了游戏的配置要求。不过对于CPU而言，核心线程数并不是生化危机7所看重，2核2线程规格的CPU没有被排除在外，反而高主频的CPU会有更好的游戏帧数表现，所以针对这款游戏小编推荐Core i3-7350K。　　Core i3-7350K虽然定位Core i3，按照Intel对i3的定位就是一款高效办公的CPU，搭配主流B250/B150的主板。不过Core i3-7350K的规格对于普通Core i3型号完成超班，更是第一次以i3的身份出现K系列的超频队伍之中，将超频的门槛进一步降低，搭配Z170/Z270主板成为入门的超频平台。　　Core i3-7350K采用第三代14nm制作工艺，CPU部分还是属于i3规格：2核4线程，基于KabyLake架构（Skylake优化版），默认主频拉升至疯狂的4.2GHz，即使没有睿频功能，4.2GHz的高频令到那些还是3.0GHz起步的Core i5汗颜，单核性能完爆之。4MB的L3缓存和HD 630的核显，支持DDR3L-1600/DDR4-2400，TDP 65W，LGA 1151接口，兼容100/200系主板。　　Core i3-7350K是Intel 七代酷睿中i3的最高性能标杆，集超频和高主频的特性于一身，本身的可玩性非常之高，主板建议搭配近期即将抄底的Z170主板，CPU和内存都小超一下，就能获得不错的性能提升，搭配GTX1060/RX 480这类高性能显卡也不是不会拖后腿。没错！对于那些不吃CPU核心线程数的游戏来说，高频的i3的确实会有更好的游戏体验。&●《幽灵行动：荒野Ghost Recon: Wildlands》游戏类型：FPS推荐CPU：Core i5-7500　　一直以来Tom Clancy这个名号，所衍生出的游戏都还算是比较优质，这其中幽灵行动系列当属优质中的优质，2017已经确定会推出的荒野，还未上市就已经在去年的E3上面火了一把，随着如今沙盒游戏的大行其道，荒野也走上了这条路。故事发生在一个全球最混乱的地区，臭名昭著的犯罪集团已经让整个地区陷入了混乱之中，这里暴力滋生，人心恐慌，完全没有正义而言。玩家将率领着特种部队The Ghosts深入敌后，主要任务是制造混乱以打破毒品集团和腐败政府之间的肮脏勾当（甚至让他们互相残杀）。　　幽灵行动：荒野支持单人和四人小队合作、可以驾驶多种载具包括山地摩托、武装车辆、直升机等（标准沙盒配备），自由度很高，地形设置也很广阔，这也就要求你的电脑需要满足不同画面地形贴图的要求，相比主机平台的配置极限，PC版本可以更加凸显游戏的效果，当然相对的，对于你的电脑要求也就越高，你总不想在连绵的雪山上，因为你掉链子而被冻死在队友的口水之中吧&　　万幸的是游戏本身不怎么吃U的频率，但由于小队制的作战模式反而对CPU的核心线程数有一定的要求，所以《幽灵行动：荒野》这款游戏适合Core i5-7500。　　Core i5-7500是取代上一代热卖型号Core i5-6500，工艺和架构都有细微的优化，优化后主要体现在主频和睿频的提升。但价格却是同价位取代，i5-7500的性价比进一步提升。目前散片售价维持在1175左右。3K-4K之间的电商主机选择i5-7500的最多，由此可见它的受欢迎程度如何。两代Core i5参数对比CPU型号i5-6500i5-7500核心代号SkylakeKabyLake接口类型LGA 11501LGA 11501核心线程4/44/4制程工艺14nm14nm是否超频否否频率3.2-3.63.4-3.8三级缓存6MB6MB内存支持DDR3L-1600DDR4-2133DDR3L-1600DDR4-2400显示核心HD 530HD 630TDP65W65W售价(散片)11551175　　Core i5-7500作为Intel 最新的第七代酷睿，基于KabyLake架构，第三代的14nm支持工艺，4核4线程规格，主频3.4GHz，睿频可达3.8GHz。加上Speed Shift技术的升级，可在更短时间内将睿频提升至最高状态。HD 630核显，支持DDR3L-1600/DDR4-2400内存，TDP 65W。4核4线程规格可满足今年绝大部分的大型游戏的需求。&●《质量效应：仙女座 Mass Effect Andromeda》游戏类型：RPG推荐CPU：Core i7-7700K　　全新的《仙女座》的故事架构和之前的一代有着很大差异，游戏故事发生在仙女座星系的赫利俄斯星群。玩家扮演被称为&探路者&的探险家，为了寻找人类的新家而进行远征。在求生存的殖民过程中，将会遭遇&狂野的领域&、&冷血的暴徒&以及&好战的外星种族&。　　这一代在制作上沿用了《战地1》的寒霜3的游戏引擎，游戏虽然尚未发布，但是按照过往那些采用过寒霜3引擎制作的游戏推断，本座对CPU多线程利用很高，所以建议推荐选择多核心线程数的CPU。　　Core i7-7700K是Intel第七代酷睿KabyLake家族中的旗舰型号，基于优化后的KabyLake架构，主频和睿频都得到大幅度的提升，超频能力更是分分钟风冷就能上5.0GHz的能力。采用4核8线程设计，高频+4核8线程的规格比至尊版i7更懂游戏，绝大部分的3A大作游戏中都有冠绝全场的表现。　　当今世道高频大杀器当属？Core i7-7700K当之无愧，其游戏性能表现可谓恐怖。不过2000元以上的售价，注定只有少部分的高端玩家才能拥有。PConline总结：　　上面提到的近期发售3款热门游戏只是今年即将到来的游戏大军中的冰山一角，不过这3款游戏都比较具有代表性，还不知道要选什么CPU的玩家可以类比参考。　　DX10、DX11再到DX12，游戏画面虽然已看不到有什么质的飞跃，但游戏厂商为了使游戏更真实，无疑会加入更复杂的人工智能、物理特效等效果，使游戏效果更接近真实，特别是3A级游戏大作。此时CPU的地位将越来越重要，正如对多线程优化更好的DX12等新游戏。多核心始终都是未来游戏的主流需求。
DIY硬件图赏
DIY论坛帖子排行
最新资讯离线随时看
聊天吐槽赢奖品80核处理器是什么？intel80核处理器介绍
　　在科学高速发展的时代，电脑已经不可或缺。而电脑作为我们办公以及娱乐的东西，它的配置、性能等方面都是我们选购的因素，一款好配置的电脑能让我们工作效率倍增，让娱乐更加有趣。众所周知，处理器是电脑的心脏，没有它电脑是绝对不能运转的。而我们最常用的就是英特尔处理器，但英特尔处理器却发布了一款80核的处理器，虽然它不会面世，但我们还是可以了解一下。　　1.什么是80核处理器　　80核Teraflop Research Chip处理器可以在1秒钟内完成1万亿次计算，但其外观只有指尖大小，而且能耗仅相当于今天我们的一件家用电器的耗能。Teraflop Research Chip处理器是英特尔公司在&万亿级计算&(Tera-scale computing)研究领域内取得的最新研究成果。　　2.80核处理器的性能　　Terascale&工程下的这种80核心处理器核心面积275平方毫米，3.16GHz，电压0.95V，数据带宽1.62Tb/s，浮点运算能力1.01TFlops(每秒万亿次)，相当于1万颗10年前的Pentium Pro，而功耗不过62W，比如今桌面的Core 2 Duo还低，是四核心Xeon XGHz的大约一半，而后者的浮点运算能力估计为50-60GFlops(每秒十亿次)。　　按照当今流行的性能功耗比指标计算，Intel称其32位80核心处理器已经达到每瓦特16GFlops。　　如果进一步提升主频和电压，浮点运算能力还能继续提升，比如5.1GHz下可达1.63TFlops(2.61Tb/s)、5.7GHz下可达1.81TFlops(2.91Tb/s)，不过功耗也会迅速增加，分别高达175W和265W。当然，蓝色基因/L的367TFlops(峰值能力)是用65536颗双核心Power处理器换来的，而Intel要达到这一水平只需要202颗80核心，功耗自然不可同日而语。　　Intel解释说，80核心处理器相当于&一颗芯片上在构建了一个计算机网络&。每个核心都集成两个浮点引擎，还有一个负责控制与其他核心进行数据通信的路由单元，而且前、后、左、右都各有一个连接界面通向其他核心，还有第五个&3D&连接界面通向堆栈存储器。　　3.80核处理器的规划　　虽然Intel为未来计算世界勾画了一幅美好的画面，但却表示这种80核心处理器只是一个旨在挖掘浮点预算能力的研究性项目，不会成为一种实际产品，当然就不会出现在PC或服务器中。当然，&Terascale&工程研发出来的技术是会适当改造用于主流产品的。　　A曾在此前表示，单纯增加核心数量可能会重蹈一味提高主频的覆辙，而Intel现在作出了回应，一方面声称多核心设计芯片可以容纳不同用户的核心，比如可以有效运行操作系统等传统应用的通用目的核心，另一方面又指出现有发展环境下到16核心就足够了，再往后增加核心数量就不会明显提高性能，必须从其他方面着手。　　在发展蓝图上，Intel和AMD一定程度上达成了共识，不过也都有各自的独到之处：AMD倾向于基于GPU的&流处理&，Intel则关注于类似CPU的浮点引擎。当然不要忘了NVIDIA，他们正准备发布技术的公开测试版，将其显卡同时改造为通用处理引擎和浮点加速引擎。　　看了以上的介绍，大家有没有觉得激动人心呢。我们平时用的处理器都是四核和八核的，差点的还有双核。而80核，都是想都不敢想的。英特尔的这款处理器虽然并不会上市，但是我们光是看着就已经觉得非常的有兴趣了，有了这样的处理器，电脑的速度增加不只是一倍，科技如此发达，相信总有一天，会有更加发达的产品出来。
最新更新栏目
您可能喜欢
大家都在搜整天造芯片,但你知道CPU到底是怎么工作的吗？
我的图书馆
整天造芯片,但你知道CPU到底是怎么工作的吗？
对于同级别的CPU产品而言，AMD CPU的单核性能（甚至总体性能）比Intel CPU的差，甚至差距不小，这是不争的事实。然而，几乎没有人问一句为什么如此，或者只是略知一二（包括我）。本文就用尽量浅显的语言探讨一下这个实际上极为复杂的问题。鉴于Intel和AMD都没有披露新品的whitepaper的习惯，所以我用信息比较充足的有点久远的型号进行讲解，就是Intel的Sandy Bridge/Ivy Bridge（第2、3代酷睿）和AMD的Bulldozer/Piledriver（推土机、打桩机）微架构。目前来讲，两家的微架构设计都大体稳定，从比较新的Broadwell和Steamroller的各方面信息来看，它们仍然基本沿用了从Sandy Bridge和Bulldozer以来的方案，没有本质的变化。（因此农企想要翻身，只能把希望寄托在遥不可及的Zen微架构上了）首先来说基础知识，就是CPU是如何工作的。学习计算机科学的童鞋可能对下面的这些东西比较了解。CPU之所以能完成这么多的事情，是因为它在时时都在执行着很多的指令(instructions)。指令就是我们所运行的操作系统和各种程序发送给CPU的命令，CPU根据这些指令来做出各种响应。CPU能够执行的所有指令的集合就叫做指令集(instruction set)。目前我们最常见的Intel和AMD CPU，其都采用最经典的CISC x86指令集，以及在x86指令集上的某些扩展，也就是说绝大部分是相同的。另外，CPU中还有两个重要的部件，分别为寄存器(register)和缓存(cache，为了方便简写为$)，它们都担负着暂存指令或者数据的作用。寄存器处于CPU内部，有很多组，是最高速的存储单元，容量非常小。缓存可以处于CPU内部或外部，其存储速度比寄存器慢，但比内存快得多，并且容量可以用KB或MB来衡量。另外，缓存可以分级，离CPU核心最近的叫做一级缓存(L1$)，次近的叫做二级缓存(L2$)，以此类推。只有指令没有用，必须还要有一套方法来驱动CPU做事情，否则不过是空壳而已。这套方法就叫做流水线(pipeline)。这个概念并不抽象，大家可以把它想象成工厂装配车间里的流水线：从一堆零部件开始，经过流水线上十几位工人的组装，最后出来的时候就变成了一台可以使用的设备。并且，工厂里肯定不只有一条流水线，可能有数十条，也就是上百甚至上千位工人同时工作，生产效率就会变得非常高。从上世纪90年代的奔腾时代之前，CPU中就引入了流水线的概念。当时的5段流水线模型十分经典，其设计经过逐代扩充，目前仍然在用。这个经典的模型就是：取指(Instruction Fetch)→译码(Instruction Decode)→执行(EXecute)→写回(Write Back)分别简称为IF、ID、EX和WB，其中ID阶段有两段，分别称为ID1和ID2，所以一共5段。顾名思义，这条流水线的逻辑就是：从缓存或者内存中取得指令→对指令进行翻译，变成CPU能够理解的具体功能→按照翻译结果，执行运算动作→将运算结果写回存储器中。很容易理解吧。大家都知道，CPU的运作是靠时钟信号来驱动的，这个信号的频率就叫CPU的主频(main frequency)，频率的倒数当然就是周期了。一般来讲，每个流水线阶段的执行需要花费1个时钟周期(clock cycle，为了方便简写为CC)。因此，如果这样的流水线执行4条指令，那么它的执行时空图就如下。也就是说，采用这种流水线只需要8CC就可以执行4条指令，效率非常高。到了奔腾时代之后，更出现了超标量流水线(superscalar pipeline)，也就是CPU中有多条流水线同时执行指令，效率几乎翻倍提高。另外，还出现了超流水线(super pipeline)，也就是流水线的级数大大增加，规模明显提升。分别的示意图如下。但是，这样的流水线设计也存在问题，具体来讲有二。第一，考虑同一流水线中先后执行的两条指令1：add a,b和2：xor c,a，也就是说2需要1的计算结果，这种关系叫做相关性。当指令2执行到上表中第5个CC时，无法进入EX阶段，因为此时指令1的结果还未写回寄存器，也就是说指令2的EX阶段必须拖到第6个CC才可以执行，浪费了一个CC的时间，这叫做流水线的阻塞(stall)。超流水线级数越多，这种现象就越发明显，效率就越低。如下图。第二，考虑超标量流水线中，不同流水线中执行的两条指令。如果排在前面的指令执行速度太慢（比如涉及耗时严重的访存操作），那么会造成后面早已执行完毕的指令不得不等待，造成更严重的性能问题。也就是说，基于线性通路的流水线，对于目前的复杂的微处理器而言是并不适用的。因此，Intel早早就提出了“乱序执行”(out-of-order execution, OOO EX)的概念，采用非完全线性的通路来规避这个问题。也就是这样的。我借助这个图粗略讲一下现代处理器的执行过程。上图是一个四发射、乱序执行的流水线框图，从1995年以来的Intel处理器基本都采用类似的设计方案。所谓多发射(multiple issue)，就是处理器能够同时获取并译码多条指令，目前的处理器几乎都是四发射设计。首先，在取指过程中，会多出一个分支预测(branch prediction, BP)的阶段，图中未明确示出。分支预测器能检测诸如跳转、返回等动作的大致发生时机，并提前把跳转目的地的指令加载到指令缓存(I$)中，以提高效率。然后，经过多个译码器的译码，指令被分解成为上文所述的CPU能够理解的操作，这些叫做微操作(μop)。微操作被送入寄存器别名表(RAT)，进行重命名，以防止多条指令共用一个对程序猿非透明的寄存器时产生的相关性，简单来讲，就是用内部的临时寄存器来替代一般我们能见到的寄存器来进行操作。重命名完毕后，微操作进入后面的重排序缓存(ROB)中，进行重新排列。然后就是乱序执行的重点了。微操作从保留站(reservation station, RS)中，分别打入不同的执行端口(port)，同时执行。每个端口都是全速运行的，只要微操作准备就绪，并且有空闲的对应端口，那么它就可以立即被执行，而不用关心其他微操作的执行状态，也就是可以跳过任何还没有准备就绪的微操作。这样，流水线产生阻塞的可能性就大大地降低了。每个port都可以负责一种或多种事务，如整数运算、浮点运算、存数据、取地址等。当一条指令分解成的所有微操作被执行完毕之后，它们会返回保留站，并通知各自的地址，通过地址可以将微操作重新聚合为一条完整的指令。完成的指令排成一个队列，并退出流水线。也就是说，尽管所有指令的碎片是乱序执行的，但从流水线中出来时，它们仍然是顺序的，就跟自然而然的一样。基础知识讲完了，下面开始对比，看看农企为何不太给力。为了描述方便，后面用SNB/IVB代表Sandy Bridge/Ivy Bridge，BDZ/PDV代表Bulldozer/Piledriver。首先看SNB和BDZ的简单框图。下面的是以i7 2600为例。下面的则是以八核心Opteron为例，毕竟图上写了个Interlagos Node，反正是推土机就好了，你们可以把它当成FX-8150之类的。我们都知道，Intel的CPU采用超线程(hyper threading, HT)技术，使得一个物理核心对高层而言看起来像是两个核心一样，这种逻辑的、虚拟的核心在Intel的概念内叫做线程。而AMD的CPU采用模块化设计，就是每两个物理核心集合为一个模块，AMD将它命名为计算单元(compute unit, CU)，一个CU中的两个核心协同完成事务。也就是说，i7是四核心、八线程，FX是四模块、八核心，本质上可以近似认为是一样的。另外，从图中还可以看到内存控制器、显示控制器、HyperTransport控制器等，并且还能大致观察到它们的缓存结构，下面当然也会细说。下面给出SNB/IVB架构的全图。下面给出BDZ/PDV架构的全图。可以看到，上面的两张图被中间的一条红线分为两个区域。红线上面的部分叫处理器前端(processor front-end)，下面的部分叫处理器后端(processor back-end)。另外，图中的方框也被五种颜色区分开了。前端部分包括紫色和橙色，紫色的为取指(IF)和分支预测(BP)模块，橙色的为译码(ID)模块。后端部分包括黄、蓝、绿三种颜色，黄色的为调度和保留站(RS)模块，蓝色的为执行(EX)模块，绿色的为存储(MEM)模块。我们逐个来讨论。首先看取指和分支预测模块。下图是SNB/IVB的该模块。下图是BDZ/PDV的该模块。我们来比较分支预测机制，就是图中的Branch Predictors。SNB/IVB的分支预测器有两级，每个核心有一个。第一级预测器很小，但速度极快，可以在1CC内完成一次分支预测。第二级则大得多，作为一个后备。预测器的成分包括：简单的2-bit预测器、全局历史预测器、循环退出预测器。Intel在内部自建有一套算法，用于判断当前哪个预测器的准确度较高，并选用之。SNB/IVB的分支目标缓存(branch target buffer, BTB)结构目前大多认为是1层，具体细节未知，但基本上会有多达8K甚至16K条条目（”reasonably large”）。对于每16个字节长的代码段，它能hold住最多4条跳转指令。另外，返回栈的缓存有16条。当然，如果预测错误的话，必然会造成时间损失（因为流水线几乎会被flush掉），这叫做误预测罚时(misprediction penalty)。SNB/IVB的罚时大约为15~17CC。BDZ/PDV的分支预测器则是每个模块有一个，由两个核心共享，采用本地预测+全局预测的混合预测方式。AMD在其内部使用了感知器(perceptron)，像神经元一样跟随并记忆分支结果，因此在经过一段时间的训练过程后，对较长的跳转有较好的表现。但其内部并无循环计数器，因此对于嵌套较深的循环表现比较差。BDZ/PDV的BTB结构是两层组相连的缓存。L1 BTB有128组*4路=512条，L2 BTB有1024组*5路=5120条。返回栈的缓存则是有24条。误预测罚时大约为20~25CC。我们大致需要知道的是：BP的误预测率越高，误预测罚时越长，那么整个BP模块的效率就越低。AMD宣称BDZ/PDV的BP效率较其上一代的K10(Barcelona/Magny-Cours)架构为高，但实际上是相反的。K10的误预测罚时只有12~15CC（当然，K10是没有采用比较先进的模块化设计的），也就是说，在同频率下，对于那些风险比较大的分支，BDZ必须要比K10达到40%以上的正确预测率的提升，才能弥补罚时的损失，但这是不可能的事情。相对而言，SNB/IVB的BP效率比较高，预测器中的一个bit可以对应多条分支，并且有了黑科技μop$的加成（下面会提到），误预测带来的损失会更小。上面有大神在回复中提到说，推土机有些像奔腾4时代的NetBurst架构。这种说法还是比较中肯的。BDZ虽然没有NetBurst那么恐怖的流水线级数（比如Prescott的39级流水线），但仍然比较长，有18~20级，并且分支预测的时间损失都比较大，都没有实现“通过提高主频就可以简单地提升性能”的设想。下面来看取指过程。对于SNB/IVB而言，当下一条指令的地址确定之后，就会同时查询L1I$和μop$（下面就提到），一次可以从I$取得16B的代码段。然后，取得的指令会被放入下面的预译码缓存中。预译码器会划分这些指令的边界，并对指令前缀进行译码。随后，经过预译码的指令以每个CC 6条的速度，送入下面的指令队列中，准备接受译码。SNB/IVB的指令队列长度未知，但由于早在Merom架构时，其长度就达到了18条，因此几乎可以肯定这里的指令队列长于18条。对于BDZ/PDV而言，取指模块仍然是由两个核心共享的。在两个核心都活动的情况下，它最多可以一次从I$取得32B的代码段；在一个核心活动的情况下，则是最多20B的代码段。当代码没有对齐时，取指的速率会有降低。指令在I$中划分边界，然后以32B/CC的速率，进入16个条目的指令码缓存，作用和Intel的指令队列是相同的。中国半导体论坛 csf211ic
馆藏&37533
TA的最新馆藏
喜欢该文的人也喜欢

cpu等于处理器cpu够用吗吗？

我要回帖

更多关于微处理器是cpu吗的文章

随机推荐

cpu等于处理器cpu够用吗吗？

我要回帖

更多关于 微处理器是cpu吗 的文章

随机推荐

更多关于微处理器是cpu吗的文章