专业游戏门户,分享手游网游单机游戏百科知识攻略!

嗨游网
嗨游网

什么是推土机架构

来源:小嗨整编  作者:小嗨  发布时间:2022-06-16 12:50
摘要:什么是推土机架构CMP和SMT CMP:CMP的方式非常直接,简单来说,CMP是通过 ldquo复制 物理核心来扩展处理器在多线程软件中的性能,这是获得最佳性能一种最简单和最有效的方式。但CMP的缺...

什么是推土机架构

CMP和SMT

  CMP:CMP的方式非常直接,简单来说,CMP是通过“复制物理核心来扩展处理器在多线程软件中的性能,这是获得最佳性能一种最简单和最有效的方式。但CMP的缺点是制造成本很昂贵,并且也要受到处理器制造工艺的限制,毕竟不能将芯片做的越来越大。并且CMP的方式对负载要求也很高,只有经过适当并行优化的负载才能充分发挥CMP的性能,很多核心的CMP常常会浪费资源,在一些应用中,主频更高、结构更简单的双核和四核处理器就往往可以获得更好的性能。

什么是推土机架构

  SMT:SMT是一个相对廉价的技术,比如英特尔的Hyper-Threading,允许每个物理核心运行两个同步线程。SMT的设计思想是充分利用每个核心的资源。如果一个物理核心只有一个执行线程,那么在等待内存中的关键代码或数据的时候,线程处于停顿状态,这样核心的利用率是低下的。而SMT技术允许一个物理核心运行两个或更多的线程,可以根据当前的状况动态进行切换,如果一个线程处于停顿状态等待内存,另一个线程的指令则可以使用这个物理核心的所有执行单元,让物理核心利用的更加充分。

  为了让SMT正常工作,处理器的所有代码和存储部分需要被复制或分区。例如,一个双线程SMT处理器需要两套架构寄存器和重命名寄存器,一套给线程A,一套给线程B。另外组成指令窗口的共享指令队列要具备很大的空间,这样指令窗口才能容纳足够多的来自两个线程的指令,让执行单元可以保持在忙碌状态。最后,两个线程任何共享单元,比如处理管线不同部分的指令缓存,都不能被任一个线程独占。换句话说,SMT核心的两个线程需要和另一个紧密的共享资源,保证核心的缓存单元不会空置没有线程利用。

CMP%u548CSMT  

推土机架构分析

  AMD推土机将采用32nmSOI工艺,这让推土机相比马尼库尔皓龙处理器可以在不增加功耗的前提下增加33%的核心数量、增加50%的吞吐量。与AMD之前所有处理器都有所不同的是,推土机采用了模块化的设计,每个模块包含两个处理器核心,这有些像一个启用了SMT的单核处理器。每个核心具有各自的整数调度器和四个专有的管线,两个核心共享一个浮点调度器和两个128位FMAC乘法累加器。

  所不同的,在K10架构中,ALU和AGU共享三个管线(平均1.5个),推土机中每个核心整数单元管线的数量增加为4个,2个AGU专有、2个ALU专有。L1缓存也有所不同,在K10架构中,每个核心具有64KB L1指令缓存和64KB L1数据缓存;而推土机每个核心具有16KBL1数据缓存、每个模块具有64KB双向L1指令缓存,至于减小的L1缓存是否会影响性能还有待观察。两个核心共享L2缓存,模块之间共享L3缓存及北桥。

推土机架构分析

AMD推土机模块

  模块和核心,这让我们不免会产生混淆,实际对于用户们来说,没必要去刻意的关注模块的概念,这只不过是AMD在设计上的称谓,而当产品投放市场的时候,依旧会以核心数量为标识,比如我们说采用推土机架构的Interlagos服务器处理器具有16个核心,而不会说是8个模块。对于为何采用这种模块设计的主要原因,AMD表示是为了减少CPU的冗余电路。

AMD“推土机”模块

  如果采用CMP的方式,随着核心数量的增加,CPU的核心面积也会越来越大,重复的电路也会越来越多,功耗也会随之增加——因为CMP是采用复制核心的方式。而采用模块设计可以大大减少冗余电路,这对核心的大量增加很有意义。比如推土机,两个核心共享浮点部分,对于大部分服务器应用来说,整数运算的部分要远远高于浮点运算(高性能计算除外),所以将浮点执行单元共享并不会影响大多数应用中的性能。而整数部分则不是共享的,否则会造成瓶颈。

  上文我们回顾过CMP和SMT设计的特点,我们可以把AMD推土机架构看做是介于这两种之间的一种设计:两个线程(核心)共享浮点执行单元,但是各自具有独立的整数执行资源。这看上去像是SMT的另一种形式,或者说是经过AMD改良的一种AMD式的第三种方式。但与传统的SMT设计不同,SMT仅仅复制的是核心的存储部分,一个线程一个存储模块(registerfile),而AMD推土机架构中,每个线程复制的是完整的整数执行单元硬件,一个线程具有一个存储模块(registerfile)和一组完整的整数执行单元。


本文地址:IT问答频道 https://www.eeeoo.cn/itwenda/6266.html,嗨游网一个专业手游免费下载攻略知识分享平台,本站部分内容来自网络分享,不对内容负责,如有涉及到您的权益,请联系我们删除,谢谢!


IT问答
小编:小嗨整编
相关文章相关阅读
  • 手机cpu性能天梯图2024(手机cpu性能天梯图排行榜)

    手机cpu性能天梯图2024(手机cpu性能天梯图排行榜)

    手机cpu性能天梯图2024(手机cpu性能天梯图排行榜)手机cpu性能天梯图排行榜第十名苹果A12、骁龙865、麒麟990这个段位的代表机型呢就是iphoneXsmax。当年的机皇,不仅屏幕大,性能还强。距离它发布时间已经过去六年了,放到...

  • cpu温度检测软件哪个好(cpu温度检测软件有哪些)?

    cpu温度检测软件哪个好(cpu温度检测软件有哪些)?

    cpu温度检测软件哪个好(cpu温度检测软件有哪些)?现在的一些cpu,虽然也可以在100℃的温度下运行,但不建议长期高温运行。如何判断我们的cpu温度,可以介绍几个cpu温度检测软件。1、在BIOS中查看在电脑开机时马上按Delete或F...

  • 魔兽世界掉帧是显卡还是cpu(魔兽世界掉帧怎么处理)?

    魔兽世界掉帧是显卡还是cpu(魔兽世界掉帧怎么处理)?

    魔兽世界掉帧是显卡还是cpu(魔兽世界掉帧怎么处理)?魔兽世界掉帧是CPU和显卡都不行了,魔兽世界不断在升级,游戏硬件要求也不断提升,你的配置早已落伍。魔兽世界掉帧怎么处理解决方法1:使用迅游网络优化工具大家在现阶段登录游戏遇到的魔兽世界国...

  • 魔兽世界吃cpu还是显卡(玩魔兽世界需要什么配置的电脑)?

    魔兽世界吃cpu还是显卡(玩魔兽世界需要什么配置的电脑)?

    魔兽世界吃cpu还是显卡(玩魔兽世界需要什么配置的电脑)?魔兽世界对显卡的要求并不是很高,甚至有些场景CPU的重要性还高于显卡。不过考虑到大多数玩家不光玩这一款游戏,所以给大家推荐了一套5000元级别的高性价比主机,这套主机能够在1080P...

  • cpu的组成是什么

    cpu的组成是什么

    cpu的组成:1、寄存器,用来暂存指令数据等处理对象;2、控制器,把内存上的指令、数据等读入寄存器;3、运算器,负责运算从内存读入寄存器的数据;4、时钟,负责发出cpu开始计时的时钟信号。本文操作环境:Windows7系统,DellG3电...

  • cpu100%是怎么回事

    cpu100%是怎么回事

    cpu100%是怎么回事?1、如果CPU长时间使用率100%,即长期满载使用,会导致CPU寿命加快衰弱。2、建议隔一段时间让CPU空载,或者关机,让其维护下。3、需要一个更好的散热器是必须的,还有优质的电源。4、CPU降温软件,由于软件在运...

  • 什么是cpu

    什么是cpu

    cpu是一种集成电路,也是计算机中的核心,通常情况下,cpu一般是指中央处理器;而cpu的主要功能就是利用计算机去处理一些计算机中的数据。本文操作环境:Windows7系统、DellG3电脑。相信很多人都会cpu一词感到陌生,那么什么是c...

  • 四大主流cpu架构是什么

    四大主流cpu架构是什么

    四大主流cpu架构:1、x86架构,采用cisc指令集(复杂指令集计算机),程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。2、arm架构,是一个32位的精简指令集(risc)架构。3、risc-v架构,是基于精...

  • 周排行
  • 月排行
  • 年排行

精彩推荐