戒色有什么好处| 糖尿病有什么症状| 手指有痣代表什么意思| 子宫囊肿是什么病| 养胃吃什么食物最好| 肚子咕噜咕噜响是什么原因| 有什么聚会玩的游戏| 孕酮低吃什么补得快| 新疆人为什么长得像外国人| 腺瘤样增生是什么意思| 备胎是什么意思| 公丁香和母丁香有什么区别| 扎心是什么意思| 贫血是什么原因造成的| 儿童贫血有什么症状表现| 吃什么容易排便| 吃什么止泻| 食品科学与工程学什么| 肚子容易胀气是什么原因| 烫伤用什么| 94属什么生肖| 摩羯后面是什么星座| 举足轻重是什么生肖| 喜字五行属什么| 12朵玫瑰代表什么意思| 脚丫痒是什么原因| 存款准备金率下调意味着什么| 睡觉打鼾是什么原因| 姜为什么不能晚上吃| 投影仪什么牌子好| dp是什么| 讲述是什么意思| 白带清洁度lv是什么意思| 真菌阴性是什么意思| 松针泡水喝有什么功效| 白狐寓意着什么| 是谁在敲打我窗是什么歌| 两个人可以玩什么| 火加良念什么| 肾虚是什么原因引起的| 大姨父是什么意思| 生育险是什么| 什么是痛风| 虬角为什么要染成绿色| 翘首以盼什么意思| 一什么冰箱| 嘴臭是什么原因引起的| 长方脸适合什么样的发型| 葡萄的茎属于什么茎| 泻立停又叫什么名字| 我是什么结构| 武五行属什么| emoji什么意思| 秀米是什么| 阴茎勃起不硬吃什么| 原位癌是什么意思| 小孩小腿疼是什么原因引起的| 宫颈cin1级是什么意思| 6月18是什么日子| 手发抖吃什么药| 鲱鱼是什么鱼| 脖子淋巴结挂什么科| 鲁冰花是什么意思| 嗓子不舒服挂什么科| 升字是什么生肖| 百什么百什么的成语| 爱像什么| 健康证需要检查什么项目| 什么是肉刺图片大全| 羊水少了对宝宝有什么影响| 金丝檀木是什么木| 人工授精是什么意思| 风热感冒吃什么药最好| 户名是什么| 六级什么时候考| pda是什么| 眼睛有什么颜色| 什么叫环比| ca199偏高是什么原因| 口腔上火了吃什么降火最快| 养猫需要准备什么东西| 江苏属于什么方向| 磋商是什么意思| pct是什么| 匀字五行属什么| 什么风大雨| 小仙女是什么意思| 了加一笔是什么字| v是什么化学元素| 尿检粘液丝高什么意思| 肚脐下方硬硬的是什么| 梦见一群羊是什么意思| 做b超能查出什么| 三生石是什么意思| 男性内分泌失调吃什么药| 99年的兔是什么命| 什么时候母亲节| 胃肠紊乱吃什么药| 木薯淀粉可以做什么| study是什么意思| 副处长是什么级别| 痔疮为什么会出血| 菠萝蜜过敏什么症状| 3月16号是什么星座| 结扎什么意思| 金牛属于什么象星座| 什么玉最值钱| cap医学上是什么意思| 尿频尿急尿不尽吃什么药| 象牙白适合什么肤色| 11月1号是什么星座| 财不外露什么意思| 例假提前是什么原因| 自闭什么意思| 蛋黄吃多了有什么坏处| 梦到谈恋爱预示着什么| 鸽子不能和什么一起吃| 先兆流产是什么意思| 9.30号是什么星座| 凋零是什么意思| 咳嗽吃什么水果好| 理工科是什么意思| 梦见大鲤鱼是什么征兆| 正值当年什么意思| 蛇缠腰是什么症状| 导诊是干什么的| 别字是什么意思| 属鼠的和什么属相最配| 大千世界什么意思| 黑色素是什么| 指甲紫色是什么病的征兆| 掉头发吃什么药最有效| 2月23号是什么星座| 骰子是什么意思| 知性是什么意思| 脸色发黑是什么病的前兆| 充电玩手机有什么危害| 榴莲对孕妇有什么好处| 女性尿道炎吃什么药| s2是什么意思| 一个人自言自语的说话是什么病| 火克什么| 天贝是什么东西| 文号是什么| 生发吃什么食物好| 19岁属什么的生肖| 血窦是什么意思| 梦见自己会开车了是什么意思| 下缘达宫颈内口是什么意思| 八月十五是什么星座| 为什么会得高血压| 什么蜘蛛有毒| 李白号称什么| 单脐动脉对胎儿有什么影响| 浮肿是什么原因造成的| 鼻梁长痘是什么原因| 荷花是什么时候开的| 自我感动是什么意思| 荷尔蒙爆棚是什么意思| 慢性结膜炎用什么眼药水| 手麻挂什么科最好| 孩子爱流鼻血是什么原因| 蓝猫为什么叫蓝猫| 51号元素是什么意思| 什么是出马| 什么的长江| 甲状腺是挂什么科| 舍本逐末是什么意思| 刷脂是什么意思| 吃茶油对身体有什么好处| 窦性心律不齐是什么| 蛋白粉什么时间喝最好| 什么病可以办低保| 尿检蛋白质弱阳性是什么意思| 属狗和什么属相最配| 羊的守护神是什么菩萨| 夜尿增多是什么原因| 蚩是什么意思| 什么是败血症| 晒伤用什么药| 死鬼什么意思| 花笺是什么意思| 什么菜好吃| 心力衰竭吃什么药最好| 思伤脾是什么意思| 家家酒是什么意思| 结肠憩室是什么意思| 肺部有问题一般会出现什么症状| bebe是什么牌子| 寄生虫感染吃什么药| 囊性结节是什么意思| 大明湖畔的夏雨荷是什么意思| 奄奄一息的息是什么意思| 包菜是什么菜| 明矾和白矾有什么区别| 吃肝补什么| 老年骨质疏松疼痛有什么好疗法| gg什么意思| 质控是什么意思| 什么的成长| 耳堵是什么| 低血糖是什么原因引起的| 果糖胺是什么意思| 转注是什么意思| 黄芪补什么| hpv阳性是什么意思| 蚕屎有什么作用和功效| 化疗期间吃什么水果好| 渗液是什么意思| 放疗跟化疗有什么区别| 已读不回是什么意思| 麻烦的意思是什么| 练深蹲有什么好处| 咳嗽吃什么药好| 姜黄与生姜有什么区别| 蚕屎做枕头有什么好处| 杨桃什么季节成熟| 尿道刺痛吃什么药| 什么是体制内| 儿童发育过早应该挂什么科| 什么病不能吃豆制品| 眷顾是什么意思| 长颈鹿代表什么生肖| 人情是什么意思| 姨妈提前是什么原因| camel是什么意思| 眼皮突然肿了是什么原因| 218是什么星座| 木瓜有什么功效| 什么门永远关不上| 助产学是干什么的| 格桑是什么意思| 甲沟炎是什么原因引起的| supreme是什么牌子| 01属什么| 什么方什么计| 悲欢离合是什么意思| 气什么意思| 饱的偏旁叫什么| 口苦是什么病| 处事不惊是什么意思| 乳腺结节低回声是什么意思| 上尉军衔是什么级别| 对应是什么意思| 津液不足吃什么中成药| 台风什么时候结束| 补肾壮阳吃什么药效果好| 梦见野猪是什么预兆| 乳腺癌吃什么水果好| 乱点鸳鸯谱什么意思| 坐飞机要什么证件| 长红痣是什么原因| 睡觉流口水吃什么药| 苦瓜泡酒有什么功效和作用| 蛇屎是什么样子| 踏青是什么意思| 尿频尿急挂什么科| 烤鱼用什么鱼| 鸡爪烧什么好吃| few是什么意思| 体质是什么意思| 女性黄体期是什么意思| 症瘕痞块是什么意思| 健康证都查什么传染病| 百度

新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > 当今的处理器架构能否更高效?

溜溜是什么意思

—— 处理器优化这个唾手可得的果实可能已经消失,但新技术正在涌现。
作者: 时间:2025-08-03 来源: 收藏
百度 目前中国养老服务业尚处于初级阶段,考虑到庞大的老年人口,在政策支持下,未来这一领域发展潜力巨大。

多年来,在专注于性能的同时几乎没有对其他任何东西负责。但现在,性能虽然还是很重要的参考指标,但还必须对负责。

如果性能上的微小提升导致不成比例的功率增益,设计人员可能需要放弃此类改进,转而采用更节能的改进。尽管当前的在性能和方面不断改进,但实现额外的增益变得越来越困难。

“每个人都在检查和重构他们的微,以期能通过改进它们来实现更出色的表现,”Cadence Tensilica 音频/语音 DSP 产品营销总监 Prakash Madhvapathy 说。

许多旨在提高计算吞吐量的功能(例如无序执行)增加了电路的复杂性,从而提高了功率和电路面积。由于功耗成本的原因,类似的改进今天可能不会被接受。那么,我们当前的处理器还有哪些机会呢? 

高效的实现还不够

“许多提高效率的努力都涉及对现有架构进行更好的设计,并且仍然需要一些新的技术突破。特别是在实施方面要融入更多节能技术,”Ansys产品营销总监Marc Swinnen说。一种非常基本的方法是利用流程改进,以更少的功率完成更多工作。“摩尔定律并没有消亡,” Swinnen说。“我们仍在获得更小的工艺技术,这一直是降低功耗的首要方法。摩尔定律可能很快走到尽头,但现在还没有完全实现。”

这也可以推动流程决策。“当你选择某个工艺节点时,你还需要考虑到能效,”Madhvapathy 说。“22nm从基础上来看比28nm具有更好的功耗曲线。”他指出,12nm将是节能设计的另一个流行节点。

3D-IC 提供了介于单片芯片和 PCB 级组件之间新的功耗节点。Swinnen指出:“3D-IC的功耗将比单片芯片更高,但3D-IC的整体系统功耗更低,速度比通过传统PCB走线连接的多个芯片系统的要低得多。

共封装光学器件 (CPO) 使光学器件更接近硅,这也可以降低功耗,但这已经等了很长时间。“CPO 已经存在了很长时间,但在经济上很难证明技术复杂度的合理性,而且最终的权衡不一定是有利的,”Swinnen 解释道。“不过这似乎正在发生变化。部分原因是技术变得更好,部分原因是对高速数字通信的需求变得如此强烈,以至于人们愿意为此支付更多费用。

 并非所有技术都实用

有些实现技术听起来很有趣,但也有其自身的挑战。异步设计就是其中之一。“从好的方面来说,每个寄存器都会尽可能快地与下一个寄存器通信,”Swinnen 解释道。“没有中央时钟,所以整个时钟架构都消失了。没有时间给你等待,其中一条数据路径正在等待其他数据路径。它已经存在了几十年,但由于性能不可预测,它未能突破(特定情况除外)。这是一个猜谜游戏,突破的时间点会是什么,由于工艺的可变性,每个芯片都可能略有不同。也不清楚它最终是否真的节省了电力。“自动定时握手意味着触发器电路必须复杂得多,”斯温宁说。“当你把它全部拿出来时,所有触发器电路都会消耗更多的电力。一个问题仍然存在:“它真的最终会为所有这些复杂性和缺乏可预测性节省很多电力吗?综合来看,它还没有能够作为一种设计方法论得到公认。

也可以使用数据和时钟门控来驯服杂散电源或毛刺电源以降低功耗。“它会增加面积,但对杂散电源的影响可能相当大,”Madhvapathy 说。这需要分析以确定功耗的主要贡献者。“它不仅可以测量毛刺功率,还可以识别导致此毛刺的原因,”Swinnen 指出。

最后,每一个问题在实现层面上的影响有限。“RTL能走多远是有限制的,这很讽刺,因为大多数节能机会都在RTL级别,”Swinnen 说。“最大的好处实际上是在架构层面。”

 昂贵的功能

人工智能(AI)计算已将设计团队推向内存墙,因此鉴于行业对AI训练和推理的关注,人们将大量注意力转移到将数万亿个参数放在需要的地方,以避免摧毁系统。但处理器本身也会消耗能量,其他工作负载将在执行能力和数据移动能力之间表现出不同的平衡。

尽管时钟频率继续逐渐攀升,但这种变化实际上并没有像以前那样推动性能提升。改进的真正目标是试图让尽可能多的处理器保持忙碌。三个架构特征可以说明为这种收益所做的复杂变化——推测执行(也称为分支预测)、无序执行和有限的并行性。

 推测执行的目的是避免输入分支指令并且必须等待结果后再决定遵循哪些分支的情况。到那个点时就会延迟结果,直到系统获取分支结果指示的指令——可能一直来自DRAM。相反,推测性地遵循一个分支——希望是最有可能的分支。通常,完成分支决策将验证该决策,但有时不会。此时,必须退出推测计算并重新启动另一个分支(包括从 DRAM 获取的潜在指令)。

 分支预测通常伴随着无序执行,该功能允许某些指令以与它们在程序中的显示方式不同的顺序执行。这个想法是,一条指令可能会停顿等待数据,而另一条后续指令现在已准备就绪。请注意,后一条指令不能依赖于前一条指令,但串行编程范式的主要限制之一是指令必须按顺序列出,即使它们不相互依赖。所以乱序执行是一个复杂的系统,可以提前启动多条指令,确保原始程序语义得到尊重。

图片.png


图 1:Intel 处理器微架构示例。此特定单元包括乱序处理。由于需要向后代码兼容性,因此在执行之前,首先将指令转换为微代码。此模型有 11 个函数单元,其中 8 个用于执行,3 个用于数据加载/存储。

 面积与性能

这些架构并不是简单的系统,它们的价格可能与其收益不成比例,具体取决于它们的构建方式。“例如,分支预测器会保留先前采用的分支列表,”西门子 EDA 高级合成部门项目总监 Russ Klein说。“就像缓存一样,该列表通常使用分支目标的底部N位作为哈希键进入所采用的分支列表。因此N可以是4或16或更多,列表中的条目数可以是1或2或32。您可以存储完整的目标分支地址,或者仅存储底部12位或16位。对所采用的分支的更大、更详细的存储器会带来更好的性能,但显然会占用更多的空间(和功率)。

由此产生的好处可能会相应地有所不同。“一个小型的简单分支预测器可能会将处理器加速 15%,而一个大型、复杂的分支预测器可以将性能提高30%。但它可能比小而简单的处理器面积上大10倍(或更多),“Klein解释道。“就面积而言,对性能设计者也许不是那么在意,但对于功耗来说,面积确实是一件大事。”

Cadence 通过重组某些编解码器来提高它们的性能,从而产生分支很少的代码。“我们看到绩效提高了约5%至15%,”Madhvapathy 说。“编解码器中的分支数量不到5%,在我们使用 ZOL(零开销循环)的内部执行循环中几乎没有分支。”

更通俗的说,该公司在典型项目中找到了更多的分支。“非官方的代码大约有20%的指令是分支,”Madhvapathy。“这些都代表着随机执行的机会。性能提升可以达到30%或更高,因为每个周期执行的平均指令会显着增加——即使这些预测中有一半是成功的。综合开销 [分支预测和无序执行] 可能在20%到30%的范围内。

Klein回忆起 Tilera 的创始人阿南特·阿加瓦尔 (Anant Agarwal)对Kill Rule的观点。“终止规则规定的是,如果你要将一个功能放入你的 CPU 中但它会增加面积,如果增加的面积大于你获得的性能提升,你就不会添加该功能,”他说。

 并行计算是“简单”的答案

并行性显然提供了另一种提高性能的方法,但当前处理器中可用的功能是有限的。当今的主流处理器有两种方式提供并行性——通过实例化多个内核,以及通过内核内的多个功能单元。

功能单元是过去的简单算术逻辑单元(ALU),它是执行实际指令的。给定的功能单元通常能够执行简单数学之外的一定数量的指令。它们还可能包括乘法器、分隔器、地址生成,甚至分支。通过提供多个这样的单元,当一个单元繁忙时,另一个单元可以处理不同的指令,这可能是无序的。

不同的处理器具有不同数量的功能单元,代码分析有助于确定其中指令支持的组合和分布。这有助于在可能的情况下并行化指令执行,但处理器开销(例如指令获取)是串行发生的。

真正并行化计算是提高性能的最佳机会之一,并且可以使用较少的处理器以提高能效。这样的解决方案并不新鲜,多核处理器在十多年前就已上市,但未能获得真正意义上的关注。

 很少有算法是完全可并行化的。那些通常被称为“令人尴尬的并行”。其他所有内容都混合了可并行化的代码和必须串行运行的段。阿姆达尔定律将这些连续部分确定为最终限制器。有些程序可以高度并行化,有些则不然。但即使算法看起来不并行,也可能存在其他机会。

 分形就是一个例子。“你的 f of x 就是 f of x – 1,” Klein解释道。“每个像素都是通过长串行链单独计算的。但是,如果你正在制作图像,你有 1,024 x 1,024 或任何图像大小,所以你有很多并行性的机会 [通过同时计算多个像素]。

当今用于数据中心服务器的处理器具有多达100个左右的内核。但与之前的多核处理器不同的是,它们不用于单个程序。它们允许为需要云计算的不同用户执行多个程序。

并行的问题

即使处理器执行可以并行化,真正的问题是处理器必须并行编程。这通常意味着显式管理代码的并行性质,例如通过调用pThreads。这比典型的编程要繁琐得多,需要了解数据依赖关系以确保满足按顺序的语义。尽管已经存在一些工具来帮助解决这个问题,但没有一个工具进入现在的主流软件开发。

此外,手动管理并行性可能需要针对不同的处理器使用不同的程序。程序可以运行,但如果需要的线程数超过给定处理器在硬件中可以管理的线程数,则程序可能不是最佳的。由于上下文切换过程中不可避免存在系统开销(虚耗),使用软件并行性可能会损害性能。

最大的问题是软件开发人员对显式并行编程嗤之以鼻。人们强烈希望任何新事物都可以使用当前的方法进行编程。“软件专家已经坚决拒绝了100核处理器的概念,除了我们看到它开始蔓延的一个领域——GPU和TPU,” Klein观察到。

这就是多核处理器在商业上失败的原因。即便如此,并行化主要还是与性能有关。降低功耗需要适度的核心数量和积极的待机功耗策略,以便空闲核心不会消耗能量。并行性还有助于恢复在提高内核效率时可能丢失的整体性能。

“我的论点是,大量真正简单的CPU是正确的选择,但它确实需要改变编程方法,” Klein说。“我对这种情况的唯一希望是人工智能能够创建一个并行编译器,这是我们作为一个行业永远无法做到的事情。”

我们今天处理在通用处理器上陷入困境算法时的实用方法是使用加速器作为非阻塞卸载,以便加速器可以在 CPU 执行其他作(或休眠)时有效地处理其任务。

加速器可以是宽的,也可以是窄的

 所有类型的加速器已经存在了几十年。如今,人们非常重视那些可以加快训练和推理速度的加速器,因为需要非常具体的密集计算。但这样的加速器并不新鲜。

“异构计算结合了处理内核,以提供优化的功率和性能,”艾伯德营销副总裁Paul Karazuba 说。“这显然包括NPU,NPU解决了来自效率较低的CPU和GPU进行AI处理时的问题。然而,并非所有NPU都是平等的——不仅在方法上,而且在架构和利用率上。

这是因为加速器可能是高度特定的——甚至是定制的——而其他加速器将仍然是更通用的。“如果AI工作负载是众所周知且稳定的,定制NPU可以在功耗和成本效率方面带来显着提升,”Karazuba 继续说道。“如果您需要灵活地支持多种模型或未来的人工智能趋势,通用 NPU更具适应性,更容易与现有软件生态系统集成。”

自定义加速器将更具体地根据其工作负载进行调整,并且这种努力应该会提高功耗效率。Karazuza 说:“提高处理器子系统效率(特定于NPU)的一种方法是创建一个更注重应用程序的NPU,而不是采用更通用的NPU。“自定义NPU通常使用专门的MAC阵列和执行管道,这些阵列和执行管道可以针对特定数据类型和模型结构进行调整。通用NPU包含支持多种数据类型的可配置计算元素,通常可处理更广泛的层和运算符。

放弃给定任务不需要的功能可以产生显着的结果。“在实际应用中,当部署定制NPU时,Expedera通常会看到处理器效率提高约3-4倍(以 TOPS/W 为单位)而利用率提高两倍以上,这里的利用率定义为实际吞吐量/理论最大吞吐量。”

显然在提高处理器和处理子系统的效率方面,仍然存在一些机会。但在不久的将来,我们可能会面临想法耗尽的风险。然后会发生什么?这就是新的处理器架构可能有用的地方。然而,考虑到当前架构背后的庞大生态系统,这样的变化并非易事。幸运的是,有一些新的架构想法以及放弃一些通用性的可能性。


评论


相关推荐

技术专区

关闭
10.19什么星座 唐朝什么时候灭亡的 无缝衔接什么意思 属兔的守护神是什么菩萨 革兰氏阳性菌是什么病
白内障的主要症状是什么 肝不好挂什么科室 蛇用什么呼吸 宫颈管短有什么症状 腰酸是什么原因引起的
视黄醇是什么 浮肿吃什么药 华人是什么意思 川流不息什么意思 做梦抓到很多鱼是什么征兆
做梦梦见猪是什么意思 下眼袋浮肿是什么原因 首鼠两端什么意思 漫谈是什么意思 起床头疼是什么原因
爆粗口是什么意思hcv8jop4ns1r.cn 精分是什么意思hcv8jop7ns8r.cn 草字头加弓念什么hcv7jop6ns9r.cn 奇脉见于什么病hcv8jop1ns3r.cn 赖床什么意思hcv8jop5ns2r.cn
什么是劣药hcv7jop9ns2r.cn 九三年属什么生肖hcv8jop9ns2r.cn wlp是什么意思hcv8jop3ns5r.cn 城隍是什么意思hcv8jop8ns9r.cn 双子座的幸运花是什么hcv8jop3ns3r.cn
三月十号是什么星座hcv9jop3ns6r.cn 吃什么消除肺部结节clwhiglsz.com 吃猪心有什么好处和坏处hcv7jop7ns1r.cn 10.22是什么星座hcv7jop7ns4r.cn 十万个为什么儿童版cl108k.com
扁桃体化脓吃什么药hcv9jop7ns3r.cn twins是什么意思hcv9jop3ns1r.cn 平均红细胞体积偏高是什么意思hcv9jop6ns3r.cn 罗飞鱼是什么鱼hcv9jop4ns1r.cn 头疼耳鸣是什么原因引起的hcv8jop9ns6r.cn
百度