国产单片机代理商深圳金沙js5线路科技关注到Arm正在实现他们承诺的每年20~25%的CAGR,推出升级版Arm架构的Cortex-A77。Arm如何推动其新微架构的IPC,以及这将如何转化为即将到来的2019年末/2020年初的SoC和器件的实际性能。国产单片机代理商深圳金沙js5线路科技为您解析。
Deimos转向Cortex-A77
鉴于Arm仍旧保持着每年发布IP的节奏,Cortex-A77的发布并不让人意外。事实上,今天并不是Arm第一次谈论A77:去年8月,Arm在发布2020年前的性能路线图时调侃了CPU核心:
代号为“Deimos”的新款Cortex-A77继承了Cortex-A76的设计,并遵循Arm的发展轨迹,每一代Arm的Austin系列CPU都将带来持续稳定的20-25%的性能提升。
Cortex-A77:顶层概览
Cortex-A77是A76的直接微架构继承者,这意味着新核心在很大程度上保持了前代的特性。Arm指出,构建核心时,供应商可以简单地升级SoC IP,无需付出太多工作。
实际上,这意味着A77在架构上与A76保持一致,仍然是ARMv8.2 CPU核心,旨在与DynamIQ共享单元(DSU)集群内的Cortex-A55小CPU配对。
与前代相比,基本配置特性(如A77的缓存大小)也没有变化:我们仍然看到64KB L1指令和数据缓存,以及256或512KB L2缓存。有趣的是,Arm确实为基础设施Neoverse N1 CPU核心设计了1MB L2缓存选项(它本身来自A76),但选择保留客户端(手机)CPU IP上的较小配置选项。
作为A76的演进,A77的性能提升并不会像预期的那样令人印象深刻,无论是从微架构的角度看,还是从绝对性能的角度看都是如此,因为我们无法期望即将到来新一代SoC有很大的工艺节点改进。
此处,对于大多数客户而言,A77的产品预计仍在7nm工艺节点上,Arm也宣称了与前代类似的3GHz峰值目标频率。当然,由于频率预计不会有太大的变化,这意味着核心+20%的性能提升可以完全归功于IP的微架构变化。
为了实现IPC(每时钟周期指令数)的提升,Arm对微架构进行了重新设计,并引入了一些巧妙的新特性,这通常会增强CPU IP,从而实现更广泛、更高性能的设计。
Cortex-A77巡礼:迈向6-Wide前端
Cortex-A76在微架构方面代表了一种全新的设计,Arm从头开始实现了多年CPU设计的知识和经验。这使得Arm能够设计出一种在微架构方面具有前瞻性思维的新核心。A76旨在作为Austin系列接下来两代设计的基准,即今天的新款Cortex-A77以及明年的“Hercules”设计。
A77推出了新功能,其主要目标是提升微架构的IPC。Arm这一代的目标是继续专注于提供业界最好的PPA,这意味着设计师的目标是提高核心的性能,同时保持A76核心卓越的能源效率和面积特性。
在频率方面,新核心保持在与A76相同的频率范围内,Arm在最佳实现中以3 GHz峰值频率为目标。
作为对微架构变化的概述,Arm几乎触及了核心的每个部分。从前端开始,我们看到了更高的读取带宽,它的分支预测能力翻了一番,新的macro-OP运算缓存结构充当了L0指令缓存,它有更宽的中央核心,解码器宽度了增加50%,新的整数ALU流水线以及改进的加载/存储队列和发布能力。
Cortex-A77今天宣称的变化并不像我们去年在A76上看到的那样大,也不像今天新发布的Arm新ValHall GPU架构和G77 GPU IP那样大。
然而,Arm通过A77成功实现的是继续执行他们的路线图,这在竞争环境中是非常重要的。A76实现了Arm的所有承诺,最终成为一个性能极佳的核心,同时保持了惊人的效率,并在密度上明显领先于竞争对手。在这方面,Arm的主要客户仍然非常注重在他们的产品中拥有最好的PPA,而Arm也在这方面提供服务。
A77的一大惊喜是,它的浮点性能提升了30~35%,比我对核心的预期要高得多,而在移动领域,网页浏览是恰巧是考验浮点运算的杀手级应用,所以我期待着未来拥有A77的SoC会有怎样的表现。
但即使是在整数工作负载中,20~25%的IPC提升也绝对是了不起的改进,我们相信ARM能够保持A76的能效。功耗将略有上升,但我认为业界已经表明,今天的移动设备可以正确处理至少两个更高功率的核心,因此未来的SoC应该继续使用大+中+小CPU配置。
单片机架构在不断优化升级,智能电子产品单片机方案也在不断更新换代,深圳金沙js5线路科技资深的工程团队与您共同应对智能电子产品的新需求,为您提供定制单片机开发方案服务。