原帖地址: The Top 5 Things to Know about Cortex-A53
发贴人 Brian Jeff 于2013-10-29 5:45:52在ARM Processors
2012年10月Cortex-A53推出了市场,它带来了ARMv8指令集,在高能效比、节省面积基础上还有显著的性能提升。目前Cortex-A53已可以授权,ARM多个合作伙伴会在2014年推出相关芯片。开发者、OEM厂商和SoC设计者需要了解的Cortex-A53的几个重要特点如下:
1、ARM低功耗/高效率的传承
ARM9是ARM历史上授权最多的处理器,有超过250个授权。它树立了一个非常重要的功率/成本平衡的最有效点。
基于ARM926的功能手机(Nokia E60)
Cortex-A5(2009年发布)的设计也符合同样的CPU功耗和面积考虑,同时还有更高的性能和能耗比,并且具有ARMv7架构特性-与高端处理器(如Cortex-A9)软件兼容。
Cortex-A53基于顺序执行的简单8级流水线,与之前的Cortex-A5和Cortex-A7处理器类似。与更复杂流水线的微架构相比,一条指令穿越一个简单的流水线需要更少的寄存器,取指、译码、发射、执行和写回结果需要翻转的逻辑更少。因此,简单的流水线消耗更小的面积和更少的功耗。高能效的Cortex-A处理器产品线包括Cortex-A5、Cortex-A7和Cortex-A53,采用效率优先的设计方法,以寻求在最大效率下足够的性能。该系列处理器每一代的性能提升来自于优化存储器系统、增加双发射能力、扩展内部总线和改进分支预测。
2、ARMv8-A架构
Cortex-A53的ARMv8-A架构,是最新的ARM架构,支持64位操作并且与ARMv7架构100%兼容。它能在AArch32和 AArch64操作模式切换,允许32位应用和64位应用在64位操作系统上一起执行。双执行状态给开发者和SoC设计者针对不同市场64位的部署提供了最大的灵活性。ARMv8-A还有更多的可提升性能的特性,如更多寄存器和新指令,Cortex-A53也充分利用了这些优势。
3、与Cortex-A9相比,性能更高、面积更小、更效率
Cortex-A9的特点是乱序执行流水线、双发射,比Cortex-A53更长的流水线可带来15%的频率提高。但是,Cortex-A53进一步优化了简单的设计从而实现了更高的单线程性能,其中一些关键因素是,Cortex-A53集成了低延时的L2 cache,更大的512 entry主TLB,更复杂的分支预测器。Cortex-A9是2012年高端智能手机市场的标杆,通过用更小面积和功耗成本匹配、超越这个级别的性能,Cortex-A53为入门级设备带来了高端旗舰移动设备级别的性能,但是功耗更小、成本更低。下图是高效率Cortex-A处理器与Cortex-A9的单线程性能对比。同频率下执行典型的工作负载时,Cortex-A53的指令吞吐量比Cortex-A9多20%。
4、与Cortex-A57一起支持big.LITTLE
Cortex-A53与更高性能的Cortex-A57架构相同,可以组合为一个big.LITTLE处理器子系统。big.LITTLE把当前任务分发给合适尺寸的处理器,以达到极高的性能和极低的功耗。
详细信息可参考- Ten Things to Know About big.LITTLE
上图是Cortex-A53与Cortex-A57、Mali-T628组成的示例系统。CCI-400缓存一致性互联使2个CPU簇无缝组合,软件可透明地管理任务分配。big.LITTLE系统在低功耗下可保证高性能。
Cortex-A53可单独使用,在低功耗和小面积下带来优异的性能,为成本智能手机带来新的功能。新的LITTLE处理器也有不凡的性能。
关于Cortex-A53的有意思的博客可参考–ARM Cortex-A53 — Who You callin' LITTLE?
5、广泛的功能集支持很多应用
Cortex-A53包括一个功能集合,可针对量身定制的移动SoC和可扩展的企业系统进行配置和通过物理实现优化。
移动功能
企业功能
AMBA 4 ACE一致性总线。
与CCI-400互联一起big.LITTLE处理(2 CPU 簇) 。
AMBA5 CHI一致性总线。
可扩展到4或更多一致性处理器簇,用于低成本服务器或无线基础设备。
用CCN-504实现16核系统,或用CCN-508实现32核系统 – 单芯片。
小面积、低功耗设计。
优化后低于150mW。
Optimized for <150mW envelope
可实现更高性能。
ECC、parity可根据需要配置
需要ECC、parity保护