原文地址:The Foundation for Next Generation Heterogeneous Devices
原作者:eoin_mccann
如果观察消费类电子设备领域的变化,您可以看到一条清晰的演变之路。对于大多数人而言,智能手机已成为核心计算设备,并且可穿戴设备的数量也在不断增长。另一方面,平板电脑将继续取代笔记本电脑,并且高端平板电脑和二合一平板电脑的出现也使得价值主张更引人注目。所有外形规格都透漏出一个常见思路,即设备要满足消费者的长时间工作需求、适应周围环境并且能够跨应用程序执行多任务处理。
屏幕像素和视觉内容的增长意味着我们已进入超高清数字生活时代,且正在向 4K 迁移。这也暗示着,系统带宽必须至少提前一步,以避免出现瓶颈,因为用户已习惯于能够即时执行各种命令的无缝计算。实际上,如果系统没有足够的内存带宽,则无论 CPU 或 GPU 的功能多么强大,也会导致缓慢的性能。所以很明显,下一代 SoC 需要从整体角度出发来优化性能。
随着移动市场日趋成熟,SoC 设计人员开始意识到,优化性能的关键工艺路径之一便是系统。系统性能可以让下一代 SoC 区分开来。
ARM 早已意识这一点,并且一直在开发能够最大限度利用硅片的系统 IP。我们的所有 IP(Cortex® 处理器、Mali™ GPU 和 CoreLink™ 系统 IP)均是经过精心设计、验证和优化的,以确保能够实现每瓦特的最佳性能。我们还与合作伙伴密切合作,确保未来的移动设备可以交付继续令消费者赞叹不已的体验。
系统优化的 IP 支持更好的 SoC 差异化
ARM 推出了两款全新的系统 IP 产品,它们可为下一代 SoC 提供基石,从而能够在可能实现全新计算计算的同时,提高系统性能、增强节能并获得更好的系统集成。CoreLink CCI-550 缓存一致互连是适用于 ARMv8-A 系统的最佳 AMBA 互连。CoreLink DMC-500 动态内存控制器是一款低功耗、已经过性能优化的移动内存控制器,受到 LPDDR4/3 的支持。
CoreLink CCI-550 是市场领先的 ARM CoreLink 缓存一致互连系列的最新产品。上一代的互连已用于移动应用程序、智能 TV、汽车信息娱乐和经济高效的网络等多个细分市场中的数百万台设备。
CoreLink CCI-550 在以下三个关键领域实现了增长:
更高的带宽、更少的延迟性:
峰值系统带宽提高了 60%。这意味,CoreLink CCI-550 已针对需要高带宽吞吐量的应用进行构建和优化,以提供流畅、响应及时的应用程序和用户界面,提高应用程序速度,包括视频和照片编辑、增强的多任务处理和多视窗化(相较于 CCI-500)。
QoS 增强最多可将 CCI 内的延迟降低 20%。
高达 2 倍的监听带宽扩展了系统效率
先进的功效
支持简化软件并提高性能的完全一致的 GPU。硬件一致性支持共享虚拟内存,避免复制数据和耗时的软件托管缓存维护。
集成监听筛选器可以节省数百 mW 内存系统功率
可扩展性
包含 1 至 6 个 ACE 端口的丰富可配置性意味着,它可以针对各类应用进行优化,包括高端平板电脑和更小、更经济的设计
内存接口可从 1 个扩展至 6 个,从而支持配备 4K 内部和外部屏幕的高性能平板电脑要求,以及超过 50GB/s 的带宽
CoreLink CCI-550 支持完全一致的 GPU。完全一致的内存系统可以同时利用 CPU 和 GPU 的异构计算能力。它是一个令人激动的全新移动计算领域,应用潜力巨大,可以充分利用 GPU 提供的额外处理能力
CoreLink DMC-500 提供最低延迟,它可在高达 LPDDR4-4266+ 传输速度下支持 LPDDR4/3 内存。CoreLink DMC-500 以及 CoreLink CCI-550 在最低功率下提供最佳端对端性能(从 CPU 到内存),同时确保为重要的系统级功能(如一致性、QoS 和 TrustZone 安全性)提供完全支持。它通过下列方式提供领先的性能:
高度优化且有效的内存访问
端对端服务质量
集成解决方案
提高内存带宽并降低延迟将给下一代设备带来更多功能,如沉浸式移动游戏、4K 内容和屏幕显示以及 120fps 视频播放。 CoreLink DMC-500 将扩大 ARM 系统在高级 LPDDR4/3 内存中的性能和低功耗优势:
单个 DFI 4.0 内存接口 支持高达 DDR-4267 的 X16 LPDDR4、高达 DDR-2133 的 X32 LPDDR3,以及 X32 LPDDR4 的双 DMC 通道支持
QoS 是在多个系统主机上动态确定流量优先级的方法。主机可以划分为三类:
CoreLink CCI-550 和 CoreLink DMC-500 采用系统级 QoS 进行设计,该 QoS 已经过验证,可以运行 CoreLink NIC-450、Cortex A53 和 Cortex A72 处理器以及 Mali GPU。
QoS 针对可以优化 Cortex 处理器和 Mali GPU 系统性能的任务提供系统级灵活性。在基准测试中,QoS 增强已显示可在在芯片上实现高达 25% 的 CPU 延迟降低,从而直接提供更快的性能。
TrustZone 安全媒体路径向超高清内容提供端对端的保护(从 Mali 至内存)。结合包含集成式 TrustZone 控制器的 CoreLink DMC-500,可确保实现最低延迟,能够在移动设备上观看 4K 质量的 Netflix。谁能拒绝这样的功能?
随着移动设备成为用户的主要计算设备,他们期望通过我们的设备上获得更多功能。半导体行业的挑战就是跟上需求的步伐,重视系统性能。
CoreLink 系统 IP 将在移动设备下一代 SoC 的性能和功能增长中发挥重要作用,衷心希望这些进步能够带来移动用户体验的飞跃。