neilwerdmuller – ARM CPU 部门,高级产品经理。
新的 ARM Cortex-R8 是一款四核高性能实时处理器,基于先进的 R 系列 ARMv7-R 架构构建,这款处理器完全继承了 Cortex-R4、Cortex-R5 和 Cortex-R7 处理器的优点。它在同级别处理器中具有最高的实时处理性能。Cortex-R8 不但性能更高,而且引入了新特性,可满足下一代存储设备控制器和移动通信的需求,特别是即将到来的 5G 蜂窝无线标准。尽管这篇博客重点讨论 Cortex-R8 在存储和调制解调器产品中的应用,但 Cortex-R8 还可应用于许多其他需要最快实时性能的市场。
Cortex-R8 不但性能更高,而且引入了新特性,可满足下一代存储设备控制器和移动通信的需求,特别是即将到来的 5G 蜂窝无线标准。尽管这篇博客重点讨论 Cortex-R8 在存储和调制解调器产品中的应用,但 Cortex-R8 还可应用于许多其他需要最快实时性能的市场。
首先给出一些基本的介绍;强调实时性的 Cortex-R 处理器是 ARM 架构系列的三个变体产品之一,另外两个是用于应用程序的 Cortex-A 和用于微控制器的 Cortex-M。这三种架构有许多共同点,就指令集而言,都可在更广泛的 ARM 生态系统中进行模型和支持编程,但各自具有专门特性以用于目标应用领域。Cortex-A 主要在高级操作系统中运行,如 Linux 或 Android。Cortex-A 处理器的丰富产品组合几乎可见于所有手机以及平板电脑、服务器、企业级系统、联网设备、工业控制器等。Cortex-M 旨在让我们的合作伙伴在物联网中构建最低功率和最低成本的微控制器和边缘设备,例如远程传感器和用于蓝牙等标准的嵌入式无线芯片。
Cortex-R 介于两者之间,凭借丰富的处理器和多核配置选项,通过缓存系统和TCM(紧密耦合内存)系统提供高性能,实现对系统事件的快速、可确定的响应。这可以有效地应用于储存设备的控制芯片,对于一个典型的实时系统如硬盘存储器,采用Cortex-R处理器通常可以做到以毫秒或更短时间来衡量事件响应的时间。在存储设备,特别是硬盘驱动器中,当涉及控制机头和电机以及控制主机接口时,Cortex-R 处理器在性能和响应方面一直是首选。各大硬盘制造商都青睐Cortex-R 处理器,并且不断增加消费电子设备和企业级存储器的固态闪存驱动器的出货量。磁存储器和固态设备的存储设备容量和接口数据速率仍在迅速增长,随着存储介质的物理限制受到挑战,每秒输入-输出操作次数会不断提高,用于追踪数据和管理错误的算法也日益复杂。
新的 Cortex-R8 处理器为存储控制器设计师提供额外的性能和新的 AMBA 总线接口,这种总线接口实现了纠错的保护机制等功能。其中一些特性是我们在 ARM 硅合作伙伴关系中与存储系统级芯片架构师的工程设计成果,我们通过这一合作优化了 ARM 处理器 IP 与系统其余部分的技术边界。
现在来谈谈蜂窝调制解调器,我们知道 ARM 的处理器已经大量用于手机 SOC 的调制解调器子系统中,有的是独立的调制解调器芯片,有的是现在常见的高度集成式调制解调器和应用处理器芯片。
Cortex-R 处理器特别适合调制解调器任务,可通过处理接收和发射信号来管理数据流的调度,同时运行协议堆栈软件任务,以便在发生数据、语音或语音电话时建立和管理连接。同样,这些是硬实时任务,要求处理器必须在微秒精度的时间内响应通信通道内的事件。否则,数据会丢失并且必须一遍遍地重新传输。数据传输速率和复杂性在不断提高,从而给调制解调器处理器设置更高的工作负载和响应时间需求。
采用 LTE 标准集的第三代以及最新第四代蜂窝通信已用于世界各地,移动服务用户超过 10 亿。LTE 和 LTE-Advanced 现在提供超过 300 Mbit/秒的数据速率,重要的是,LTE-Advanced 可让运营商通过整合多个载波频率的传输,最大程度地利用频谱分配。对获取政府许可的运营商而言,频谱使用的灵活性至关重要,但这给调制解调器处理器增加了大量工作负载,因为需要针对每个运营商的协议软件堆栈中的一些任务提供多个实例。
现在,第五代和最新第四代 LTE-Advanced Pro 的推出已经排上了日程,因此蜂窝通信的未来变得更加清晰。GB 级和更高水平的数据速率、更多的载波频率、多个天线阵列和用于紧急服务的新特性等,都在提高调制解调器处理器的工作负载和特性集要求,Cortex-R8 正是为此而生。
上图中的条形表示从发现合作伙伴设计和测试其芯片到手机上市的时间。之后就是服务部署。据我们预测,第 2 波 5G 浪潮更有挑战性,因为必须开发使用极高毫米波频率的新空中接口。
下一代 LTE-Advanced Pro 标准将 WiFi 和新的未经许可频段蜂窝技术融入相同调制解调器中的现有 LTE-Advanced。这让调制解调器处理任务进一步大幅增加。
其次,在 5G 时代,运营商变得更多。会有更高的数据速率、多维天线、直接电话至电话服务、针对急救员设计的任务关键型服务、针对汽车和公路的低延迟服务,以及设计用于 2020 年代的 IoT 和其他功能的新窄带通信。
所有这些都需要实时多核处理器能应对协议堆栈层中不断增加的软件工作负载,并通过调制解调器信号处理及各种用于安全、压缩等功能的专用硬件加速器来管理数据调度。
此外,调制解调器设计师正寻求在 ARM 处理器而非专用硬件中通过软件管理多个第一层调度活动,这样可以更灵活地在所有不同通信标准之间切换。
如存储使用案例一样,ARM 仍与调制解调器团队保持密切的合作伙伴关系,在了解其需求的同时,提供合适的处理器,既能简单集成到 SoC 硬件设计中,又能高效执行软件。
调制解调器处理器及相关 DSP 和硬件加速器是手机 SOC、应用和图形处理等功能的关键部分,ARM 引入 Cortex-R8 以支持下一组 LTE-Pro 调制解调器和5G 设计周期。这款高速处理器采用 28 或 16 nm 硅工艺 (1.5 GHz),可通过四核配置达到总共 15,000 Dhrystone MIPS。
就像我们的顶级应用处理器一样,可乱序执行指令。这对调制解调器等实时应用的成功很关键,因为它允许处理器在运行内存和外设事务的同时继续执行任务。
可靠性在存储应用中非常重要,其中错误检测和校正功能必须确保错误不会通过存储介质中的控制处理器传播。
像大多数 ARM 处理器一样,Cortex-R8可根据需求进行配置扩展。芯片设计师可根据应用选择配置以进行优化:配置的选项包括一至四个 CPU 内核、一级内存大小、各种总线接口、错误处理功能等等。另外,一旦芯片开始运行,软件就可根据工作负载调整各个内核的供电情况。例如,调制解调器可能会在视频通话期间运行全部四个内核,但当手机在口袋中闲置时,则会减少到一个内核。
和所有 Cortex-R 处理器一样,Cortex-R8 可以尽快响应中断,然后执行存储在TCM中的代码和数据,通过这种方式可以保证中断响应时间是较短并且可控的。Cortex-R8 支持的 TCM 大小是 R7 的八倍 ,最多支持每个 CPU 内核 2 MB。下面的框图中有前文提到的流水线、TCM 和错误处理机制。
Cortex-R8 为何会如此吸引系统级芯片设计师?首先,有许多软件是基于相关平台设计的,例如调制解调器协议堆栈和可以追溯到2G时代的驱动器,以及 GPRS、HSPA 等还有之后的第一代 LTE。
所有这些软件及相关的电子系统级设计、模拟和验证设备及专业知识,代表合作伙伴对调制解调器设计团队的巨大投资,而我们必须通过 Cortex-R8 的可扩展性和向前兼容性来保护他们的投资。
此外,软件复杂性已经大幅提升,调制解调器硬件的其余部分也变得非常复杂。如您所见,Cortex-R8 的四核 CPU 和内存一致性系统允许在四个内核中进行并行运算,并且调制解调器硬件的各种接口可用于实现最佳性能和最小功耗。
所有 ARM Cortex 实时处理器的另一个特性是其内存系统可以在受保护的同时保证最小的延迟。这和 Linux 或 Android 等高级 OS 的虚拟内存系统不同,对于运行实时操作系统的 Cortex-R 处理器,其关键能力是在十分之一微妙或更短时间内开始响应实时事件。 下图表显示我们如何将实时处理器系列发展到微架构和多核开发组合,以便跟上3G、4G 和即将到来的5G 通信的创新步伐。
当然,这延续了半导体处理技术的路线图,Cortex-R8 产品将采用 16、14 和 10 nm,甚至有可能采用 7 nm。ARM 处理器充分利用这些技术,让所有手机用户获得越来越出色的移动体验。
由于四个内核都能运行软件,因此Cortex-R8就不需要采用过驱动电压或是超高频率低阈值晶体管这样的技术,从而节省大量功耗。
我们相信 Cortex-R8 是迄今为止性能最佳的实时处理器 IP,具有目标应用所需的特性。高达 28,000 CoreMark 的整合多核性能已经远远超出下一组 LTE-Advanced Pro 和第一代 5G 调制解调器设计,硅合作伙伴的软件测试已经证实这种情况。
结合大容量 TCM 内存、指令流乱序执行、丰富的接口、错误管理等,您就拥有适合任何调制解调器、存储控制器或类似高性能、深度嵌入式实时应用的最佳解决方案。
总之,我们的高质量处理器已经广泛应用于深度嵌入式实时应用,如调制解调器和存储控制器。现在,凭借新的Cortex-R8,实时性能和特性更进一步,巩固了我们的领导力,让我们可以为下一个设计周期提供针对4G-Pro 和后续5G 通信标准的高性能存储控制器和蜂窝调制解调器。
您好,请问哪里可以获取到这款处理器的开发版?