Mali-D51和Mali-V52:有效实现高品质的视觉体验

尖端技术领域永远不存在一成不变的情况。复杂的视觉内容、不断叠加的UI层次以及4K HDR视频等新兴需求层出不穷,无一不在推动着我们不断突破主流移动设备的技术瓶颈,实现更高远的目标。正因如此,针对数字电视(DTV)和主流移动市场,Arm推出了包含两款图像处理器在内的全新Mali多媒体套件,其中一款为显示处理器,另一款为视频处理器。

 

图形复杂性主要是GPU处理的领域,而在应对上述新兴技术的挑战时,则是视频和显示处理器扮演着重要角色,它们为用户提供真正高品质的视觉体验。

 

对显示的要求越来越高

 

之前,我们在讨论GPU时对数字电视已有所谈及,但从显示的角度来看,如今的几代智能电视已远远超出预期。过去,当我们在观看节目时,弹出的纯文本菜单很可能覆盖整个画面,非常单一。而今天则大不相同。通过大量的预集成应用程序,数字电视能够提供不同类型、不同复杂程度和不同查看选项的内容,更不必说语音或手势识别用户界面。如此一来,对显示处理器的挑战变得非常巨大。加之用户对画中画的需求,甚至还有我们从中国市场上观察到的独特需求,比如用户希望能够在4x4的视频墙中同时看到多达16个视频流。这些需求推动Arm再一次迈上新的台阶。

 

Mali-D51是Arm针对主流市场发布的首款基于Komeda架构设计的Mali显示处理器,而Komeda架构则在去年随上一代高端显示处理器Mali-D71共同发布。与Mali-D71相比,Mali-D51尺寸缩小30%,专为在更小的硅片面积上提供高品质的视觉体验而设计。在主流移动设备中,用户不太可能需要播放大量4K内容(这依旧属于高端效能领域),但用户仍然需要设备拥有播放4K内容的能力。因此在主流市场中,我们所需要做的就是如何做出明智的选择,其中可能包括从4K缩小视频流大小,以满足用户显示对分辨率的要求。Mali-D51利用这一优势,以60fps显示高达2048x4096像素的分辨率并且支持Mali-D71的8层数据处理能力。

 

与上一代主流产品Mali-DP650执行双重显示相比,Mali-D51在相同面积内实现了两倍的场景复杂度。当驱动单个显示时,它利用辅助显示未充分利用的资源向场景添加第二组四个合成层。除此之外,这些合成层还可以进行旋转、阿尔法混合或缩放,从而实现了两倍于Mali-DP650的图层数据处理能力,这意味着我们可以在不需要GPU的情况下支持UI叠加、画中画等所需的所有附加数据。

 

访问内存是显示技术中的一项常规要求。因此,与上一代产品相比,Mali-D51在内存延迟性能方面提升了一倍。搭配CoreLink MMU-600,Mali-D51可在整个系统中实现更大的性能增益。为将像素持续驱动至显示面板,处理器需要定期访问系统总线,而将处理器的内存延迟性能提升一倍意味着它只需在总线上花费一半的时间就可以将图像驱动至面板。此举加速了整个显示线程,并大大提高了系统的鲁棒性,以防止欠载运行,从而提供无缝、实时性能,避免因任何可见故障或人为因素影响用户的视觉体验。

增值视频体验

 

Arm全新推出的视频处理器Mali-V52同样是为满足主流市场不断增长的需求而设计的。上一代Mali-V61旨在实现最大限度的可扩展性,满足从最小型、最低功耗的监控摄像头到最新款顶级智能手机的所有设备要求。相对于上一代支持大范围用例的特性,Mali-V52则更有针对性,专为主流市场的特定效率加成进行了投入。

 

Mali-V52的可扩展性为1-4核(Mali-V61为1-8核),这是特别针对在硅片面积有限的主流设备上播放4K内容流的情况而设计的,因此比同等性能所需的Mali-V61的尺寸缩小了近40%。显然,这样可以为厂商节省巨大的预算。需要强调的是,像Mali-D51一样,这款全新视频处理器通过一系列智能权衡实现了极大优化,为我们的所有合作伙伴提供了广阔的组合和选择。对于入门级设备而言,我们已经将每个内核的解码性能提高了一倍,这意味着在同等的硅片面积内,芯片可以执行4k60解码或4k30编码。使用Mali-V61的一个单核,系统可以解码1080p60;而Mali-V52的一个单核可支持4k30或1080p120解码,对于HEVC、H.264和VP9等主流的视频标准,该单核的解码设计性能为上一代的两倍。

 

Mali-V52的设计旨在确保整体系统的成本和功耗最优化。比如,它能够支持更长的系统总线响应时间而不降低任何性能。搭载Mali-V52,可保证在总线上固定延迟的400个周期内不丢帧,这一性能是Mali-V61的两倍。此外,我们投入了大量的精力来确保该芯片在最高可达5000个周期内的访存延迟具有恢复能力,从而使视频处理器能够在很多个时钟周期内脱机工作,让位给包含显示处理器在内的优先级更高的主设备。

 

Mali-V52还可以在保持与以往相同品质的前提下降低20%的比特率,这对节省存储空间作用显著,并能在相同带宽内实现最高品质。当我们为扩大设备存储空间支付更多费用时,这一性能提升对终端用户使用视频功能会产生重大影响。用户可以选择特定的品质水平,并根据存储和功耗的优先级进行权衡,这正解释了为什么在移动设备中搭载专用的视频处理器格外重要,而不是让已经超负荷运行的CPU完成所有任务。

 

如同许多新兴技术一样,一项在中国市场的推动下实现的用例:仅仅提供简单的画中画已无法满足用户的需求,他们希望能够预览将要观看的节目,而中国用户更是希望能够从多达16个不断更新的流媒体频道中选择想看的节目。这种希望呈现4x4视频墙的要求来自众多我们在中国的机顶盒和数字电视合作伙伴,并且已经明确成为未来的基本要求,而非锦上添花的功能,我们必须开发出系列IP来解决这一问题。

由此,单个处理器将退居二线,而全套Mali多媒体套件将开始登场。

 

协同让世界更美好

 

相比独立产品,组合两个及以上Mali多媒体套件处理器可显著提高工作效率。Arm支持完整的软件堆栈,以便在显示上启用硬件编写器功能,从而允许安卓系统查看系统的硬件功能,并推断它可以将内容发送至显示处理器而非GPU——该堆栈能够发现硬件并通过软件自动与其进行交互,工程师甚至都无需考虑硬件。

 

至于上述讨论的视频墙用例,Mali-V52可以同时对16个高清视频进行解码,同时将它们作为单帧写入显示处理器。凭借卓越的存储接口,Mali-D51能够将该单帧提取出来并直接发送到面板,而不会出现任何额外的瓶颈或卡顿。

 

对于整个系统,Mali多媒体套件处理器带来的实际增益在于大大节省了GPU的负荷。如果要在GPU上执行旋转、缩放以及伽玛校正等任务,系统功耗将增加30%以上,这是约束移动设备的一个重大问题。虽然这并不妨碍用户欣赏4K内容,但Mali多媒体IP套件的优越之处在于全新的视频处理器Mali-V52可以在发送到显示处理器之前直接将4K内容缩小。这意味着用户可以在所有消费电子设备上直接观看那些由Netflix、亚马逊等发行的全新超酷4K节目。不仅仅是4K,Mali-V52支持10bit HDR内容,并且通过与Mali-D51和Assertive Display 5完美配合,在任何类型的面板(无论是HDR还是SDR)上均可实现最佳的内容显示。

 

从数字电视到智能手机,无论用户预算多少,Mali多媒体图形、视频和显示套件都能够更好地协同工作,为用户提供最高品质的视觉体验。

Anonymous
  • CiiF现场速递丨好多人围观!Arm物联网设备到数据平台一系列解决方案太秀了

    本周三,第二十届中国国际工业博览会在上海国家会展中心拉开帷幕,并将持续到23日。恰逢周末假日,大伙组队去看一看? 此次Arm同样“盛装出席”,携最新物联网设备管理平台诸多解决方案参展。在此,小编为还没到现场的小伙伴们稍稍剧透一下,希望都能有空去现场感受满满的干货吧~ 谁才是物联网架构首选?有图有真相 Arm此次展位号E170,位于7.2馆的信息与通信技术应用展,今年重点聚焦“工业互联网”领域,吸引了国内外权威的工业互联网…
  • Arm NN 软件开发套件

    Arm NN 填补了现有 NN 框架和底层 IP 之间的空白。它可以帮助 TensorFlow 和 Caffe 等现有神经网络框架实现高效转换,并在 Arm Cortex CPU 和 Arm Mali GPU 上高效运行,无需修改。 Arm NN 不收取任何费用。 下载 Arm NN SDK (GitHub) 关于 Arm NN SDK Arm NN SDK 是一套开源 Linux 软件和工具,支持在高能效的设备上运行机器学习工作负载…
  • 使用Streamline分析RTOS系统性能

    本文翻译自Analyzing the performance of RTOS-based systems using Streamline ============================================================= Streamline是DS-5中的性能分析工具, Streamline可以用来分析裸机系统,RTOS,Linux,Android和Tizen系统的性能…