原作者:anandpatel
原文地址: No Such Thing as Free Performance
我曾在青少年时期热衷于玩第一人称射击游戏,长时间坐在电脑面前,利用键盘和鼠标执行大量射击动作,猛烈攻击城市另一端的朋友。其余时间,我会思考应该使用哪种显卡来运行该游戏,才能稍微提高分辨率或实现更好的效果。如果我拥有两张卡,是否就能够将帧率提高一倍,从而比我的朋友更占优势呢?独立显卡中的军备竞赛游戏始终关乎到不计成本地交付终极性能 - 而最终唯一的成本就是消费者掏腰包。
现如今,大量的游戏在移动设备上运行。在移动 GPU 领域,我们很容易在比较 GPU 时被卷入类似的终极性能对战中。但是,有一项成本至关重要:功率,或者更具体些,散热限制。GPU 将始终不断提供性能,但是如果您由于移动平台的散热限制而无法维持该性能,则提供这一性能便毫无意义。不仅如此,您在玩了数小时大型游戏后,还想要用手机拨打电话、与朋友聊天、查看电子邮件,而无须担心电池电量不足。
当 ARM 谈论图形性能时,我们会具体地使用“能效”一词,即在这一受限散热预算内交付最佳性能。此时有必要指出,“受限”散热预算从不会增加(在还需要包含 CPU、内存等其他组件的高端智能手机中,SoC 总功耗大约为 2.5W),因此在应对最新内容的性能要求方面,我们所能采用的唯一方法是,让 Mali GPU 架构随着全新创新型技术和优化技术不断演变。
作为 ARM 的最新高端 GPU,ARM® Mali™-T860 在处理各种内容方面,能效较 Mali-T628 提高了 45%。这意味着,在相同散热预算内,它能够额外交付 45% 的性能。该比较是针对同一进程节点的内核而言。实际上,随着行业在进程节点方面取得的进展,我们看到终端设备的能效实现了大幅提升。
Mali Midgard GPU 系列也在逐代、逐步提高能效。这些改进源自 AFBC (ARM Frame Buffer Compression) 或事务消除等创新型带宽降低技术(Jakub Lamik 在最近发布的一篇名为《是否应该寻求带宽节约因素》(Should Have Gone to Bandwidth Savers) 的博客详细概述了这些技术和其他技术)以及围绕我们每天所运行的内容而设计的微型架构优化技术。
目光转向最近推出的 Mali-T860 GPU。ARM 专注于高端游戏、休闲游戏和用户界面等真实用例来开展硬件改进。诸如四重优先级等优化技术将显著提高休闲游戏和用户界面的效率。考虑到用户将花费大量时间来玩这些类型的游戏,或者要在设备上的多个应用程序之间进行导航,我们认为专注于此类用例并确保能够通过节能的方式来进行处理是极为重要的。最终,用户将在更长的时间内获得更流畅的体验。
另一项在 Mali-T760 中推出并且在 Mali-T860 得到增强的优化技术为前像素终止 (Forward Pixel Kill)。此功能将降低 Mali GPU 在像素被遮挡时必须执行的冗余处理工作量。这对于使用低效绘制顺序的应用程序尤为有效。
总而言之,如果业界在比较 GPU 时未将能效纳入考虑范围内,则性能本身并不是一项有用的指标。我们从头开始设计的 Mali GPU 不仅能够在 GPU 本身,而且还能在整个系统范围内实现极高能效。我们将继续针对每款新一代 Mali GPU 产品在该领域内进行创新。