众所周知,智能手机需要处理的内容正变得日益复杂。第一代单一、单色的显示屏时代已一去不复返。当今,即便是主流和入门级移动设备也需要支持丰富的多层用户界面和众多最新的应用程序及技术。这些纷繁复杂的用户需求不断推动主流移动设备向更高性能发展。对于全球数百万计甚至数十亿计的移动终端用户而言,能够支持这些功能和用途至关重要。
因此,Arm日前隆重宣布推出两款全新Mali GPU:Mali-G52和Mali-G31,为主流以及超高效能设备提供解决方案。凭借全新的执行引擎设计,Mali-G52可在更小的芯片区域内实现更高性能,支持主流设备实现机器学习(ML)和增强现实(AR)等高级功能;而Mali-G31则是Arm迄今为止推出的最小的GPU,可支持用于数字电视(DTV)图形开发和复杂用户界面的最新一代API。那么,这两款全新GPU如何助力下一代新科技呢?
机器学习已越来越不可或缺
或许你认为仅仅只有那些最高端的移动设备才会搭载机器学习功能,但令人惊喜的是一切正在以超出你预想的速度发展。即便在主流手机上,我们也希望设备的摄像头能够自动识别脸部,以便准确对焦,或者能够在相册中准确搜索到爱宠的照片。你或许尚未意识到,这些功能都是由机器学习实现的。 Arm认识到机器学习的重要性,并于近期有针对性地发布了Project Trillium机器学习平台。然而,尽管Arm性能强大的新一代机器学习处理器对于高端机器学习工作负载来说表现非常出色,但这只是更广泛应用场景中的一种情况。正如我们近期所讨论的那样,在主流和入门级设备中,为这样一款处理器专门搭载足够强大的芯片往往不切实际,但对于像我之前提到的那些负载量较小的功能,我们的GPU或CPU通常是适宜之选。之前我们已讨论过,对于这类工作负载,我们的GPU是如何地得心应手,并且也谈及我们最新一代的Arm Cortex CPU是如何实现特定的机器学习增益。
我们最新发布的Mali-G52将各项表现又一次全面推高一个等级。在上一代基于Bifrost架构GPU的成功之上,Mali-G52采用了全新设计的执行引擎——处理器中执行算法的部分,从而实现了在较低的芯片预算内满足机器学习所需的更高性能。与上一代处理器相比,Mali-G52每个执行引擎线程的数量增加了一倍,使所有复杂内容的计算性能提高一倍,但尺寸仅增加了22%,因此不会令合作伙伴发愁高昂的芯片预算。不仅如此,Mali-G52还引入了Int8 dot的支持。终端上的机器学习推演算法广泛使用通用矩阵乘法器,但通常不需要达到FP16 / FP32的精度级别。在许多情况下,Int8效果相当,且效率更高。Mali-G52每个执行引擎的处理能力达到四个周期每线程,在当前图像检测和其他机器学习基准测试中达到了上一代处理器机器学习性能近4倍的出色表现。
我们的合作伙伴对这一表现也给予了高度重视与肯定。华为图灵处理器事业部副总经理刁焱秋(Daniel Diao)表示:“随着用户需求的增长,机器学习已成为我们所有设备中最优先考量的要素。这款GPU能够以如此卓越的质量执行具有挑战性的机器学习任务负载,这一性能将彻底颠覆主流终端市场。”
混合现实将大行其道
更具沉浸感的内容体验将不再是最高端设备的专属。当你不想整整一个小时都全副装备戴着VR头盔时(或许你根本不想额外佩戴任何装备,而是通过一些精巧的方式仍然可以享受全面身临其境的体验),并不意味着没有其他实现VR效果的选择。AR增强现实正迅速成为现实技术的首选,而能够在主流设备中支持这一功能以及360度全景视频等功能已变得至关重要。Mali-G52凭借同系列中最高的能效,加之DynamIQ CPU架构的智能任务分配功能,真正将其性能推至巅峰。在这一代主流移动解决方案中,最为推崇的组合是一个Cortex-A75处理器搭配七个Cortex-A55处理器组成的DynamIQ配置,这些较小的内核能够同时处理多项繁冗度较低的任务,从而能够让强大的Cortex-A75能够专注于处理真正需要发挥其整体性能的领域。得益于上述进步,Mali-G52的性能密度与上一代相比高出30%,瞬间处理高度复杂的内容。与DynamIQ的灵活性相似,Mali-G52具有极大的可扩展实施选项,让我们的合作伙伴能够准确实现其设备所需的性能和效率平衡。合作伙伴可以为每个内核选择两个或三个执行引擎,最多可以选择四个内核。这种附加的可扩展性对于成本受限的中低端设备而言优势显著,因为它为每个合作伙伴在权衡优先级时提供了非常高的粒度级别。
人人都爱的3D游戏
过去的情况是,如果你在手机上的支持量低于某个水平时,不会认为除了贪食蛇之类的游戏体验之外还会有更好选择。时至今日,随着显示器的效果更加出色,视觉效果更加出彩,我们在用户体验方面也提高了预期。去年我们谈论了很多有关在高保真手游的推动下,手游行业在收入和吸引力方面超越主机游戏和桌面游戏的内容,这一趋势也延伸到了主流和超高效终端领域,这就是我们第二款全新GPU——Mali-G31。为了满足开发人员需求,Mali-G31是Arm首款基于Bifrost架构的超高效GPU。 Mali-G31是同时能够支持OpenGL ES 3.2和Khronos API Vulkan的最小型处理器。这意味着开发人员可通过全新的内容性能层访问这些API,实现巨大的能量效率和优化。目前,数以百万计主流和入门级设备活跃于市场之上,应用程序开发人员可以对他们的内容进行优化,实现在Mali芯片组驱动的各等级设备上完美运行。这带来的不仅仅是品质的提升,同时也提升了在数量上表现——更多的游戏和应用程序将可在更多的设备上运行,从而惠及更多的用户。这也意味着开发人员可以进入更大的市场,持续对应用程序进行下一阶段的开发。从硅芯片合作伙伴到游戏玩家,整个移动生态链上的所有环节都将因此而受益。
拥抱电视革命
我们已经谈到了这些全新技术现状和未来,但这些技术并不是推动当今低成本系统达到其能力极限的唯一因素。如果你最近才刚刚升级到智能电视,那么在用户界面和互动性方面,和上一代芯片技术相比,全新芯片技术将会在用户体验上引领巨大的飞跃。如今,我们不再仅仅从一个内容提供商那里观看一组频道,或者一下子观看一组频道。由于Amazon Prime和Netflix等流媒体服务已直接集成到系统中,系统必须支持众多不同的界面、图形叠加层和显示合成层。加之现在很多用户使用声控搜索来选择他们想要观看的节目,看似简单的数字电视已发展到了非常智能的境界。Mali-G31凭借缩小20%的尺寸,以及为芯片制造商降低的成本并同时满足用户特定界面的任务负载,将赋能数字电视的未来。当全新的主流解决方案与其他全新Mali多媒体套件产品——Mali-V52和Mali-D51——一起实施时,会为我们的客户带来显著的性能和效率提升以及真正的竞争优势。
随着创新技术的不断发展,Arm与合作伙伴的发展疆域正在不断扩大,主流设备市场正在进入原本高端市场独占的领域,从而将为全新的消费者群体提供下一代视觉体验以及引人入胜的沉浸式内容。