我们之前已经提过几次,大家或许也已知晓,Mali GPU 的出货量位居全球第一。2016 年,在合作伙伴的推动下,Mali GPU的出货量超过10亿。
十亿--在我看来,这个数字大得无法想象,因为我们在日常生活中通常看到的都是以百位或千位计数的事物。我知道十亿就是 10 的 9 次方,或一百万的一千倍——但这个数字太大,真的很难将其与我们周围的世界联系起来。可能我能够想到的最接近的就是人口了。这意味着,我们的GPU出货量相当于美国、英国、印度尼西亚、巴基斯坦和巴西这些国家的人口总和。这样就比较有概念了,不过,我也开始想是否还有其他别的方法可以用来量化Mali GPU的成功。
自从在 Arm 媒体处理业务部任职以来,我学习到了许多关于 GPU 的知识。在过去的几代产品中,我们实现了巨大突破,其中高性能GPU就是我们的一大业务优势,Mali-G71 和 Mali-G72 ,这两款GPU为三星、华为等大型公司的一些旗帜性设备提供图形处理支持。这些 GPU 的计算能力增长迅猛,我的新手机(三星 Galaxy S8)在图形处理方面的性能就优于我的笔记本电脑。
我们都知道最新的移动 GPU 计算能力非常强大,但是怎样才能弄清楚它究竟强大到什么程度呢?我们可以使用 GFXBench 的评分来衡量,这些评分几乎可以随意用于所有的单个移动设备,但是将成千上万台搭载 Mali设备的评分叠加起来是非常困难的。所以,通过咨询那些在数字方面天赋异禀的同事,我们找到了一个更简单且更巧妙的解决方案。他们建议我们只着眼于每台设备各自 GPU 的理论计算能力,并根据出售的总数将这些计算能力加起来,则得出我们已交付的总计算能力。
当讨论可用计算能力时,通常使用的衡量标准就是每秒可编程浮点运算量,或 FLOPS。当说到GPU时就意味着要进行大量的运算,所以我们使用 GFLOPS每秒作为基准单元,每秒GFLOPS等于每秒十亿次浮点运算(为清晰起见,我们谈论的是全精度浮点运算 (FP32))。
这道数学题做起来有点难度,我坐在那些奋笔疾书的技术宅后面,看他们记录Mali GPU 的时钟频率、配置、出货量等不同的参数,经过长达数小时的工作,并反复确认之后,他们让我看到了一个不可思议的数字……
去年,新型 Mali GPU 向全球提供的额外计算能力共计每秒 46,839,499,948 GFLOPs。这个数字相当于每秒 46.84exa-FLOPs(每秒 46.84 乘以 10 的 18 次方浮点运算)——对任何人来说这都是一个天文数字。
我发现,自己再次陷入困惑,我无法将这个庞大的数字与其他事物联系起来。所以我就想其他那些大数字以及他们使用何种方法进行量化的,我觉得,您应该见识过某位顶级足球运动员的巨额转会费,心想“2 亿的转会费简直太多了吧”(在此隐去该球员的名字)。如果这样,那您也有可能读过那些媒体试图阐明个中原委而发表的文章。要知道,如果不买下这名前锋,您本可以拥有好多辆宾利、好多架里尔喷气式飞机或许多家前途光明的初创公司。所以我觉得,以我这种不懂技术的新手角度来讲,肯定有什么东西能够解释这一计算能力。
自从加入了技术行业,我就开始变得痴迷超级计算机。我们构建整个架构(如果不是整个综合设施和开发区)专用于托管一台计算机,着实令人震惊。但是另一方面,这些超级计算机使我们能够完成各种巧妙的模拟和计算,可在天气预报、基因组研究和核试验模拟等领域运作,可以说是对生活的方方面面产生了重大影响。当然,超级计算机的世界必须超越移动 GPU 计算能力之外,并且以一种联盟的方式存在……
TOP500 list 网站详细介绍了全球 500 台最强大的超级计算机。目前,位列第一的是中国国家超级计算无锡中心的“神威太湖之光”(Sunway TaihuLight),其具有 125 PFLOPS的计算能力。听起来就很振奋人心。不过,这一计算能力仍比所有 Mali GPU 一起提供的计算能力少了几个数量级!
其实我们需要把全球所有 TOP500 超级计算机的总计算能力整合在一起,计算出总数,那得出的记过才是一个正确的数量级(1.132 EFLOPS每秒的计算能力)。
希望本文有助于您更深入地了解Mali,在过去 12 个月里,已发货的 Mali GPU 实现的计算能力是全球 TOP500 超级计算机组合计算能力的 41.4 倍。
终于有一个数字能让我有点概念了,虽然我还是觉得将所有计算能力都整合在消费设备端(例如智能手机、VR 设备、DTV等)是神奇,但它真的很能说明问题。