小 Mali,大作为:十亿芯片到底意味着什么

我们之前已经提过几次,大家或许已知晓,Mali GPU 的出货量位居全球第一。2016 年,在合作伙伴的推动下,Mali GPU的出货量超过10亿。

十亿--在我看来,这个数字大得无法想象,因为我们在日常生活中通常看到的都是以百位或千位计数的事物。我知道十亿就是 10 的 9 次方,或一百万的一千倍——但这个数字太大,真的很难将其与我们周围的世界联系起来。可能我能够想到的最接近的就是人口了。这意味着,我们的GPU出货量相当于美国、英国、印度尼西亚、巴基斯坦和巴西这些国家的人口总和。这样就比较有概念了,不过,我也开始想是否还有其他别的方法可以用来量化Mali GPU的成功。

自从在 Arm 媒体处理业务部任职以来,我学习到了许多关于 GPU 的知识。在过去的几代产品中,我们实现了巨大突破其中高性能GPU就是我们的一大业务优势,Mali-G71 和 Mali-G72 ,这两款GPU为三星、华为等大型公司的一些旗帜性设备提供图形处理支持。这些 GPU 的计算能力增长迅猛,我的新手机(三星 Galaxy S8)在图形处理方面的性能就优于我的笔记本电脑。

我们都知道最新的移动 GPU 计算能力非常强大,但是怎样才能弄清楚它究竟强大到什么程度呢?我们可以使用 GFXBench 的评分来衡量,这些评分几乎可以随意用于所有的单个移动设备,但是将成千上万台搭载 Mali设备的评分叠加起来是非常困难的。所以,通过咨询那些在数字方面天赋异禀的同事,我们找到了一个更简单且更巧妙的解决方案。他们建议我们只着眼于每台设备各自 GPU 的理论计算能力,并根据出售的总数将这些计算能力加起来,则得出我们已交付的总计算能力。

当讨论可用计算能力时,通常使用的衡量标准就是每秒可编程浮点运算量,或 FLOPS。当说到GPU时就意味着要进行大量的运算,所以我们使用 GFLOPS每秒作为基准单元每秒GFLOPS等于每秒十亿次浮点运算(为清晰起见,我们谈论的是全精度浮点运算 (FP32))。

这道数学题做起来有点难度,我坐在那些奋笔疾书的技术宅后面,看他们记录Mali GPU 的时钟频率、配置、出货量等不同的参数,经过长达数小时的工作,并反复确认之后,他们让我看到了一个不可思议的数字……

去年,新型 Mali GPU 向全球提供的额外计算能力共计每秒 46,839,499,948 GFLOPs。这个数字相当于每秒 46.84exa-FLOPs(每秒 46.84 乘以 10 的 18 次方浮点运算)——对任何人来说这都是一个天文数字。

我发现,自己再次陷入困惑,我无法将这个庞大的数字与其他事物联系起来。所以我就想其他那些大数字以及他们使用何种方法进行量化的,我觉得,您应该见识过某位顶级足球运动员的巨额转会费,心想“2 亿的转会费简直太多了吧”(在此隐去该球员的名字)。如果这样,那您也有可能读过那些媒体试图阐明个中原委而发表的文章。要知道,如果不买下这名前锋,您本可以拥有好多辆宾利、好多架里尔喷气式飞机或许多家前途光明的初创公司。所以我觉得,以我这种不懂技术的新手角度来讲,肯定有什么东西能够解释这一计算能力。

自从加入了技术行业,我就开始变得痴迷超级计算机。我们构建整个架构(如果不是整个综合设施和开发区)专用于托管一台计算机,着实令人震惊。但是另一方面,这些超级计算机使我们能够完成各种巧妙的模拟和计算,可在天气预报、基因组研究和核试验模拟等领域运作,可以说是对生活的方方面面产生了重大影响。当然,超级计算机的世界必须超越移动 GPU 计算能力之外,并且以一种联盟的方式存在……

TOP500 list 网站详细介绍了全球 500 台最强大的超级计算机。目前,位列第一的是中国国家超级计算无锡中心的“神威太湖之光”(Sunway TaihuLight),其具有 125 PFLOPS的计算能力。听起来就很振奋人心不过,这一计算能力仍比所有 Mali GPU 一起提供的计算能力少了几个数量级!

其实我们需要把全球所有 TOP500 超级计算机的总计算能力整合在一起,计算出总数,那得出的记过才是一个正确的数量级(1.132 EFLOPS每秒的计算能力)。

希望本文有助于您更深入地了解Mali,在过去 12 个月里,已发货的 Mali GPU 实现的计算能力是全球 TOP500 超级计算机组合计算能力的 41.4 倍。

终于有一个数字能让我有点概念了,虽然我还是觉得将所有计算能力都整合在消费设备端(例如智能手机、VR 设备、DTV等)是神奇,但它真的很能说明问题。

Anonymous
  • 2017 Arm Tech Symposia 技术论坛即将召开

    Architect the Possible构建未来 11月6日 上海     11月8日 北京     11月10日 深圳 计算领域的发展重新构建了我们的生活,由计算产生的大数据被收集、存储和处理,然后又被分析和探究,这些庞大数据也因此引领了一个人工智能的世界。Arm研发计算架构,为未来科技勾勒蓝图,奠定基础,“Architect the Possible”便是我们今年技术论...
  • DesignStart Arm Cortex-M3软件开发网上课程开始报名

    授课方式: 虚拟课堂 (公开) 地点: WebEx (中国) 09:30 - 13:00 (北京,香港,台北时间)  日期:  2017 年10月24日 课程时长: 3.5 小时  技术侧重点: 软件 费用: 299美元 相关产品: 微控制器, Cortex-M, Cortex-M3 提供方: ARM   特别推广:  使用促销码ARMTraining2017,价...
  • 小 Mali,大作为:十亿芯片到底意味着什么

    我们之前已经提过几次,大家或许也已知晓,Mali GPU 的出货量位居全球第一。2016 年,在合作伙伴的推动下,Mali GPU的出货量超过10亿。 十亿--在我看来,这个数字大得无法想象,因为我们在日常生活中通常看到的都是以百位或千位计数的事物。我知道十亿就是 10 的 9 次方,或一百万的一千倍——但这个数字太大,真的很难将其与我们周围的世界联系起来。可能我能够想到的最接近的就是人口了。这意味着…