mali_offline使用问题

我使用的板子是RK3399,GPU型号为maliT860,使用mali_offline对kernel程序进行分析,kernel程序如下:

分析结果如下:

按照我的理解,这个kernel每个线程L/S操作应当为15次,但是他这里显示是14次L/S操作,不知道是什么原因?然后kernel里面有30次加法,15次乘法和3次移位,根据官方说法,一个ALU单元可以计算17次浮点运算,其中包括一次长度为4的向量点乘(7),一次向量乘(4),一次向量加(4),一次标量乘(1),一次标量加(1),那么一个渲染核心有两个ALU单元,所以他这里的6.5次是怎么计算得到的,一般移位操作和除法操作会占用几个时钟周期?