之前一直使用neon内联函数优化代码?但有些代码优化后效率实在不如人意?是不是代码顺序不好不利于cpu流水线工作?有没有相关的文档介绍下每条内联函数的时钟周期,这样是不是可以更好的安排代码顺序呢?
虽然跑在armv8a上,但是一直使用arm32的neon指令,从反汇编上来看,32/64共用的内联函数,在64位芯片上编译器会使用64位的neon汇编替换,请问是这样吗?
我翻了下64的文档,发现64的指令要比32的多了不少,这些指令可以实现32位不能实现的一些功能吗?
谢谢!
intrinsic可以借助编译器自动匹配运行平台。
aarch64的指令比aarch32的要丰富,你可以参考指令文档。
我计划学习一下aarch64的指令,可是面对茫茫多指令不知如何下手 :)
现在手里有2份aarch64的文档
1.armv8a architecture profile errata markup
2.arm neon intrinsics reference
请问我这两份文档可以用来学习吗?我发现armv8a architecture profile errata markup中aarch64部分的汇编是用伪代码写的,好难读....
有没有更常用一些的aarch64指令文档?
对于指令列表,你参考ARM Architecture Reference Manual ARMv8, for ARMv8-A architecture profile文档就可以,里面有所有指令列表