之前一直使用neon内联函数优化代码?但有些代码优化后效率实在不如人意?是不是代码顺序不好不利于cpu流水线工作?有没有相关的文档介绍下每条内联函数的时钟周期,这样是不是可以更好的安排代码顺序呢?
我计划学习一下aarch64的指令,可是面对茫茫多指令不知如何下手 :)
现在手里有2份aarch64的文档
1.armv8a architecture profile errata markup
2.arm neon intrinsics reference
请问我这两份文档可以用来学习吗?我发现armv8a architecture profile errata markup中aarch64部分的汇编是用伪代码写的,好难读....
有没有更常用一些的aarch64指令文档?
谢谢!
对于指令列表,你参考ARM Architecture Reference Manual ARMv8, for ARMv8-A architecture profile文档就可以,里面有所有指令列表