之前一直使用neon内联函数优化代码?但有些代码优化后效率实在不如人意?是不是代码顺序不好不利于cpu流水线工作?有没有相关的文档介绍下每条内联函数的时钟周期,这样是不是可以更好的安排代码顺序呢?
对于指令列表,你参考ARM Architecture Reference Manual ARMv8, for ARMv8-A architecture profile文档就可以,里面有所有指令列表