各位好,
我在A15上运行裸机程序,我编写一个汇编文件,在调试的时候,单步执行每条指令,通过观察C9_PMCCNTR 寄存器的值,发现汇编执行ADD 指令的时候C9_PMCCNTR 寄存器的值会增加几十个cycle,这个跟手册中执行ADD指令只需要一个cycle的说法不一致。希望各位技术支持给出解答,谢谢。
如果是多媒体或者是信号处理算法的话用NEON应该会比较好。通过自己改写汇编来优化需要对CPU的微架构有所了解,所以难度很大。
你可以参考我在cortex-A 系列汇编问题给的建议。