• A15 上使用pld指令 降低性能

    siman
    siman

    在A15上使用PLD 指令比不用PLD指令优化效果差,为什么会出现这种情况? 按理说,PLD是提升cache hit的概率, 这样的话,CPU处理的性能应该会提升,但是测试的情况是没有提升。

    以下是我编写的memcpy汇编代码:

    loop:

      vldm r1!, {d0-d7}

      vldm r1!, {d16-d23}

      pld [r1, #0x0]

      pld [r1, #0x40]

      vstm r0!, {d0-d7}

      vstm r0!, {d16…

    • over 5 years ago
    • 中文社区
    • 中文社区论区
  • cortex-A A8,A9,A15 的Instruction Cycle Timing 是完全相同的吗

    siman
    siman

    大家好,

    我在A15上编写汇编,发现A8 和A9 Technical Reference Manual 中有一章是将Instruction Cycle Timing,但是在A15的Technical Reference Manual 中没有找到,想问下A8,A9,A15 的ARM指令集的 Instruction Cycle Timing 是一样的吗?

    另外,关于neon的 Instruction Cycle Timing 我也只在A8手册Technical Reference Manual 中看到,A8…

    • Answered
    • over 5 years ago
    • 中文社区
    • 中文社区论区
  • cortex-A15 汇编执行的cycle数与手册中的不一致

    siman
    siman

    各位好,

    我在A15上运行裸机程序,我编写一个汇编文件,在调试的时候,单步执行每条指令,通过观察C9_PMCCNTR 寄存器的值,发现汇编执行ADD 指令的时候C9_PMCCNTR 寄存器的值会增加几十个cycle,这个跟手册中执行ADD指令只需要一个cycle的说法不一致。希望各位技术支持给出解答,谢谢。

    • Answered
    • over 5 years ago
    • 中文社区
    • 中文社区论区
  • View related content from anywhere
  • More
  • Cancel