为ARMv7-A编译的程序运行在ARMv8-A处理器上,这时候会有性能损失吗

为ARMv7-A编译的程序可以运行在ARMv8-A处理器上,程序使用了ARMv7支持的neon指令,测试发现在ARMv8-A设备有性能损失,有人知道原因吗?相比直接运行在ARMV7-A处理器上,是有额外开销吗