中文社区论区请问在用arm neon指令优化程序时，在一个for循环下，分别用int32x2_t和int32x4_t类型的指令，后者的速度并没有按照理论上的速度更快，反而比前者慢是怎么回事呢？必须要对生成的汇编指令进行优化吗？谢谢指教。

State Suggested Answer
Locked Locked
Replies 6 replies
Answers 1 answer
Subscribers 5 subscribers
Views 16655 views
Users 0 members are here

Options

Related

How was your experience today?

This discussion has been locked.

You can no longer post new replies to this discussion. If you have a question you can start a new discussion

请问在用arm neon指令优化程序时，在一个for循环下，分别用int32x2_t和int32x4_t类型的指令，后者的速度并没有按照理论上的速度更快，反而比前者慢是怎么回事呢？必须要对生成的汇编指令进行优化吗？谢谢指教。

Alps over 7 years ago

请问在用arm neon指令优化程序时，在一个for循环下，分别用int32x2_t和int32x4_t类型的指令，后者的速度并没有按照理论上的速度更快，反而比前者慢是怎么回事呢？必须要对生成的汇编指令进行优化吗？谢谢指教。

Top replies

Parents

0 Song Bin 宋斌 over 7 years ago

好的，这个要麻烦 Yang Zhang 张洋帮忙看看
Cancel
Up 0 Down

Cancel

Reply

0 Song Bin 宋斌 over 7 years ago

好的，这个要麻烦 Yang Zhang 张洋帮忙看看
Cancel
Up 0 Down

Cancel

Children

No data