• xilinx sdk(2017.4版)不能编译neon的汇编指令,如vmul指令,请问是什么原因?谢谢!
  • 关于neon汇编的几个问题
    1.VMLAL.I16  这条指令I16是的意思是可能是S16或者是U16吗? 如果有个数是S16,有个数是U16,这两个数相乘可以使用I16吗?? 2.  Vopn{cond}.datatype list, [Rn{@align}]{!} Q1:文档中说到 “Align 可省略。 在这种情况下,将应用标准对齐规则”。 这里的标准对齐规则是什么样的? Q2:如果Rn地址没有按照Q1中提到的标准对齐规则...
  • 关于aarch64 NEON的加载指令
    大家好,请问aarch32 NEON的如下指令在aarch64 NEON中应该如何实现? VLDR.64 D1, [R0, #8] 请注意,这里的D1是aarch32的D1,也就是Q0的高64位。 而aarch64的D1是V1(Q1)的低64位,V0的高64位没有名字。 现在我使用的是aarch64,我想将数据加载到V0的高64位,应该怎么做?
  • neon在armv8(arch64)下的使用
    您好: 我在armv8下(arch64)下使用neon中遇到一些疑问,希望得到大家解答 1、在armv8下是编译的时候使用了O3优化,相关计算就会自动使用neon吗 2、同样一段计算函数,计算速度是不是 NEON assembly >NEON intrinsics> NEON C 3、有关 NEON intrinsics的相关指令使用方法介绍,有详细的说明文档吗, 目前参考...
  • Neon性能哪里可以看到?
    wiki上看到ARM Neon性能的描述,“In NEON, the SIMD supports up to 16 operations at the same time”,看了arm官网的Cortex-A系列的手册,我看了A7/A17均未看到具体性能描述。 请问, 1、Cortex-A系列处理器Neon性能如何查看? 2、比如8bit计算的话,相应的性能是如何折算的?