mov const64, #64add pSrcB, pSrc, #32fftCopyLoopvld1.f32 { d0, d1, d2, d3 }, [ pSrc, :128 ], const64vld1.f32 { d4, d5, d6, d7 }, [ pSrcB, :128 ], const64vld1.f32 { d8, d9, d10, d11 }, [ pSrc, :128 ], const64vld1.f32 { d12, d13, d14, d15 }, [ pSrcB, :128 ], const64subs count, #1bgt fftCopyLoop