c[0] = a[0] * b[0]c[1] = a[0] * b[1] + a[1] * b[1]c[2] = a[0] * b[2] + a[1] * b[2] + a[2] * b[2]c[3] = a[0] * b[3] + a[1] * b[3] + a[2] * b[3] + a[3] * b[3]
vmov.32 d0, #0 // (destination array c)//load arrays a and b into d1 and d2:vld1.16 d1, [r0] vld1.16 d2, [r1]vmla.s16 d0, d1, d2[0] // 1st column// ? TODO... rotate vmla.s16 d0, d1, d2[1] // 2nd columnvmla.s16 d0, d1, d2[2]vmla.s16 d0, d1, d2[3]
{b[0], b[1], b[2], b[3]} -> {0, b[0], b[1], b[2]}