## NEON
### Intrinsics 函数
* 坑点一:
* `vst1q_f32(float* dst, float32x4_t src)` :将4个float按序存入地址dst中,`dst : src[0], src[1], src[2], src[3]`
* `vst2q_f32(float* dst, float32x4x2_t src)` :src.val[0]和src.val[1]交叉存入地址中,`dst : val0[0], val1[0], val0[1], val1[1], val0[2], val1[2], val0[3], val1[3]`
* `vst1q_f32_x2(float* dst, float32x4x2_t src)` : 先存入src.val[0],再存入src.val[1],`dst : val0[0], val0[1], val0[2], val0[3], val1[0], val1[1], val1[2], val1[3]`
*