为什么在Swin的代码中,位置编码是在QKV映射之后加入到K上的呢?常规操作不是应该在QKV映射之前加到X上嘛?请问这样做的考虑是什么呢?
为什么在Swin的代码中,位置编码是在QKV映射之后加入到K上的呢?常规操作不是应该在QKV映射之前加到X上嘛?请问这样做的考虑是什么呢?