【Transformer 与注意力机制】02 向量与点积的几何直觉 2026-04-15 | transformer | #向量 #点积 #内积 #余弦相似度 #注意力 #Transformer 从二维平面上的箭头开始,把『向量、内积、夹角、相似度』这几个概念用几何方式串起来,最后落到注意力公式里那个 QK^T 的来历。