在数学 里,特别是将线性代数 套用到物理 时,爱因斯坦求和约定 (Einstein summation convention )是一种标记的约定,又称为爱因斯坦标记法 (Einstein notation ),在处理关于坐标 的方程式时非常有用。这约定是由阿尔伯特·爱因斯坦 于1916年提出的[ 1] 。后来,爱因斯坦与友人半开玩笑地说[ 2] :“这是数学史 上的一大发现,若不信的话,可以试着返回那不使用这方法的古板日子。”
按照爱因斯坦求和约定,当一个单独项目内有标号变数出现两次,一次是上标,一次是下标时,则必须总和所有这单独项目的可能值。通常而言,标号的标值为1、2、3(代表维度为三的欧几里得空间 ),或0、1、2、3(代表维度为四的时空 或闵可夫斯基时空 )。但是,标值可以有任意值域,甚至(在某些应用案例里)无限集合 。这样,在三维空间里,
y
=
c
i
x
i
{\displaystyle y=c_{i}x^{i}\,\!}
的意思是
y
=
∑
i
=
1
3
c
i
x
i
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
{\displaystyle y=\sum _{i=1}^{3}c_{i}x^{i}=c_{1}x^{1}+c_{2}x^{2}+c_{3}x^{3}\,\!}
。
请特别注意,上标并不是指数 ,而是标记不同坐标。例如,在直角坐标系里,
x
1
{\displaystyle x^{1}\,\!}
、
x
2
{\displaystyle x^{2}\,\!}
、
x
3
{\displaystyle x^{3}\,\!}
分别表示
x
{\displaystyle x\,\!}
坐标、
y
{\displaystyle y\,\!}
坐标、
z
{\displaystyle z\,\!}
坐标,而不是
x
{\displaystyle x\,\!}
、
x
{\displaystyle x\,\!}
的平方、
x
{\displaystyle x\,\!}
的立方。
爱因斯坦标记法的基本点子是余向量 与向量 可以形成标量 :
y
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
+
⋯
+
c
n
x
n
{\displaystyle y=c_{1}x^{1}+c_{2}x^{2}+c_{3}x^{3}+\cdots +c_{n}x^{n}\,\!}
。
通常会将这写为求和公式 形式:
y
=
∑
i
=
1
n
c
i
x
i
{\displaystyle y=\sum _{i=1}^{n}c_{i}x^{i}\,\!}
。
在基底 变换之下,标量保持不变。当基底改变时,一个向量的线性变换 可以用矩阵 来描述,而余向量的线性变换则需用其逆矩阵 来描述。这样的设计为的是要保证,不论基底为何,伴随余向量的线性函数 (即上述总和)保持不变。由于只有总和不变,而总和所涉及的每一个项目都有可能会改变,所以,爱因斯坦提出了这标记法,重复标号表示总和,不需要用到求和符号 :
y
=
c
i
x
i
{\displaystyle y=c_{i}x^{i}\,\,\!}
采用爱因斯坦标记法,余向量都是以下标来标记,而向量都是以上标来标记。标号的位置具有特别意义。请不要将上标与指数 混淆在一起,大多数涉及的方程式都是线性,不超过变数的一次方。在方程式里,单独项目内的标号变数最多只会出现两次,假若多于两次,或出现任何其它例外,则都必须特别加以说明,才不会造成含意混淆不清。
在线性代数 里,采用爱因斯坦标记法,可以很容易的分辨向量和余向量 (又称为1-形式 )。向量的分量是用上标来标明,例如,
a
i
{\displaystyle a^{i}\,\!}
。给予一个
n
{\displaystyle n\,\!}
维向量空间
V
{\displaystyle \mathbb {V} \,\!}
和其任意基底
e
=
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle \mathbf {e} =(\mathbf {e} _{1},\mathbf {e} _{2},\dots ,\mathbf {e} _{n})\,\!}
(可能不是标准正交基 ),那么,向量
a
{\displaystyle \mathbf {a} \,\!}
表示为
a
=
a
i
e
i
=
[
a
1
a
2
⋮
a
n
]
{\displaystyle \mathbf {a} =a^{i}\mathbf {e} _{i}={\begin{bmatrix}a^{1}\\a^{2}\\\vdots \\a^{n}\end{bmatrix}}\,\!}
。
余向量的分量是用下标来标明,例如,
α
i
{\displaystyle \alpha _{i}\,\!}
。给予
V
{\displaystyle \mathbb {V} \,\!}
的对偶空间
V
∗
{\displaystyle \mathbb {V} ^{*}\,\!}
和其任意基底
ω
=
(
ω
1
,
ω
2
,
…
,
ω
n
)
{\displaystyle {\boldsymbol {\omega }}=({\boldsymbol {\omega }}^{1},{\boldsymbol {\omega }}^{2},\dots ,{\boldsymbol {\omega }}^{n})\,\!}
(可能不是标准正交基),那么,余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
表示为
α
=
α
i
ω
i
=
[
α
1
α
2
⋯
α
n
]
{\displaystyle {\boldsymbol {\alpha }}=\alpha _{i}{\boldsymbol {\omega }}^{i}={\begin{bmatrix}\alpha _{1}&\alpha _{2}&\cdots &\alpha _{n}\end{bmatrix}}\,\!}
。
采用向量的共变和反变 术语,上标表示反变向量 (向量)。对于基底的改变,从
e
{\displaystyle \mathbf {e} \,\!}
改变为
e
¯
{\displaystyle {\overline {\mathbf {e} }}\,\!}
,反变向量会变换为
a
¯
i
=
∂
x
¯
i
∂
x
j
a
j
{\displaystyle {\overline {a}}^{i}={\frac {\partial {\overline {x}}^{i}}{\partial x^{j}}}a^{j}\,\!}
;
其中,
a
¯
i
{\displaystyle {\overline {a}}^{i}\,\!}
是改变基底后的向量的分量,
x
¯
i
{\displaystyle {\overline {x}}^{i}\,\!}
是改变基底后的坐标,
x
j
{\displaystyle x^{j}\,\!}
是原先的坐标,
下标表示共变向量 (余向量)。对于基底的改变,从
ω
{\displaystyle {\boldsymbol {\omega }}\,\!}
改变为
ω
¯
{\displaystyle {\overline {\boldsymbol {\omega }}}\,\!}
,共变向量会会变换为
α
¯
i
=
∂
x
i
∂
x
¯
j
α
j
{\displaystyle {\overline {\alpha }}_{i}={\frac {\partial x^{i}}{\partial {\overline {x}}^{j}}}\alpha _{j}\,\!}
。
矩阵
A
{\displaystyle A\,\!}
的第
m
{\displaystyle m\,\!}
横排,第
n
{\displaystyle n\,\!}
竖排的元素,以前标记为
A
m
n
{\displaystyle A_{mn}\,\!}
;现在改标记为
A
n
m
{\displaystyle A_{n}^{m}\,\!}
。各种一般运算都可以用爱因斯坦标记法来表示如下:
给予向量
a
{\displaystyle \mathbf {a} \,\!}
和余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
,其向量和余向量的内积为标量:
a
⋅
α
=
a
i
α
i
{\displaystyle \mathbf {a} \cdot {\boldsymbol {\alpha }}=a_{i}\alpha ^{i}\,\!}
。
给予矩阵
A
{\displaystyle A\,\!}
和向量
a
{\displaystyle \mathbf {a} \,\!}
,它们的乘积是向量
b
{\displaystyle \mathbf {b} \,\!}
:
b
i
=
A
j
i
a
j
{\displaystyle b^{i}=A_{j}^{i}a^{j}\,\!}
。
类似地,矩阵
A
{\displaystyle A\,\!}
的转置矩阵
B
=
A
T
{\displaystyle B=A^{\mathrm {T} }\,\!}
,其与余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
的乘积是余向量
β
{\displaystyle {\boldsymbol {\beta }}\,\!}
:
β
j
=
B
j
i
α
i
=
α
i
B
j
i
{\displaystyle \beta _{j}=B_{j}^{i}\alpha _{i}=\alpha _{i}B_{j}^{i}\,\!}
。
矩阵乘法 表示为
C
k
i
=
A
j
i
B
k
j
{\displaystyle C_{k}^{i}=A_{j}^{i}\,B_{k}^{j}\,\!}
。
这公式等价于较冗长的普通标记法:
C
i
k
=
(
A
B
)
i
k
=
∑
j
=
1
N
A
i
j
B
j
k
{\displaystyle C_{ik}=(A\,B)_{ik}=\sum _{j=1}^{N}A_{ij}B_{jk}\,\!}
。
给予一个方块矩阵
A
j
i
{\displaystyle A_{j}^{i}\,\!}
,总和所有上标与下标相同的元素
A
i
i
{\displaystyle A_{i}^{i}\,\!}
,可以得到这矩阵的迹
t
{\displaystyle t\,\!}
:
t
=
A
i
i
{\displaystyle t=A_{i}^{i}\,\!}
。
M维向量
a
{\displaystyle \mathbf {a} \,\!}
和N维余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
的外积 是一个M×N矩阵
A
{\displaystyle A\,\!}
:
A
=
a
α
{\displaystyle A=\mathbf {a} \,{\boldsymbol {\alpha }}\,\!}
。
采用爱因斯坦标记式,上述方程式可以表示为
A
j
i
=
a
i
α
j
{\displaystyle A_{j}^{i}=a^{i}\,\alpha _{j}\,\!}
由于
i
{\displaystyle i\,\!}
和
j
{\displaystyle j\,\!}
代表两个不同的标号,在这案例,值域分别为M和N,外积不会除去这两个标号,而使这两个标号变成了新矩阵
A
{\displaystyle A\,\!}
的标号。
一般力学 及工程学 会用互相标准正交基 的基底向量
i
^
{\displaystyle {\hat {\mathbf {i} }}\,\!}
、
j
^
{\displaystyle {\hat {\mathbf {j} }}\,\!}
及
k
^
{\displaystyle {\hat {\mathbf {k} }}\,\!}
来描述三维空间的向量。
u
=
u
x
i
^
+
u
y
j
^
+
u
z
k
^
{\displaystyle \mathbf {u} =u_{x}{\hat {\mathbf {i} }}+u_{y}{\hat {\mathbf {j} }}+u_{z}{\hat {\mathbf {k} }}\,\!}
。
把直角坐标系 的基底向量
i
^
{\displaystyle {\hat {\mathbf {i} }}\,\!}
、
j
^
{\displaystyle {\hat {\mathbf {j} }}\,\!}
及
k
^
{\displaystyle {\hat {\mathbf {k} }}\,\!}
写成
e
^
1
{\displaystyle {\hat {\mathbf {e} }}_{1}\,\!}
、
e
^
2
{\displaystyle {\hat {\mathbf {e} }}_{2}\,\!}
及
e
^
3
{\displaystyle {\hat {\mathbf {e} }}_{3}\,\!}
,所以一个向量可以写成:
u
=
u
1
e
^
1
+
u
2
e
^
2
+
u
3
e
^
3
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =u_{1}{\hat {\mathbf {e} }}_{1}+u_{2}{\hat {\mathbf {e} }}_{2}+u_{3}{\hat {\mathbf {e} }}_{3}=\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
根据爱因斯坦求和约定 ,若单项中有标号出现两次且分别位于上标及下标,则此项代表着所有可能值之总和:
u
=
u
i
e
^
i
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =u^{i}{\hat {\mathbf {e} }}_{i}=\sum _{i=1}^{3}u^{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
由于基底是标准正交基,
u
{\displaystyle \mathbf {u} \,\!}
的每一个分量
u
i
=
u
i
{\displaystyle u^{i}=u_{i}\,\!}
,所以,
u
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
两个向量
u
{\displaystyle \mathbf {u} \,\!}
与
v
{\displaystyle \mathbf {v} \,\!}
的内积 是
u
⋅
v
=
(
u
i
e
^
i
)
⋅
(
v
j
e
^
j
)
=
(
∑
i
=
1
3
u
i
e
^
i
)
⋅
(
∑
j
=
1
3
v
j
e
j
)
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
(
e
^
i
⋅
e
^
j
)
{\displaystyle \mathbf {u} \cdot \mathbf {v} =(u^{i}{\hat {\mathbf {e} }}_{i})\cdot (v^{j}{\hat {\mathbf {e} }}_{j})=\left(\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\right)\cdot \left(\sum _{j=1}^{3}v_{j}\mathbf {e} _{j}\right)=\sum _{i=1}^{3}\sum _{j=1}^{3}u_{i}v_{j}({\hat {\mathbf {e} }}_{i}\cdot {\hat {\mathbf {e} }}_{j})\,\!}
。
由于基底是标准正交基,基底向量相互正交归一:
e
^
i
⋅
e
^
j
=
δ
i
j
{\displaystyle {\hat {\mathbf {e} }}_{i}\cdot {\hat {\mathbf {e} }}_{j}=\delta _{ij}\,\!}
;
其中,
δ
i
j
{\displaystyle \ \delta _{ij}\,\!}
就是克罗内克函数 。当
i
=
j
{\displaystyle i=j\,\!}
时,则
δ
i
j
=
1
{\displaystyle \delta _{ij}=1\,\!}
,否则
δ
i
j
=
0
{\displaystyle \delta _{ij}=0\,\!}
。
逻辑上,在方程式内的任意项目,若遇到了克罗内克函数
δ
i
j
{\displaystyle \ \delta _{ij}\,\!}
,就可以把方程式中的标号
i
{\displaystyle i\,\!}
转为
j
{\displaystyle j\,\!}
或者把标号
j
{\displaystyle j\,\!}
转为
i
{\displaystyle i\,\!}
。所以,
u
⋅
v
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
δ
i
j
=
∑
i
=
1
3
u
i
v
i
{\displaystyle \mathbf {u} \cdot \mathbf {v} =\sum _{i=1}^{3}\sum _{j=1}^{3}u_{i}v_{j}\delta _{ij}=\sum _{i=1}^{3}u_{i}v_{i}\,\!}
。
采用同样的标准正交基
e
^
1
{\displaystyle {\hat {\mathbf {e} }}_{1}\,\!}
、
e
^
2
{\displaystyle {\hat {\mathbf {e} }}_{2}\,\!}
及
e
^
3
{\displaystyle {\hat {\mathbf {e} }}_{3}\,\!}
,两个向量
u
{\displaystyle \mathbf {u} \,\!}
与
v
{\displaystyle \mathbf {v} \,\!}
的叉积 ,以方程式表示为
u
×
v
=
(
u
j
e
^
j
)
×
(
v
k
e
^
k
)
=
(
∑
j
=
1
3
u
j
e
^
j
)
×
(
∑
k
=
1
3
v
k
e
^
k
)
{\displaystyle \mathbf {u} \times \mathbf {v} =(u^{j}{\hat {\mathbf {e} }}_{j})\times (v^{k}{\hat {\mathbf {e} }}_{k})=\left(\sum _{j=1}^{3}u_{j}{\hat {\mathbf {e} }}_{j}\right)\times \left(\sum _{k=1}^{3}v_{k}{\hat {\mathbf {e} }}_{k}\right)\,\!}
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
(
e
j
×
e
k
)
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
ϵ
i
j
k
e
i
{\displaystyle =\sum _{j=1}^{3}\sum _{k=1}^{3}u_{j}v_{k}(\mathbf {e} _{j}\times \mathbf {e} _{k})=\sum _{j=1}^{3}\sum _{k=1}^{3}u_{j}v_{k}\epsilon _{ijk}\mathbf {e} _{i}\,\!}
。
注意到
e
^
j
×
e
^
k
=
ϵ
i
j
k
e
^
i
{\displaystyle {\hat {\mathbf {e} }}_{j}\times {\hat {\mathbf {e} }}_{k}=\epsilon _{ijk}{\hat {\mathbf {e} }}_{i}\,\!}
;
其中,张量
ϵ
i
j
k
{\displaystyle \ \epsilon _{ijk}\,\!}
是列维-奇维塔符号 ,定义为
ϵ
i
j
k
=
ϵ
i
j
k
=
d
e
f
{
+
1
−
1
0
{\displaystyle \epsilon _{ijk}=\epsilon ^{ijk}\ {\stackrel {def}{=}}{\begin{cases}+1\\-1\\0\end{cases}}\,\!}
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
1
,
2
,
3
}
{\displaystyle \{1,2,3\}\,\!}
、
{
2
,
3
,
1
}
{\displaystyle \{2,3,1\}\,\!}
或
{
3
,
1
,
2
}
{\displaystyle \{3,1,2\}\,\!}
(偶置换 )
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
3
,
2
,
1
}
{\displaystyle \{3,2,1\}\,\!}
、
{
2
,
1
,
3
}
{\displaystyle \{2,1,3\}\,\!}
或
{
1
,
3
,
2
}
{\displaystyle \{1,3,2\}\,\!}
(奇置换)
,若
i
=
j
{\displaystyle i=j\,\!}
、
j
=
k
{\displaystyle j=k\,\!}
或
i
=
k
{\displaystyle i=k\,\!}
所以,
u
×
v
=
(
u
2
v
3
−
u
3
v
2
)
e
^
1
+
(
u
3
v
1
−
u
1
v
3
)
e
^
2
+
(
u
1
v
2
−
u
2
v
1
)
e
^
3
{\displaystyle \mathbf {u} \times \mathbf {v} =(u^{2}v^{3}-u^{3}v^{2}){\hat {\mathbf {e} }}_{1}+(u^{3}v^{1}-u^{1}v^{3}){\hat {\mathbf {e} }}_{2}+(u^{1}v^{2}-u^{2}v^{1}){\hat {\mathbf {e} }}_{3}\,\!}
。
设定
w
=
u
×
v
{\displaystyle \mathbf {w} =\mathbf {u} \times \mathbf {v} \,\!}
,那么,
w
i
e
^
i
=
ϵ
i
j
k
u
j
v
k
e
^
i
{\displaystyle w^{i}{\hat {\mathbf {e} }}_{i}=\epsilon ^{ijk}u_{j}v_{k}{\hat {\mathbf {e} }}_{i}\,\!}
。
所以,
w
i
=
ϵ
i
j
k
u
j
v
k
{\displaystyle \ w^{i}=\epsilon ^{ijk}u_{j}v_{k}\,\!}
。
在欧几里得空间
V
{\displaystyle \mathbb {V} \,\!}
里,共变向量和反变向量之间的区分很小。这是因为能够使用内积 运算从向量求得余向量;对于所有向量
b
{\displaystyle \mathbf {b} \,\!}
,通过下述方程式,向量
a
{\displaystyle \mathbf {a} \,\!}
唯一地确定了余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
:
α
(
b
)
=
a
⋅
b
{\displaystyle {\boldsymbol {\alpha }}(\mathbf {b} )=\mathbf {a} \cdot \mathbf {b} \,\!}
。
逆过来,通过上述方程式,每一个余向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
唯一地确定了向量
a
{\displaystyle \mathbf {a} \,\!}
。由于这向量与余向量的相互辨认,我们可以提到向量的共变分量和反变分量;也就是说,它们只是同样向量对于基底和其对偶基底的不同表现。
给予
V
{\displaystyle \mathbb {V} \,\!}
的一个基底
f
=
(
X
1
,
X
2
,
…
,
X
n
)
{\displaystyle {\mathfrak {f}}=(X_{1},X_{2},\dots ,X_{n})\,\!}
,则必存在一个唯一的对偶基底
f
♯
=
(
Y
1
,
Y
2
,
…
,
Y
n
)
{\displaystyle {\mathfrak {f}}^{\sharp }=(Y^{1},Y^{2},\dots ,Y^{n})\,\!}
,满足
Y
i
⋅
X
j
=
δ
j
i
{\displaystyle Y^{i}\cdot X_{j}=\delta _{j}^{i}\,\!}
;
其中,张量
δ
j
i
{\displaystyle \delta _{j}^{i}\,\!}
是克罗内克函数 。
以这两种基底,任意向量
a
{\displaystyle \mathbf {a} \,\!}
可以写为两种形式
a
=
∑
i
a
i
[
f
]
X
i
=
f
a
[
f
]
=
∑
i
a
i
[
f
]
Y
i
=
f
♯
a
[
f
♯
]
{\displaystyle {\begin{aligned}\mathbf {a} &=\sum _{i}a^{i}[{\mathfrak {f}}]X_{i}={\mathfrak {f}}\,\mathbf {a} [{\mathfrak {f}}]\\&=\sum _{i}a_{i}[{\mathfrak {f}}]Y^{i}={\mathfrak {f}}^{\sharp }\,\mathbf {a} [{\mathfrak {f}}^{\sharp }]\end{aligned}}\,\!}
;
其中,
a
i
[
f
]
{\displaystyle a^{i}[{\mathfrak {f}}]\,\!}
是向量
a
{\displaystyle \mathbf {a} \,\!}
对于基底
f
{\displaystyle {\mathfrak {f}}\,\!}
的反变分量,
a
i
[
f
]
{\displaystyle a_{i}[{\mathfrak {f}}]\,\!}
是向量
v
{\displaystyle \mathbf {v} \,\!}
对于基底
f
{\displaystyle {\mathfrak {f}}\,\!}
的共变分量,
将向量
a
{\displaystyle \mathbf {a} \,\!}
投影 于坐标轴
e
i
{\displaystyle \mathbf {e} ^{i}\,\!}
,可以求得其反变分量
a
i
{\displaystyle a^{i}\,\!}
;将向量
a
{\displaystyle \mathbf {a} \,\!}
投影于坐标曲面 的法线
e
i
{\displaystyle \mathbf {e} _{i}\,\!}
,可以求得其共变分量
a
i
{\displaystyle a_{i}\,\!}
。
在欧几里得空间
R
3
{\displaystyle \mathbb {R} ^{3}\,\!}
里,使用内积 运算,能够从向量求得余向量。给予一个可能不是标准正交基 的基底,其基底向量为
e
1
{\displaystyle \mathbf {e} _{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} _{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} _{3}\,\!}
,就可以计算其对偶基底的基底向量:
e
1
=
e
2
×
e
3
τ
;
e
2
=
e
3
×
e
1
τ
;
e
3
=
e
1
×
e
2
τ
{\displaystyle \mathbf {e} ^{1}={\frac {\mathbf {e} _{2}\times \mathbf {e} _{3}}{\tau }};\qquad \mathbf {e} ^{2}={\frac {\mathbf {e} _{3}\times \mathbf {e} _{1}}{\tau }};\qquad \mathbf {e} ^{3}={\frac {\mathbf {e} _{1}\times \mathbf {e} _{2}}{\tau }}\,\!}
;
其中,
τ
=
e
1
⋅
(
e
2
×
e
3
)
{\displaystyle \tau =\mathbf {e} _{1}\cdot (\mathbf {e} _{2}\times \mathbf {e} _{3})\,\!}
是基底向量
e
1
{\displaystyle \mathbf {e} _{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} _{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} _{3}\,\!}
共同形成的平行六面体 的体积。
反过来计算,
e
1
=
e
2
×
e
3
τ
′
;
e
2
=
e
3
×
e
1
τ
′
;
e
3
=
e
1
×
e
2
τ
′
{\displaystyle \mathbf {e} _{1}={\frac {\mathbf {e} ^{2}\times \mathbf {e} ^{3}}{\tau '}};\qquad \mathbf {e} _{2}={\frac {\mathbf {e} ^{3}\times \mathbf {e} ^{1}}{\tau '}};\qquad \mathbf {e} _{3}={\frac {\mathbf {e} ^{1}\times \mathbf {e} ^{2}}{\tau '}}\,\!}
;
其中,
τ
′
=
e
1
⋅
(
e
2
×
e
3
)
=
1
/
τ
{\displaystyle \tau '=\mathbf {e} ^{1}\cdot (\mathbf {e} ^{2}\times \mathbf {e} ^{3})=1/\tau \,\!}
是基底向量
e
1
{\displaystyle \mathbf {e} ^{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} ^{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} ^{3}\,\!}
共同形成的平行六面体的体积。
虽然
e
i
{\displaystyle \mathbf {e} _{i}\,\!}
与
e
j
{\displaystyle \mathbf {e} ^{j}\,\!}
并不相互标准正交,它们相互对偶:
e
i
⋅
e
j
=
δ
i
j
{\displaystyle \mathbf {e} _{i}\cdot \mathbf {e} ^{j}=\delta _{i}^{j}\,\!}
。
虽然
e
i
{\displaystyle \mathbf {e} ^{i}\,\!}
与
e
j
{\displaystyle \mathbf {e} _{j}\,\!}
并不相互标准正交,它们相互对偶:
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf {e} ^{i}\cdot \mathbf {e} _{j}=\delta _{j}^{i}\,\!}
。
这样,任意向量
a
{\displaystyle \mathbf {a} \,\!}
的反变分量为
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a^{1}=\mathbf {a} \cdot \mathbf {e} ^{1};\qquad a^{2}=\mathbf {a} \cdot \mathbf {e} ^{2};\qquad a^{3}=\mathbf {a} \cdot \mathbf {e} ^{3}\,\!}
。
类似地,共变分量为
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a_{1}=\mathbf {a} \cdot \mathbf {e} _{1};\qquad a_{2}=\mathbf {a} \cdot \mathbf {e} _{2};\qquad a_{3}=\mathbf {a} \cdot \mathbf {e} _{3}\,\!}
。
这样,
a
{\displaystyle \mathbf {a} \,\!}
可以表示为
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf {a} =a_{i}\mathbf {e} ^{i}=a_{1}\mathbf {e} ^{1}+a_{2}\mathbf {e} ^{2}+a_{3}\mathbf {e} ^{3}\,\!}
,
或者,
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf {a} =a^{i}\mathbf {e} _{i}=a^{1}\mathbf {e} _{1}+a^{2}\mathbf {e} _{2}+a^{3}\mathbf {e} _{3}\,\!}
。
综合上述关系式,
a
=
(
a
⋅
e
i
)
e
i
=
(
a
⋅
e
i
)
e
i
{\displaystyle \mathbf {a} =(\mathbf {a} \cdot \mathbf {e} _{i})\mathbf {e} ^{i}=(\mathbf {a} \cdot \mathbf {e} ^{i})\mathbf {e} _{i}\,\!}
。
向量
a
{\displaystyle \mathbf {a} \,\!}
的共变分量为
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a_{i}=\mathbf {a} \cdot \mathbf {e} _{i}=(a^{j}\mathbf {e} _{j})\cdot \mathbf {e} _{i}=(\mathbf {e} _{j}\cdot \mathbf {e} _{i})a^{j}=g_{ji}a^{j}\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g_{ji}=\mathbf {e} _{j}\cdot \mathbf {e} _{i}\,\!}
是度规张量 。
向量
a
{\displaystyle \mathbf {a} \,\!}
的反变分量为
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a^{i}=\mathbf {a} \cdot \mathbf {e} ^{i}=(a_{j}\mathbf {e} ^{j})\cdot \mathbf {e} ^{i}=(\mathbf {e} ^{j}\cdot \mathbf {e} ^{i})a_{j}=g^{ji}a_{j}\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g^{ji}=\mathbf {e} ^{j}\cdot \mathbf {e} ^{i}\,\!}
是共轭度规张量 。
共变分量的标号是下标,反变分量的标号是上标。假若共变基底向量组成的基底是标准正交基,或反变基底向量组成的基底是标准正交基,则共变基底与反变基底相互等价。那么,就没有必要分辨共变分量和反变分量,所有的标号都可以用下标来标记。
思考维度为
n
{\displaystyle n\,\!}
的向量空间
V
{\displaystyle \mathbb {V} \,\!}
。给予一个可能不是标准正交基的基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf {e} _{1},\mathbf {e} _{2},\dots ,\mathbf {e} _{n})\,\!}
。那么,在
V
{\displaystyle \mathbb {V} \,\!}
内的向量
v
{\displaystyle \mathbf {v} \,\!}
,对于这基底,其分量为
v
1
{\displaystyle v^{1}\,\!}
、
v
2
{\displaystyle v^{2}\,\!}
、...
v
n
{\displaystyle v^{n}\,\!}
。以方程式表示,
v
=
v
i
e
i
.
{\displaystyle \mathbf {v} =v^{i}\mathbf {e} _{i}.\,\!}
。
在这方程式右手边,标号
i
{\displaystyle i\,\!}
在同一项目出现了两次,一次是上标,一次是下标,因此,从
i
{\displaystyle i\,\!}
等于
1
{\displaystyle 1\,\!}
到
n
{\displaystyle n\,\!}
,这项目的每一个可能值都必须总和在一起。
爱因斯坦约定的优点是,它可以应用于从
V
{\displaystyle \mathbb {V} \,\!}
用张量积 和对偶性 建立的向量空间。例如,
V
⊗
V
{\displaystyle \mathbb {V} \otimes \mathbb {V} \,\!}
,
V
{\displaystyle \mathbb {V} \,\!}
与自己的张量积,拥有由形式为
e
i
j
=
e
i
⊗
e
j
{\displaystyle \mathbf {e} _{ij}=\mathbf {e} _{i}\otimes \mathbf {e} _{j}\,\!}
的张量组成的基底。任意在
V
⊗
V
{\displaystyle \mathbb {V} \otimes \mathbb {V} \,\!}
内的张量
T
{\displaystyle \mathbf {T} \,\!}
可以写为
T
=
T
i
j
e
i
j
{\displaystyle \mathbf {T} =T^{ij}\mathbf {e} _{ij}\,\!}
。
向量空间
V
{\displaystyle \mathbb {V} \,\!}
的对偶空间
V
∗
{\displaystyle \mathbb {V} ^{*}\,\!}
拥有基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf {e} ^{1},\mathbf {e} ^{2},\dots ,\mathbf {e} ^{n})\,\!}
,遵守规则
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf {e} ^{i}\cdot \mathbf {e} _{j}=\delta _{j}^{i}\,\!}
;
其中,
δ
j
i
{\displaystyle \delta _{j}^{i}\,\!}
是克罗内克函数 。
为了更明确地解释爱因斯坦求和约定,在这里给出几个简单的例子。
思考四维时空,标号的值是从0到3。两个张量,经过张量缩并 (tensor contraction )运算后,变为一个标量:
c
=
a
μ
b
μ
=
a
0
b
0
+
a
1
b
1
+
a
2
b
2
+
a
3
b
3
{\displaystyle c=a^{\mu }b_{\mu }=a^{0}b_{0}+a^{1}b_{1}+a^{2}b_{2}+a^{3}b_{3}\,\!}
。
c
ν
=
a
μ
ν
b
μ
+
f
ν
=
a
0
ν
b
0
+
a
1
ν
b
1
+
a
2
ν
b
2
+
a
3
ν
b
3
+
f
ν
{\displaystyle c^{\nu }=a^{\mu \nu }b_{\mu }+f^{\nu }=a^{0\nu }b_{0}+a^{1\nu }b_{1}+a^{2\nu }b_{2}+a^{3\nu }b_{3}+f^{\nu }\,\!}
。
由于运算结果与标号
μ
{\displaystyle \mu \,\!}
和
ν
{\displaystyle \nu \,\!}
无关,可以被其它标号随意更换,所以,
μ
{\displaystyle \mu \,\!}
和
ν
{\displaystyle \nu \,\!}
称为傀标号 。
自由标号 是没有被总和的标号。自由标号应该出现于方程式的每一个项目里,而且在每一个项目里只出现一次。在上述方程式里,
ν
{\displaystyle \nu \,\!}
是自由标号,每一个项目都必须有同样的自由标号。注意到在项目
a
μ
ν
b
μ
{\displaystyle a^{\mu \nu }b_{\mu }\,\!}
里,标号
μ
{\displaystyle \mu \,\!}
出现了两次,一次是上标,一次是下标,所以,这项目的所有可能值都必须总和在一起。称
μ
{\displaystyle \mu \,\!}
为求和标号 。
思考在黎曼空间 的弧线元素长度
d
s
{\displaystyle ds\,\!}
:
d
s
2
=
g
i
j
d
x
i
d
x
j
=
g
0
j
d
x
0
d
x
j
+
g
1
j
d
x
1
d
x
j
+
g
2
j
d
x
2
d
x
j
+
g
3
j
d
x
3
d
x
j
{\displaystyle ds^{2}=g_{ij}dx^{i}dx^{j}=g_{0j}dx^{0}dx^{j}+g_{1j}dx^{1}dx^{j}+g_{2j}dx^{2}dx^{j}+g_{3j}dx^{3}dx^{j}\,\!}
。请将这两种标号跟自由变量和约束变量 相比较。
进一步扩展,
d
s
2
=
g
00
d
x
0
d
x
0
+
g
10
d
x
1
d
x
0
+
g
20
d
x
2
d
x
0
+
g
30
d
x
3
d
x
0
{\displaystyle ds^{2}=g_{00}dx^{0}dx^{0}+g_{10}dx^{1}dx^{0}+g_{20}dx^{2}dx^{0}+g_{30}dx^{3}dx^{0}\,\!}
+
g
01
d
x
0
d
x
1
+
g
11
d
x
1
d
x
1
+
g
21
d
x
2
d
x
1
+
g
31
d
x
3
d
x
1
{\displaystyle \qquad +g_{01}dx^{0}dx^{1}+g_{11}dx^{1}dx^{1}+g_{21}dx^{2}dx^{1}+g_{31}dx^{3}dx^{1}\,\!}
+
g
02
d
x
0
d
x
2
+
g
12
d
x
1
d
x
2
+
g
22
d
x
2
d
x
2
+
g
32
d
x
3
d
x
2
{\displaystyle \qquad +g_{02}dx^{0}dx^{2}+g_{12}dx^{1}dx^{2}+g_{22}dx^{2}dx^{2}+g_{32}dx^{3}dx^{2}\,\!}
+
g
03
d
x
0
d
x
3
+
g
13
d
x
1
d
x
3
+
g
23
d
x
2
d
x
3
+
g
33
d
x
3
d
x
3
{\displaystyle \qquad +g_{03}dx^{0}dx^{3}+g_{13}dx^{1}dx^{3}+g_{23}dx^{2}dx^{3}+g_{33}dx^{3}dx^{3}\,\!}
。
注意到
d
s
2
{\displaystyle ds^{2}\,\!}
是
d
s
{\displaystyle ds\,\!}
乘以
d
s
{\displaystyle ds\,\!}
,是
(
d
s
)
2
{\displaystyle (ds)^{2}\,\!}
,而不是
(
s
2
)
{\displaystyle (s^{2})\,\!}
坐标的微小元素。当有疑虑时,可以用括号 来分歧义。
^ Einstein, Albert , The Foundation of the General Theory of Relativity , Annalen der Physik, 1916 [2006-09-03 ] , (原始内容 (PDF ) 存档于2007-07-22)
^ Byron, Frederick; Fuller, Robert, Mathematics of classical and quantum physics, Courier Dover Publications: pp. 5, 1992, ISBN 9780486671642