1 Constructions of the Tensor
Product
本文只考虑\(\R\)-线性空间.
先来回顾一下线性空间的直和(direct sum). 两个线性空间\(V,W\)的直和记作\(V\oplus W\), 它本质上就是笛卡尔积\(V\times W=\qty{(v,w)\,|\,v\in V,w\in W}\),
并且赋予如下线性结构: \[
\Align{
(v_1,w_1)+(v_2,w_2) &= (v_1+v_2,w_1+w_2), \\
k(v,w) &= (kv,kw), \quad k\in\R.
}
\] 将\((v,w)\)记作\(v\oplus w\),
可以发现"直和"的确有加法的特征, 比如
"分配律", \(k(v\oplus
w)=(kv)\oplus(kw)\);
"结合律"不过这和一般的加法结合律不同, 因为\(\oplus\)和\(+\)是两种不同的运算,
所以这只是形式上的结合律.[1], \((v_1\oplus w_1)+(v_2\oplus
w_2)=(v_1+v_2)\oplus(w_1+w_2)\);
以及维数关系\(\dim(V\oplus
W)=\dim{V}+\dim{W}\).
而张量积则是一种类似于乘法的操作. 两个向量\(v\in V,w\in W\)的张量积(tensor
product)记作\(v\otimes w\).
依据"乘法"的特点, 我们对\(\otimes\)作一些要求:
"分配律", \((v_1+v_2)\otimes w=v_1\otimes
w+v_2\otimes w\), \(v\otimes(w_1+w_2)=v\otimes w_1+v\otimes
w_2\);
"结合律"这也是形式上的结合律.[2], \((kv)\otimes w=k(v\otimes w)=v\otimes(kw)\),
对任意\(k\in\R\).
换句话说, \(\otimes\)是双线性(bilinear)的.
线性空间\(V,W\)的张量积空间记作\(V\otimes W\), 我们希望它也是一个线性空间,
而且\(\dim(V\otimes W)=\dim V\dim
W\).
下面我们先介绍几个张量积的具体实现方法(构造性定义),
再从中提取出张量积的核心特征, 借此来给出张量积的另一种定义方法.
1.1 As a quotient space
两个线性空间的张量积\(V\otimes
W\)可以通过它们的笛卡尔积\(V\times
W\)构造出来. 对线性空间\(V,W\),
记 \[
F(V\times W):=\left\{
\sum\nolimits_{(v,w)\in V\times W} \alpha_{v,w}(v,w)
\,\middle|\,
\alpha_{v,w}\in\R,\textsf{只有有限个非零}\alpha_{v,w}
\right\},
\] 称为\(V\times
W\)生成的自由线性空间(free vector space), 也就是把\(V\times W\)当作一个基底生成的线性空间.
然而\(F(V\times W)\)不是最终结果,
我们希望张量积是双线性的, 所以应当认同 \[
\Align{
(v_1+v_2,w) &\sim (v_1,w)+(v_2,w), \\
(v,w_1+w_2) &\sim (v,w_1)+(v,w_2), \\
(kv,w) &\sim k(v,w), \\
(v,kw) &\sim k(v,w). \\
}\label{quotient}\tag{a}
\] 更正式地说, 设子空间 \[
\Align{S={}
&{\rm span}\qty{(v_1+v_2,w)-(v_1,w)-(v_2,w)\,|\,v_1,v_2\in V,w\in
W}+{} \\
&{\rm span}\qty{(v,w_1+w_2)-(v,w_1)-(v,w_2)\,|\,v\in V,w_1,w_2\in
W}+{} \\
&{\rm span}\qty{(kv,w)-k(v,w)\,|\,v\in V,w\in W,k\in\R}+{} \\
&{\rm span}\qty{(v,kw)-k(v,w)\,|\,v\in V,w\in W,k\in\R},
}
\] 则\(V\otimes W=F(V\times
W)/S\). 把\((v,w)\in F(V\times
W)\)所在等价类 \[
[v,w]\equiv(v,w)+S
\] 记作\(v\otimes w\). 可以证明,
映射\((v,w)\mapsto[v,w]=v\otimes
w\)是双线性的: \[
\Align{
[kv_1+v_2,w]
&=(kv_1+v_2,w)+S \\
&=k(v_1,w)+(v_2,w)+S \\
&=k[v_1,w]+[v_2,w].
}
\] (其中第一, 三个等号由商空间上线性运算的定义设线性空间V的线性子空间U, 则商空间为\(V/U:=\qty{v+U\,|\,v\in V}\),
配以线性运算\((v_1+U)+(v_2+U):=(v_1+v_2)+U,
k(v+U):=(kv)+U\). 向量\(v,w\in
V\)等价当且仅当\(v-w\in U\).[3];
第二个等号根据等价关系.)
1.2 From bases
设\(V\)的基底\(B_V=\qty{e_i}_{i\in I}\), \(W\)的基底\(B_W=\qty{f_j}_{j\in J}\).
对于\(v=\sum v_ie_i\in V\), \(w=\sum w_je_j\in W\),
其张量积可以借助基底定义为 \[
v\otimes w = \sum_{i,j} v_iw_j\,e_i\otimes f_j.
\] 如此定义的\(\otimes\)关于\(v,w\)都是线性的.
张量积空间\(V\otimes W\)是形如\(v\otimes w=\sum \alpha_{i,j}e_i\otimes
f_j\)的元素张成的线性空间: \[
V\otimes W =
\left\{
\sum_{i,j}\alpha_{i,j}e_i\otimes f_j
\,\middle|\,
\alpha_{i,j}\in\R
\right\}.
\] 可以发现, \(V\otimes
W\)的一个基底是\(\qty{e_i\otimes
f_j}_{i\in I,j\in J}\), 所以\(\dim(V\otimes W)=\dim{V}\dim{W}\).
\(V\otimes
W\)的加法和数乘自然地定义为 \[
\Align{
\pqty{\sum\alpha_{i,j}e_i\otimes f_j}+
\pqty{\sum\beta_{i,j}e_i\otimes f_j}
&:= \sum (\alpha_{i,j}+\beta_{i,j}) e_i\otimes f_j, \\
k\pqty{\sum\alpha_{i,j}e_i\otimes f_j}
&:= \sum (k\alpha_{i,j}) e_i\otimes f_j, \quad k\in\R. \\
}
\]
1.3 *Tensors as multilinear maps
因为\(V\)和\(V^{**}\)自然同构, 所以\(V\)中的向量可以看作是线性映射\(v:V^*\to\R\); 同样, \(W\)中的向量也可看作线性映射\(w:W^*\to\R\). 进而, 我们定义\(v,w\)的张量积\(v\otimes w\)为双线性映射\(V^*\times W^*\to\R\), \[
(v\otimes w)(f,g) := v(f)w(g),\quad\forall f\in V^*,g\in W^*,
\] 就是将两个线性映射放在一起的结果. 将所有双线性映射\(v\otimes w\)组成的集合记作\(V\otimes W\). 由上可知, \(\otimes\)是双线性的: (仅列出关于\(v\)的线性性, 关于\(w\)的线性性同理) \[
\Align{
(\alpha v\otimes w)(f,g) &= \alpha v(f)w(g) = \alpha(v\otimes
w)(f,g), \\
((v_1+v_2)\otimes w)(f,g)
&= (v_1+v_2)(f)w(g) \\
&= v_1(f)w(g) + v_2(f)w(g) \\
&= (v_1\otimes w)(f,g) + (v_2\otimes w)(f,g).
}
\]
2 Universal Property of
the Tensor Product
2.1 The universal property
definition
前面我们提到过, 张量积的"乘法"特征就是其双线性性. 下面我们说明,
在所有这些"乘法"中, 张量积是最一般的那个, 它保留了最多的线性结构.
线性空间上的乘法(multiplication)指的是双线性映射\(\mu:V\times W\to Y\)(其中\(V,W,Y\)都是线性空间). 张量积\(\otimes:V\times W\to
Y\)除了双线性性之外并无其他要求, 因此可以看作是"最一般"的乘法,
它保留了\(V,W\)最多的线性结构,
因而所有从\(V\times W\to
Z\)的双线性映射都可以借由\(\otimes\)来表示.
这个性质称为张量积的泛性质(universal
property).
我们自然会有个问题: 张量积的泛性质是否可以用来定义张量积?
答案是肯定的.
如果可以找到一种通过性质定义对象的方法,
就可以免去具体构造的繁琐细节, 使得定义变得简洁而直击本质.
尽管这种定义可能会比较抽象, 难以理解, 但是定义的动机是清晰的.
下面我们给出张量积的定义(通过泛性质). 张量积指的是一个有序对\((\varphi,Y)\), 其中\(\varphi:V\times W\to Y\)是双线性映射, 满足:
对于任意双线性映射\(h:V\times W\to Z\),
都唯一存在线性映射\(\tilde{h}:Y\to Z\),
使得 \[
\tilde{h}\circ\varphi = h,
\] 即有交换图 \[
\xymatrix{
V\times W \ar[r]^-{\varphi} \ar[rd]_{h} &
Y \ar@{.>}[d]^(0.4){\tilde h} \\
& Z.
}
\]
一般将\(\varphi(v,w)\)记作\(v\otimes w\), 将\(Y\)记作\(V\otimes
W\).
任意一个双线性映射\(V\times W\to
Z\)都可以借助张量积变为一个线性映射.
首先应当验证, 前几节的构造性定义确实满足上面的泛性质定义.
这里以商空间构造(1.1)为例.
Pf 商空间构造中, \(\varphi:V\times
W\to F(V\times W)/S\). 任取双线性映射\(h:V\times W\to Z\), 定义一个映射\(\tilde{h}:F(V\times W)/S\to Z\)满足\(\tilde{h}\circ\varphi=h\). 先对\([v,w]\in F(V\times W)/S\)定义 \[
\tilde{h}([v,w])
:= h(v,w),
\] 可以利用\(F(V\times
W)/S\)线性运算把上述定义拓展到整个\(F(V\times W)/S\)上: \[
\tilde{h}\pqty{\bqty{\sum\alpha_{v,w}(v,w)}}
:= \sum\alpha_{v,w}h(v,w).
\] 先证明\(\tilde{h}\)是良定义的, 只需证\([v,w]\sim[v',w']\Rightarrow\tilde{h}([v,w])=\tilde{h}([v',w'])\).
任取\([v,w]\sim[v',w']\),
则\((v,w),(v',w')\)必然满足\((\ref{quotient})\)式中的任意一条等价关系,
根据\(h\)的双线性性, \(h(v,w)=h(v',w')\), 即\(\tilde{h}([v,w])=\tilde{h}([v',w'])\).
其次证明\(\tilde{h}\)是线性的.
任取\([v,w],[v',w']\)以及\(\lambda\in\R\), 则 \[
\tilde{h}(\lambda[v,w])
=\tilde{h}([\lambda v,w])
=h(\lambda v,w)
=\lambda h(v,w)
=\lambda\tilde{h}([v,w]),
\] (第一个等号根据\(\lambda(v,w)\sim(\lambda v,w)\);
第三个等号根据\(h\)的双线性性.) 以及
\[
\Align{
\tilde{h}([v,w]+[v',w'])
&=\tilde{h}([(v,w)+(v',w')]) \\
&=h(v,w)+h(v',w') \\
&=\tilde{h}([v,w])+\tilde{h}([v',w']).
}
\] (第一个等号利用了等价类的性质; 第二个等号利用了\(\tilde{h}\)在整个\(F(V\times W)/S\)上的定义.)
最后说明\(\tilde{h}\)是唯一的.
条件\(\tilde{h}\circ\varphi=h\)使得\(\tilde{h}([v,w])\)的定义是唯一的, 而\(\qty{[v,w]}_{v\in V,w\in
W}\)必定包含了\(F(V\times
W)/S\)的一个基底, 因此将\(\tilde{h}\)延拓到\(F(V\times W)/S\)的方式也是唯一的.
综上所述, 商空间构造满足张量积的泛性质, \((\varphi,F(V\times W)/S)\)构成张量积.
2.2 Existence and uniqueness
泛性质定义的张量积是存在的(构造性定义便是例子), 却不唯一. 但是,
所有张量积在同构意义下唯一(unique up to an
isomorphism).
假设有两个张量积\((\varphi,Y)\)和\((\varphi',Y')\). 对\(\varphi\)应用泛性质定义(将\(\varphi'\)视作\(h\)), 存在线性映射\(\tilde{h}:Y\to Y'\), \(\tilde{h}\circ\varphi=\varphi'\). 同理,
对\(\varphi'\)应用泛性质定义,
存在线性映射\(\tilde{h}':Y'\to
Y\), \(\tilde{h}'\circ\varphi'=\varphi\).
所以有交换图 \[
\xymatrix@C=30pt@R=10pt@L=0.5pt{
& Y \ar@<2pt>@{.>}[dd]^{\tilde{h}} \\
V\times W \ar[ru]^{\varphi} \ar[rd]_{\varphi'} \\
&Y' \ar@<2pt>@{.>}[uu]^{\tilde{h}'}
}
\] 因此, \(\tilde{h}\)和\(\tilde{h}'\)是一对互逆的线性映射,
进而都是线性同构. 这说明作为线性空间, \(Y\cong
Y'\), 而且由\(\tilde{h},\tilde{h}'\)的唯一性知(保持张量积的)同构映射是唯一的.
根据张量积在同构意义下的唯一性, 前文的几个构造都是同构的, 进而\(V\otimes W\)的维数是确定的. 根据1.2有 \[
\dim(V\otimes W)=\dim{V}\dim{W}.
\]
2.3 Examples and counterexamples
先举出几个满足张量积泛性质的例子.
张量积的非零常数倍. 设\(\otimes:V\times W\to Y\)构成张量积, 则\(\varphi:V\times W\to Y\), \((v,w)\mapsto kv\otimes w\)(\(k\neq0\))也构成张量积.
矩阵的Kronecker乘积. 以\(2\times2\)矩阵为例. 矩阵\(\vb{A}=\pmqty{a_{11}&a_{12}\\a_{21}&a_{22}},\vb{B}=\pmqty{b_{11}&b_{12}\\b_{21}&b_{22}}\)的Kronecker乘积定义为
\[
\vb{A\otimes B}
:=\pmqty{a_{11}\vb{B}&a_{12}\vb{B}\\a_{21}\vb{B}&a_{22}\vb{B}}
=\pmqty{
a_{11}b_{11} & a_{11}b_{12} & a_{12}b_{11} & a_{12}b_{12} \\
a_{11}b_{21} & a_{11}b_{22} & a_{12}b_{21} & a_{12}b_{22} \\
a_{21}b_{11} & a_{21}b_{12} & a_{22}b_{11} & a_{22}b_{12} \\
a_{21}b_{21} & a_{21}b_{22} & a_{22}b_{21} & a_{22}b_{22}
}.
\] 可以验证, Kronecker积是双线性映射\(\R^{2\times2}\times\R^{2\times2}\to\R^{4\times4}\),
并且满足张量积的泛性质.
下面我们再举几个不构成张量积例子,
感受一下泛性质定义是怎样排除我们不想要的东西的.
直和. 直和\(\varphi:(v,w)\mapsto
v\oplus w\)不构成张量积, 因为\(\varphi\)不是双线性的.
自由线性空间. 包含映射\(\varphi:V\times W\to F(V\times
W)\)不构成张量积, 因为\(\varphi\)不是双线性的. (然而, 如果将\(F(V\times W)\)中的某些元素认同起来,
就可以把\(\varphi\)变成双线性的,
如1.1节所述).
楔积. 取\(\varphi:V\times V\to
Y\), \((v_1,v_2)\mapsto v_1\wedge
v_2\). 任给双线性\(h:V\times V\to
Z\), 假设存在线性映射\(\tilde{h}:Y\to
Z\), 使得\(\tilde{h}(v\wedge
w)=h(v,w)\), 则根据楔积的反对称性有 \[
h(v,w)
= \tilde{h}(v\wedge w)
= \tilde{h}(-w\wedge v)
=-\tilde{h}(w\wedge v)
=-h(w,v),
\] 这意味着\(h\)也是反对称的,
对于一般的\(h\)显然是不成立的.
矛盾的原因是楔积\(\wedge\)附加了额外的"反对称"性质.
实际上, 楔积的泛性质是"任意一个反对称的双线性映射\(f:V\times V\to
Z\)都可以借助楔积唯一地表示为一个线性映射\(\tilde{f}:Y\to Z\)."
双线性形式. 取双线性函数\(\varphi:V\times
W\to\R\)(也称双线性形式).任给双线性\(h:V\times W\to Z\), 假设存在线性映射\(\tilde{h}:\R\to Z\), 使得\(\tilde{h}(\varphi(v,w))=h(v,w)\).
实际上很快就能得出矛盾, 因为\(\tilde{h}\)是从\(\R\)的线性映射, 所以\(\im\tilde{h}\)的维数至多是\(1\), 然而(一般来说)\(\im{h}\)的维数可以是\(0\)到\(\dim{V}+\dim{W}\)的任意值.
矛盾的原因是\(\varphi:V\times
W\to\R\)压缩了维数, 损失了一部分线性结构.
综上看来, 泛性质定义的张量积是一个足够"一般"的双线性乘法,
既保持了\(V,W\)的线性结构,
又没有引入其他结构.
3 The Universal Property
下面简单地介绍一下一般情况下泛性质的定义. 需要一定范畴论基础,
可以参考Paolo Aluffi §I.3, §I.4.
3.1 Terminal objects
回顾张量积的泛性质: 张量积指的是一个有序对\((\varphi,Y)\), 其中\(\varphi:V\times W\to Y\)是双线性映射,
其泛性质指的是: 对于任意双线性映射\(h:V\times
W\to Z\), 都唯一存在线性映射\(\tilde{h}:Y\to Z\), 使得下图交换: \[
\xymatrix{
V\times W \ar[r]^-{\varphi} \ar[rd]_{h} &
Y \ar@{.>}[d]^(.4){\tilde h} \\
& Z.
}
\]
现在我们丢掉与张量积有关的信息, 只保留"泛性质"的骨架:
称一个有序对\((\varphi:A\to
Y,Y)\)满足泛性质, 如果对任意态射\(h:A\to Z\), 都唯一存在态射\(\tilde{h}:Y\to Z\), 使得下图交换: \[
\xymatrix{
A \ar[r]^{\varphi} \ar[rd]_{h} &
Y \ar@{.>}[d]^(.4){\tilde h} \\
& Z.
}
\] 为了进一步严格化泛性质的定义, 先给出一些概念.
在范畴\(\sf{C}\)中, 称一个对象\(I\)为始对象(initial
object), 如果对任意\(\sf{C}\)对象\(A\), 都唯一存在态射\(I\to A\); 称一个对象\(F\)是终对象(final object),
如果对任意\(\sf{C}\)对象\(A\), 都唯一存在态射\(A\to F\).
一个范畴\(\sf{C}\)不一定始对象或终对象,
但是如果存在的话,
它们分别在同构意义下唯一(类比前文对张量积在同构意义下唯一的证明).
如果一个对象是某个范畴的始对象或终对象, 那么称它满足某种泛性质,
即"对任意态射..., 都存在唯一的态射..., 使得下图...交换".
3.2 Products and coproducts
最后我们通过泛性质定义两个重要的构造.
两个对象\(A,B\)的积(product)是\({\sf C}_{A,B}\)中的一个始对象\((X,\pi_A,\pi_B)\), 即 \[
\xymatrix@C=20pt@R=5pt@L=0.5pt{
& A \\
X \ar[ru]^-{\pi_A} \ar[rd]_-{\pi_B} \\
& B
}
\] 而且对任意\((Z,f_A,f_B)\),
都唯一存在态射\(\sigma:Z\to X\),
使得下图交换: \[
\xymatrix@C=20pt@R=5pt@L=0.5pt{
&& A \\
Z \ar@/^10pt/[rru]^{f_A} \ar@/_10pt/[rrd]_{f_B} \ar@{.>}[r]^-{\sigma}
&
X \ar[ru]^{\pi_A} \ar[rd]_{\pi_B} \\
&& B
}
\]
将积的箭头反转就得到了余积(coproduct)的定义,
简而言之 \[
\xymatrix@C=20pt@R=5pt@L=0.5pt{
&& A \ar@/_10pt/[lld]_{f_A} \ar[ld]_{\iota_A} \\
Z & X \ar@{..>}[l]_(0.4){\sigma} \\
&& B \ar@/^10pt/[llu]^{f_B} \ar[lu]^{\iota_B}
}
\]
Example 集合范畴\(\sf
Set\)中\(A,B\)的积是笛卡尔积\(A\times B\), 余积是无交并\(A\amalg B\).
\(\R\)线性空间范畴\(\sf{Vect}_\R\)中\(V,W\)的积和余积都是直和\(V\oplus W\).
考虑这样一个范畴\({\sf C}\),
它的对象是所有整数, 如果两个对象\(m\leq
n\), 那么恰好存在一个态射\(m\to
n\). 在这个范畴中,
\(m,n\)的积是两数的较大者\(\min\qty{m,n}\),
\(m,n\)的余积是两数的较小者\(\max\qty{m,n}\).
不过这和一般的加法结合律不同, 因为\(\oplus\)和\(+\)是两种不同的运算,
所以这只是形式上的结合律.↩︎
这也是形式上的结合律.↩︎
设线性空间V的线性子空间U, 则商空间为\(V/U:=\qty{v+U\,|\,v\in V}\),
配以线性运算\((v_1+U)+(v_2+U):=(v_1+v_2)+U,
k(v+U):=(kv)+U\). 向量\(v,w\in
V\)等价当且仅当\(v-w\in U\).↩︎