faddeev方程 的Wave-packet continuum discretisation#
第一章 为何两体散射理论在三体世界轰然倒塌#
本章是整个理论体系的基石和出发点。我们将以最详尽的步骤,重游您所熟悉的量子力学散射理论,然后进入三体世界,从数学和物理的两个层面,一层层地剖析为何这个在两体问题中如此成功的理论,在面对三个粒子时会遭遇不可逾越的障碍。深刻且直观地理解这个“失败”的根源,是领会法捷耶夫革命性贡献为何如此伟大的绝对前提。
1.1 两体散射理论回顾#
1.1.1 薛定谔方程与散射边界条件#
一切物理学的核心始于系统的哈密顿量 H 和它所主宰的定态薛定谔方程:
$$
H |\psi\rangle = E |\psi\rangle
$$
在质心参考系中,一个两体系统的哈密顿量可以写为 H = H_0 + V。
- 自由哈密顿量 H_0 = \dfrac{\vec{p}^2}{2\mu},其中 \vec{p} 是两粒子间的相对动量,\mu = \dfrac{m_1 m_2}{m_1+m_2} 是约化质量。H_0 的本征态是动量为 \hbar\vec{k} 的平面波 |\vec{k}\rangle,其能量为 E_k = \dfrac{\hbar^2 k^2}{2\mu}。
- 相互作用势 V,我们假设它是一个只依赖于相对坐标 \vec{r} 的局域势 V(\vec{r}),并且是短程的,即当 r \to \infty 时,V(r) 比 1/r 更快地趋于零。
对于散射问题,我们寻找的是能量 E > 0 的连续谱解。这个解在物理上必须描述一个清晰的散射过程:一束粒子(平面波)入射,与散射中心相互作用后,以球面波的形式向四面八方散射开来。这个直观的物理图像,被精确地表述为波函数在坐标空间中的渐进行为(Asymptotic Behavior):
$$
\psi_{\vec{k}}^+(\vec{r}) \xrightarrow{r \to \infty} e^{i\vec{k}\cdot\vec{r}} + f_{\vec{k}}(\hat{r}) \frac{e^{ikr}}{r}
$$
让我们仔细解读这个公式的每一部分:
- \psi_{\vec{k}}^+(\vec{r}):代表一个具有特定边界条件的散射态。\vec{k} 是入射波的波向量,上标 + 是一个关键标记,代表我们选择的是出射(outgoing)球面波的边界条件。
- e^{i\vec{k}\cdot\vec{r}}:描述入射的平面波。
- f_{\vec{k}}(\hat{r}):散射振幅(Scattering Amplitude)。这是连接理论与实验的桥梁。它描述了从入射方向 \vec{k} 散射到出射方向 \hat{r} = \vec{r}/r 的概率幅。它的量纲是长度。
- \dfrac{e^{ikr}}{r}:描述一个单位振幅的、以角频率 \omega = E/\hbar 向外传播的球面波。分母上的 r 保证了粒子流密度按 1/r^2 衰减,符合粒子数守恒。
实验上测量的微分散射截面(Differential Cross Section),即单位立体角内散射的粒子数与入射粒子流强度的比值,就由散射振幅的模平方直接给出:
$$
\frac{d\sigma}{d\Omega} = |f_{\vec{k}}(\hat{r})|^2
$$
1.1.2 Lippmann–Schwinger 方程:从微分到积分#
直接求解带有上述边界条件的薛定谔偏微分方程是可行的(例如通过分波法),但为了理论的普适性和后续推广,我们更倾向于将其转化为一个等价的积分方程。
从 (E - H_0) |\psi\rangle = V |\psi\rangle 出发,我们可以形式上写出:
$$
|\psi\rangle = |\phi\rangle + \frac{1}{E - H_0} V |\psi\rangle
$$
其中 |\phi\rangle 是齐次方程 (E - H_0)|\phi\rangle = 0 的解,即入射平面波。这里的核心问题在于算符 (E - H_0)^{-1} 的定义。当能量 E 落在 H_0 的连续谱上时,存在一个能量为 E 的本征态,导致分母为零,使得这个逆算符是奇异的、未明确定义的。
为了解决这个奇点问题并正确地引入物理边界条件,我们采用所谓的 +iε 规则:
$$
|\psi_E^+\rangle = |\phi_E\rangle + \lim_{\epsilon \to 0^+} \frac{1}{E - H_0 + i\epsilon} V |\psi_E^+\rangle
$$
这就是著名的 Lippmann–Schwinger (LS) 方程。
G_0^+(E) = \lim_{\epsilon \to 0^+} (E - H_0 + i\epsilon)^{-1} 被称为出射波自由格林函数。这个小小的虚部 +i\epsilon 蕴含着深刻的物理。在数学上,它将积分路径上的奇点(极点)推离了实轴,使得积分有明确的定义。在物理上,通过留数定理可以证明,这个规定恰好产生了我们所需要的向外传播的出射球面波。如果使用 -i\epsilon,则会得到向内汇聚的入射球面波,对应于另一种非物理的边界条件。
1.1.3 T-矩阵:一个更本质的算符#
LS 方程虽然优美,但它的未知数是依赖于具体入射条件的波函数 |\psi^+\rangle。我们希望能有一个更本质的、只依赖于系统哈密顿量而不依赖于具体入射态的算符。这个算符就是 T-矩阵(Transition Matrix)。
我们定义 T-矩阵 T 满足:
$$
V |\psi^+\rangle \equiv T |\phi\rangle
$$
这个定义是说,T-矩阵作用在入射的自由态 |\phi\rangle 上,其效果等同于完整的相互作用势 V 作用在包含了所有散射效应的真实态 |\psi^+\rangle 上。它将复杂的散射过程“打包”成了一个算符。
将此定义代入 LS 方程,我们得到波函数与 T-矩阵的关系:
$$
|\psi^+\rangle = |\phi\rangle + G_0^+ V |\psi^+\rangle = |\phi\rangle + G_0^+ T |\phi\rangle
$$
为了得到 T-矩阵自身的方程,我们将 T|\phi\rangle = V|\psi^+\rangle 的两边替换入并整理,得到算符方程:
$$
T = V + V G_0^+ T
$$
这就是 T-矩阵的 Lippmann–Schwinger 方程。它是现代散射理论的基石。一旦通过求解这个方程得到了算符 T(E),我们就可以计算任何初态 |\phi_i\rangle 到末态 |\phi_f\rangle 的散射振幅:
$$
f_{fi} = -\frac{(2\pi)^2 \mu}{\hbar^2} \langle \phi_f | T(E) | \phi_i \rangle
$$
对于两体问题,这个理论框架是完美自洽的。LS 方程是一个 Fredholm 第二类积分方程,其积分核 K = G_0^+ V 是一个紧致算符(Compact Operator)。根据 Fredholm 理论,这意味着对于非齐次方程,其解是唯一的。这保证了我们的理论框架是稳固的。
1.2 走进三体迷宫:坐标与哈密顿量#
现在,我们带着在两体世界中获得的强大武器,自信地踏入三体世界。一个由三个粒子组成的系统,其哈密顿量为:
$$
H = \sum_{i=1}^3 \frac{\vec{p}i^2}{2m_i} + V(\vec{r}1 - \vec{r}_2) + V(\vec{r}2 - \vec{r}_3) + V(\vec{r}_3 - \vec{r}_1)
$$
这个系统有 9 个坐标自由度。总动量 \vec{P} = \vec{p}_1+\vec{p}_2+\vec{p}_3 守恒,意味着质心的运动是平凡的匀速直线运动。为了分离出这 3 个无关的自由度,我们必须引入雅可比坐标(Jacobi Coordinates)。
这是一个至关重要的步骤,因为三体问题天然地存在三种不同的“组合”方式:(12)+3、(23)+1、(31)+2。每一种组合方式都对应一套最适合描述它的雅可比坐标。
第一套雅可比坐标(标记为 "3"): 适合描述粒子 1 和 2 构成子系统,粒子 3 是“旁观者”。
$$
\begin{align*}
\vec{\rho}_3 &= \vec{r}_1 - \vec{r}_2 \quad &(\text{子系统(12)的内部相对坐标}) \
\vec{\lambda}_3 &= \frac{m_1\vec{r}_1 + m_2\vec{r}_2}{m_1+m_2} - \vec{r}_3 \quad &(\text{粒子3相对于子系统(12)质心的相对坐标}) \
\vec{R} &= \frac{m_1\vec{r}_1 + m_2\vec{r}_2 + m_3\vec{r}_3}{M} \quad &(\text{总质心坐标}, M=m_1+m_2+m_3)
\end{align*}
$$
在质心系中(\vec{R}=0, \vec{P}=0),自由哈密顿量 H_0 = \sum \dfrac{\vec{p}_i^2}{2m_i} 被完美地分离为两个独立的动能项:
$$
H_0 = \frac{\vec{p}{\rho_3}^2}{2\mu} + \frac{\vec{p}_{\lambda_3}^2}{2\nu_3}
$$
其中 \mu_{12} = \dfrac{m_1m_2}{m_1+m_2} 和 \nu_3 = \dfrac{(m_1+m_2)m_3}{M} 是对应的约化质量。这种分离是精确的,没有任何交叉项。
同理,我们可以定义另外两套雅可比坐标:
第二套(标记为 "1"): \vec{\rho}_1 = \vec{r}_2 - \vec{r}_3, \vec{\lambda}_1 = \dfrac{m_2\vec{r}_2+m_3\vec{r}_3}{m_2+m_3} - \vec{r}_1。适合描述 (23)+1 子系统。
第三套(标记为 "2"): \vec{\rho}_2 = \vec{r}_3 - \vec{r}_1, \vec{\lambda}_2 = \dfrac{m_3\vec{r}_3+m_1\vec{r}_1}{m_3+m_1} - \vec{r}_2。适合描述 (31)+2 子系统。
这三套坐标系只是对同一个物理系统的不同描述,它们之间可以通过线性变换相互转换。理解这一点对于后续理解置换算符至关重要。
1.3 致命缺陷:三体 Lippmann–Schwinger 方程的病态本质#
现在,我们形式上写出三体系统的 LS 方程:
$$
|\Psi^+\rangle = |\Phi_\alpha\rangle + G_0^+(E) (V_{12} + V_{23} + V_{31}) |\Psi^+\rangle
$$
|\Phi_\alpha\rangle 是入射态,\alpha 标记了入射通道。以中子—氘核散射为例,入射通道是 (23)+1,入射态是粒子 1(中子)以动量 \vec{q} 运动,粒子 2 和 3(氘核内的质子和中子)处于束缚态 \phi_d。在雅可比坐标系 "1" 中,这个态可以写作:
$$
|\Phi_1\rangle = |\phi_d(\vec{\rho}_1)\rangle \otimes |\vec{q}(\vec{\lambda}_1)\rangle
$$
它的能量是 E = -\epsilon_d + \dfrac{q^2}{2\nu_1},其中 \epsilon_d 是氘核的结合能。
病灶在何处?
让我们对 LS 方程进行迭代展开(Born 级数),并仔细审视其中的一项:
$$
|\Psi^+\rangle = |\Phi_1\rangle + G_0^+V|\Phi_1\rangle + G_0+VG_0+V|\Phi_1\rangle + \dots
$$
考虑二阶项中的一个特定过程:G_0^+ V_{23} G_0^+ V_{23} |\Phi_1\rangle。
- 初态 |\Phi_1\rangle:粒子 2 和 3 被束缚成氘核,粒子 1 自由飞行。
- 第一次作用 V_{23}:势 V_{23} 只依赖于 \vec{\rho}_1,它只作用于子系统 (23)。它可以使氘核保持束缚,也可以使其激发或破裂,但它**完全不影响**粒子 1 的运动状态。
- 第一次传播 G_0^+:格林函数 G_0^+(E) = (E - H_{0,23} - H_{0,1} + i\epsilon)^{-1} 作用。 G_0^+(E) = \frac{1}{E - H_0 + i\epsilon}。在动量表象中,它是一个乘法算符:\frac{1}{E - \frac{p_{\rho_1}^2}{2\mu_{23}} - \frac{p_{\lambda_1}^2}{2\nu_1} + i\epsilon}。
- 第二次作用 V_{23}:势 V_{23} 再次作用于子系统 (23)。
在整个 G_0^+ V_{23} G_0^+ V_{23} \dots 的链条中,粒子 1 始终是“旁观者”。这个过程描述的是子系统 (23) 自身的散射,而粒子 1 则完全没有参与,像一个幽灵一样从旁边飞过。
让我们在动量表象中看得更清楚。V_{23} 作用在 |\Phi_1\rangle 上,会将其分解到 (23) 对的各种激发态上,但粒子1的动量 \vec{q} 保持不变。
$$
V_{23}|\Phi_1\rangle = \int d\vec{k}' |\vec{k}'(\vec{\rho}1)\rangle \otimes |\vec{q}(\vec{\lambda}_1)\rangle \langle \vec{k}'|V|\phi_d\rangle
$$
当 G_0^+ 作用于此态时,它变成:
$$
\int d\vec{k}' \frac{1}{E - \frac{k'^2}{2\mu_{23}} - \frac{q^2}{2\nu_1} + i\epsilon} |\vec{k}'(\vec{\rho}1)\rangle \otimes |\vec{q}(\vec{\lambda}_1)\rangle \langle \vec{k}'|V|\phi_d\rangle
$$
注意到 E = -\epsilon_d + \frac{q^2}{2\nu_1},分母变为 -\epsilon_d - \frac{k'^2}{2\mu_{23}} + i\epsilon。这没有问题。
但当 V_{23} 再次作用,然后 G_0^+ 再次作用时,我们实际上是在计算一个描述 (23) 对自身散射的T-矩阵的过程。整个过程中,粒子1的动量 \vec{q} 像一个幽灵一样,始终没有改变。
在数学上,这意味着在整个积分链条中,始终存在一个未被积分的动量守恒 \delta(\vec{q} - \vec{q}')。这个 \delta 函数来自于算符 V_{23} 和 H_0 对粒子1的“不作为”。它使得积分核 K = G_0^+V 不是紧致算符。
V_{23}再换一种写法:
$$
\langle \vec{p}', \vec{q}' | V_{23} | \vec{p}, \vec{q} \rangle = \delta(\vec{q}' - \vec{q}) \cdot V_{23}(\vec{p}', \vec{p})
$$
看到了吗?它包含一个狄拉克 \delta 函数 \delta(\vec{q}' - \vec{q})!这个 \delta 函数精确地表述了“旁观者动量守恒”。
现在考察积分核 K = G_0^+ V = G_0^+ (V_{12}+V_{23}+V_{31})。其中的 G_0^+ V_{23} 项就包含了上述的 \delta 函数。当我们在 LS 积分方程中进行积分时,例如 \int d^3q \dots \delta(\vec{q}' - \vec{q}) \dots,这个 \delta 函数不会被消除!它会一直存在于方程的迭代级数中。
一个包含 \delta 函数的积分核,在数学上被称为非紧致(Non-Compact)。
直观理解:紧致算符有“平滑”作用,能把粗糙的函数变得平滑。而非紧致算符没有这种性质,它会保留甚至制造奇点。
数学后果:Fredholm 积分方程理论的核心定理之一,就是只有当积分核是紧致时,方程解的唯一性才能得到保证。对于我们这里的非紧致核,Fredholm 理论不适用,方程的解**不唯一**。
什么是紧致算符?
一个直观的理解是,紧致算符能把有界集合映射到紧集(一个更“小”的集合),它具有“平滑”效应。在积分方程中,紧致的积分核能保证解的良定性。非紧致的核,就像我们这里遇到的,包含无法消除的 \delta 函数奇点,它破坏了解的唯一性。
三体LS方程失败了,因为它无法区分两种截然不同的物理过程:
- 连通的 (Connected) 过程: 所有三个粒子都紧密地参与相互作用,例如粒子1撞击氘核,氘核破裂,然后三个粒子重新组合。这是我们真正关心的复杂散射。
- 非连通的 (Disconnected) 过程: 一个子系统在内部演化,而第三个粒子作为旁观者自由飞行。例如,氘核内部的质子和中子相互作用,而入射的中子在远处飞过,从未靠近。
LS方程将这两种过程混为一谈,其数学结构因此而崩溃。我们需要一个全新的、能够从一开始就将这两种过程分离开来的方程。这就是法捷耶夫方程即将要完成的使命。
法捷耶夫-三体#
在第一章中,我们陷入了理论的泥潭:直接推广的 Lippmann–Schwinger (LS) 方程在三体问题中是病态的,其解不唯一。其病灶在于积分核中包含了描述“非连通”散射过程的项,导致了数学上的非紧致性。本章我们将详细学习 L. D. Faddeev 在 1960 年提出的革命性方案。法捷耶夫的天才之处在于,他没有试图去“修补”LS方程,而是对问题本身进行了根本性的重构(rearrangement),将一个病态的方程等价地转化为一组性质优良的耦合方程组。
2.1 核心思想:对散射过程的分解#
法捷耶夫的出发点是,LS 方程 T = V + V G_0 T 之所以失败,是因为总相互作用势 V = V_1 + V_2 + V_3(我们沿用上一章的约定,V_k 是粒子 k 不参与的那对粒子间的势)被当作一个整体来处理,无法区分出真正“连通”的三体相互作用。
他的核心思想是,将总的散射算符 T 分解为三个部分,每一部分对应于某一对粒子进行的“最后一次”相互作用。
2.1.1 T-矩阵的分解#
我们定义三个法捷耶夫 T-矩阵分量 T^{(i)}(i=1,2,3):
$$
T^{(i)} \equiv V_i + V_i G_0 T
$$
这个定义的物理含义是:T^{(i)} 描述了所有以 V_i 相互作用为“结尾”的散射过程的总和。第一项 V_i 是最简单的过程(一次 Born 近似),第二项 V_i G_0 T 描述了系统先经历了完整的、复杂的散射过程 T,然后自由传播 G_0,最后以一次 V_i 相互作用结束。
这一定义是自洽的吗?把三个分量相加:
$$
\sum_{i=1}^3 T^{(i)} = \sum_{i=1}^3 (V_i + V_i G_0 T) = \left(\sum_{i=1}^3 V_i\right) + \left(\sum_{i=1}^3 V_i\right) G_0 T.
$$
因为 \sum_i V_i = V,上式变为
$$
\sum_{i=1}^3 T^{(i)} = V + V G_0 T,
$$
根据 T-矩阵的 LS 方程,右边正好就是总的 T 矩阵 T。所以,我们得到了一个精确的、不含任何近似的分解关系:
$$
T = T^{(1)} + T^{(2)} + T^{(3)}.
$$
到目前为止,我们只是用三个新的未知数 T^{(i)} 替换了原来的一个未知数 T。真正的突破在于,这三个新的未知数所满足的方程,其性质将发生根本性的改变。
2.1.2 波函数的分解#
同样的思想也可以应用在波函数上。总的散射波函数 |\Psi\rangle 可以分解为:
$$
|\Psi\rangle = |\Phi\rangle + |\Psi^{(1)}\rangle + |\Psi^{(2)}\rangle + |\Psi^{(3)}\rangle,
$$
其中 |\Phi\rangle 是入射平面波,而法捷耶夫波函数分量定义为
$$
|\Psi^{(i)}\rangle \equiv G_0 V_i |\Psi\rangle.
$$
这个定义同样诠释了“以 V_i 为末次作用”的思想。虽然波函数分解在物理上非常直观,但在实际数值计算中,处理 T-矩阵分量通常更为方便和直接。因此,本讲义将聚焦于 T-矩阵的推导。
2.2 法捷耶夫方程的推导#
现在,我们为 T^{(i)} 建立自洽方程组,这是整个理论的核心推导。
- 出发点:从 T^{(1)} 的定义开始:
$$
T^{(1)} = V_1 + V_1 G_0 T.
$$ - 代入分解式:将 T = T^{(1)} + T^{(2)} + T^{(3)} 代入上式:
$$
T^{(1)} = V_1 + V_1 G_0 (T^{(1)} + T^{(2)} + T^{(3)}).
$$ -
分离变量:将包含未知数 T^{(1)} 的项移到左边:
$$
T^{(1)} - V_1 G_0 T^{(1)} = V_1 + V_1 G_0 (T^{(2)} + T^{(3)}),
$$
即
$$
(I - V_1 G_0) T^{(1)} = V_1 + V_1 G_0 (T^{(2)} + T^{(3)}).
$$
这里的 I 是单位算符。 -
关键一步:引入两体 t-矩阵。两体散射理论中的两体 t-矩阵 t_1 满足
$$
t_1 = V_1 + V_1 G_0 t_1,
$$
即 (I - V_1 G_0) t_1 = V_1。若算符 (I - V_1 G_0) 可逆(对非束缚态能量通常成立),则
$$
t_1 = (I - V_1 G_0)^{-1} V_1.
$$
两体 t-矩阵 t_1 “打包”了所有由势 V_1 产生的两体散射效应,是三体问题中的已知构件。 -
完成推导:对上述方程左右同乘以 (I - V_1 G_0)^{-1}:
$$
T^{(1)} = (I - V_1 G_0)^{-1}\big[ V_1 + V_1 G_0 (T^{(2)} + T^{(3)}) \big].
$$
分配并用 t_1 = (I - V_1 G_0)^{-1} V_1 得到
$$
T^{(1)} = t_1 + t_1 G_0 (T^{(2)} + T^{(3)}).
$$
对 T^{(2)} 和 T^{(3)} 进行相同操作,最终得到对称的耦合方程组,即法捷耶夫方程(在 T-矩阵形式下常称为 AGS 方程,以 Alt, Grassberger, Sandhas 命名):
$$
\begin{cases}
T^{(1)} = t_1 + t_1 G_0 (T^{(2)} + T^{(3)})\[4pt]
T^{(2)} = t_2 + t_2 G_0 (T^{(3)} + T^{(1)})\[4pt]
T^{(3)} = t_3 + t_3 G_0 (T^{(1)} + T^{(2)})
\end{cases}
$$
2.3 方程的结构与数学上的治愈#
2.3.1 矩阵形式与方程核#
这组方程可视作一个 3×3 的算符矩阵方程。令列向量 \mathbf{X}=[T^{(1)},T^{(2)},T^{(3)}]^T 和驱动向量 \mathbf{Y}=[t_1,t_2,t_3]^T,AGS 方程可写为
$$
\mathbf{X} = \mathbf{Y} + \mathbf{K}\mathbf{X},
$$
其中核算符矩阵 \mathbf{K} 为
$$
\mathbf{K} = \begin{pmatrix}
0 & t_1 G_0 & t_1 G_0\[4pt]
t_2 G_0 & 0 & t_2 G_0\[4pt]
t_3 G_0 & t_3 G_0 & 0
\end{pmatrix}.
$$
请注意 \mathbf{K} 的结构:对角线元素严格为零。这在代数上禁止了形如 t_i G_0 T^{(i)} 的项出现——物理上意味着以 V_i 结尾的散射过程,其“前一步”不可能又以 V_i 结尾。相互作用必须在不同粒子对之间传递,从根本上消除了导致 LS 方程病态的“非连通图”。
2.3.2 数学治愈:紧致核的魔力#
AGS 方程 \mathbf{X}=\mathbf{Y}+\mathbf{K}\mathbf{X} 仍是 Fredholm 第二类积分方程,其性质由核 \mathbf{K} 决定。虽然 \mathbf{K} 本身不一定是紧致的(因含有奇异的 G_0),但考察其二次迭代核 \mathbf{K}^2:
$$
\mathbf{K}^2 = \mathbf{K}\mathbf{K}.
$$
例如,
$$
(\mathbf{K}^2){11} = (KK_{21}) + (K_{13}K_{31}) = (t_1 G_0)(t_2 G_0) + (t_1 G_0)(t_3 G_0),
$$
以及
$$
(\mathbf{K}^2){12} = (KK_{22}) + (K_{13}K_{32}) = (t_1 G_0)(0) + (t_1 G_0)(t_3 G_0) = t_1 G_0 t_3 G_0.
$$
我们发现 \mathbf{K}^2 的所有矩阵元都是形如 t_i G_0 t_j(i\ne j)的算符线性组合。
中心定理:对于常见的相互作用势,虽然 G_0 本身是奇异的,但当两个不同子系统的 t-矩阵夹在中间时,诸如 t_i G_0 t_j(i\ne j)的乘积是紧致算符。直观上,t_j 对中间动量积分,再被另一个不同的 t_i 平滑处理,使得 G_0 的奇点被“平滑掉”。
因此 \mathbf{K}^2 是紧致算符。根据 Fredholm 理论:
- 要么对于任意驱动项 \mathbf{Y},方程存在唯一且良定义的解 \mathbf{X}=(\mathbf{I}-\mathbf{K})^{-1}\mathbf{Y};
- 要么齐次方程 \mathbf{X}=\mathbf{K}\mathbf{X} 存在非零解,这对应于系统在某些负能量下存在三体束缚态(物理上合理且有意义)。
结论:法捷耶夫通过将病态的 LS 方程等价重构为耦合的 AGS 方程,得到了一个其二次迭代核为紧致的方程组。从数学上根治了非连通图导致的问题,保证了三体散射问题解的唯一性与稳定性,为后续数值计算提供了坚实的理论基础。
第三章 离散化#
在第二章,我们得到了数学上完美、结构优美的 AGS 方程。然而,它依旧是“由连续函数空间中的算符构成。我们需要选取jishi来做计算: 分波展开和基矢离散化——将一个无穷维的、三维矢量问题,一步步地塑造成一个有限维的、一维的、计算机可以求解的矩阵问题。
3.1 分波展开 (Partial Wave Expansion)#
三体问题中的动量是三维矢量,直接在三维动量空间中求解 AGS 方程,其计算量是天文数字。幸运的是,物理系统往往具有对称性,而对称性是简化的根源。对于绝大多数核物理问题,相互作用势是中心对称的(不依赖于坐标系的方向),这意味着系统的总角动量 \vec{J} 和总宇称 \Pi 是守恒量。
核心思想:哈密顿量 H 与算符 \hat{J}^2,\ \hat{J}_z,\ \hat{\Pi} 对易。根据量子力学基本原理(舒尔引理),这意味着在以 \{\,|...,J,M,\Pi\rangle\,\} 为基矢的表象中,哈密顿量矩阵是块对角化的。也就是说,不同 J 或不同 \Pi 的态之间不存在跃迁:
$$
\langle ...,J',M',\Pi'|H|...,J,M,\Pi\rangle
= \delta_{J'J}\,\delta_{M'M}\,\delta_{\Pi'\Pi}\cdot H^{(J,\Pi)}_{...}.
$$
这允许我们将一个庞大的、耦合所有自由度的问题,分解为一系列互不相关的、在每个固定 (J,\Pi) 通道内求解的、规模小得多的子问题。分别求解每个子问题,最后将它们的物理结果(例如散射振幅)相干地叠加起来,得到最终的物理可观测量。
3.1.1 两体系统的角动量耦合#
两体态由相对动量 \vec{p} 和总自旋 \vec{s}=\vec{s}_1+\vec{s}_2 描述。平面波态 |\vec{p}\rangle 可以展开在分波基矢 |p,l,m_l\rangle 上。考虑自旋后,一个更完备的基矢是 |p;(l,s)j,m_j\rangle,其中:
- p 是相对动量的大小;
- l 是轨道角动量量子数;
- s 是两粒子的总自旋量子数(例如 n–p 系统,可为 s=0 单重态或 s=1 三重态);
- \vec{j}=\vec{l}+\vec{s} 是该子系统的总角动量(通道角动量);
- m_j 是 j 的磁量子数。
由于 j 和 m_j 在两体散射中守恒,势能矩阵元 \langle p',l',s'|V|p,l,s\rangle 只有在 j,m_j,s 相同时才非零。但请注意,轨道角动量 l 不一定守恒。核力中一个非常重要的组成部分——张量力(tensor force),其算符形如
$$
S_{12}=3(\vec{\sigma}_1\cdot\hat{r})(\vec{\sigma}_2\cdot\hat{r})-\vec{\sigma}_1\cdot\vec{\sigma}_2,
$$
它不与 \hat{L}^2 对易,导致耦合通道(coupled channels)现象。
经典例子是氘核。其总角动量 j=1,总自旋 s=1,宇称为正。满足这些条件的轨道角动量可为 l=0(S 波)和 l=2(D 波)。张量力使氘核波函数是两者的混合:主要为 ^3S_1 态,但混入约 4% 的 ^3D_1 态。因此,在 ^3S_1–^3D_1 耦合通道中,势能 V 和 t 矩阵都是 2\times2 的矩阵,其元素连接 S 波与 D 波。
3.1.2 三体系统的角动量耦合#
三体系统的角动量耦合更为复杂,但遵循相同原则。以 n–d 散射为例,需要耦合三个角动量来源: (np) 子系统的内部轨道角动量 l_p、旁观中子相对于 (np) 质心的轨道角动量 l_q,以及三粒子的总自旋。一种常用耦合方式(LS 耦合)如下:
- 子系统内部耦合:\vec{l}_p+\vec{S}_{np}=\vec{j}_{np},其中 \vec{S}_{np}=\vec{s}_n+\vec{s}_p;
- 旁观者耦合:\vec{l}_q+\vec{s}_{\text{spectator}}=\vec{j}_{\text{spectator}};
- 最终耦合:\vec{j}_{np}+\vec{j}_{\text{spectator}}=\vec{J}。
最终的三体分波基矢可记为
$$
|p,q;\,((l_p,S_{np})j_{np},(l_q,s_{\text{spectator}})j_{\text{spectator}})\,J,M\rangle.
$$
在实际计算中通常用复合指标 \alpha 表示除 p,q 与 J,M 之外的所有内部量子数组合。
分波展开的最终成果是:原本关于三维矢量动量 \vec{p},\vec{q} 的 AGS 方程,被转化为一系列关于一维标量动量 p,q 的耦合积分方程。每个方程对应一个固定的总角动量 J 与总宇称 \Pi 的通道。问题的维数从六维(\vec{p},\vec{q})降低到了二维(p,q)。
3.2 动量空间基矢离散化#
现在我们面对的是关于标量动量 p,q 的积分方程。这仍是连续的、无穷维的。下一步是将这一维的连续自由度,用有限的、离散的基矢来近似。
3.2.1 动量空间的归一化与基矢#
在分波展开后,径向积分的测度为 p^2\,dp(三维动量测度 d^3p=p^2dp\,d\Omega_p 对角度部分积分后得到)。因此径向基函数的正交归一条件必须包含该雅可比因子:
$$
\int_0^\infty p^2\,dp\; g_m(p)\,g_n(p)=\delta_{mn}.
$$
这确保 \{|g_n\rangle\} 是一组标准正交基。在实际操作中,积分上限并非无穷,而是一个经过选择的截断动量 p_{\max}。
3.2.2 区间选取与 p_{\max} 的确定#
如何选择动量区间上限 p_{\max}?这是影响精度与效率的关键实践问题。
- 物理需求:p_{\max} 必须足够大,以包含波函数的重要特征。对于束缚态(如氘核),动量空间的高动量尾巴必须被覆盖,否则结合能等将不准确。对于散射态,较高散射能会在高动量区产生更多振荡,需更大 p_{\max}。
- 经验法则:p_{\max} 的选取通常与核力的“硬度”有关。对经过重整化群得到的“软”势,动量空间矩阵元在高动量下迅速衰减,通常 p_{\max}\sim3–5\ \text{fm}^{-1}(约 600–1000 MeV/c)就足够;对“硬”势可能需更大值。
- 收敛性检验:最可靠的方法是做收敛性检验。选一个 p_{\max} 计算(例如氘核结合能)得 E_1,再增大到 p_{\max}+\Delta p 得 E_2,比较 |E_1-E_2|。若小于容忍阈值(例如 10^{-4} MeV),则认为 p_{\max} 足够;否则继续增大直至收敛。对基矢数目 N 同样需要做收敛性检验。
3.2.3 WP‑CD 基矢的高效构造#
如 Sean Miller 等人所示,可以通过求解广义特征值问题,高效构造一组既正交又“物理优化”的基矢:
- 选择一组简单的、可完备的非正交种子基函数,例如 B‑样条或广义高斯基 \{|\phi_i(p)\rangle\};
- 计算哈密顿量矩阵 \mathbf{H}_{ij}=\langle\phi_i|H_0+V|\phi_j\rangle 和重叠矩阵 \mathbf{B}_{ij}=\langle\phi_i|\phi_j\rangle;
- 求解广义特征值问题 \mathbf{H}\,\mathbf{c}=E\,\mathbf{B}\,\mathbf{c}(可用 LAPACK 等库);
- 用本征向量构造新的基矢 |\psi_n\rangle=\sum_i c_{n,i}|\phi_i\rangle。这些 |\psi_n\rangle 具有良好性质:严格正交 \langle\psi_m|\psi_n\rangle=\delta_{mn},并且是哈密顿量 H 的本征态或良好近似。能量为负的本征态对应束缚态,而能量为正的一系列本征态则构成离散化的连续谱基矢,即 WP‑CD 基矢。
3.3 总结#
通过本章介绍的两把“利斧”,我们将抽象、无穷维、三维矢量自由度的 AGS 方程,转化为一系列(每个 (J,\Pi) 通道一个)具体的、有限维的、关于一维标量自由度的矩阵方程。
- 分波展开利用旋转对称性,将问题分解为独立的角动量通道,把矢量问题变为径向问题;
- 基矢离散化利用伽辽金类方法,通过选择一组巧妙的(例如 WP‑CD)平方可积基矢,将径向连续自由度近似为有限维矩阵表示。
我们已完成零件加工与图纸设计。下一章进入“总装配车间”,把这些矩阵零件组装成最终的三体矩阵,并讨论如何启动并求解这台复杂的机器。
第四章 构建与求解分波AGS方程#
在第三章,我们已经将理论各部分打磨好:在特定分波通道下、在离散基矢上表示的两体t-矩阵。本章的使命,是将这些部分精确地组装起来,构建出最终的、可以在计算机上求解的巨型AGS矩阵方程。我们将严格在一个固定的总角动量 (J, \Pi) 通道内进行所有讨论,因为我们知道,不同 (J, \Pi) 的块之间是完全解耦的。
4.1 方程的组成部件:X, Y, K#
我们的目标是求解线性代数方程:
$$
(\mathbf{I} - \mathbf{K}) \mathbf{X} = \mathbf{Y}
$$
在进行任何计算之前,我们必须精确地理解这三个巨型矩阵/向量的结构和内容。
4.1.1 未知解向量 X#
向量 \mathbf{X} 是我们要求解的目标。它是一个“向量的向量”,其结构如下:
$$
\mathbf{X} = \begin{pmatrix} \mathbf{X}^{(1)} \ \mathbf{X}^{(2)} \ \mathbf{X}^{(3)} \end{pmatrix}
$$
- 它由三个块组成,分别对应三个法捷耶夫分量 T^{(1)}, T^{(2)}, T^{(3)}。
- 每一个块,例如 \mathbf{X}^{(1)},本身又是一个长长的列向量。它的每一个元素,都对应着 T^{(1)} 在我们三体分波基矢 |1; \alpha, m, j\rangle 下的一个展开系数。
这里的复合索引 (\alpha, m, j) 遍历了所有可能的内部角动量通道、子系统径向基矢和旁观者动量基矢。解出向量 \mathbf{X},就意味着我们知道了三体T-矩阵的所有信息。
4.1.2 驱动项 Y#
向量 \mathbf{Y} 代表了散射的“初始条件”或“第一推动力”。在AGS方程中,它对应于两体t-矩阵项。对于 n-d 散射,入射态是一个中子 + 一个氘核。
- 物理图像:在散射发生前,系统处于雅可比坐标系 k=1(假设粒子1是入射中子)所描述的通道中。在这个通道里,子系统(23)的状态是氘核束缚态,而粒子1则以一个确定的入射动量 q_{in} 运动。
-
数学表示:这意味着,在我们的巨大基矢空间中,驱动项 \mathbf{Y} 是一个非常“稀疏”的向量。它只在那些描述入射物理图像的特定分量上才非零。具体来说:
- 只有在法捷耶夫分量 k=1 的块 \mathbf{Y}^{(1)} 中有非零项。
- 在 \mathbf{Y}^{(1)} 内部,只有在内部角动量通道 \alpha 对应于氘核(例如 ³S₁-³D₁ 通道)的子块中,才有非零项。
- 在更深的子块中,只有在旁观者动量 q_j 对应于入射动量 q_{in} 的分量上,才有非零项。
因此,构建驱动项 \mathbf{Y} 的过程,就是将物理的入射条件“翻译”为数学上的向量表示。
4.1.3 核矩阵 K#
核矩阵 \mathbf{K} 是这台机器最复杂、最核心的引擎。它是一个 3 \times 3 的块矩阵,其中每个块 \mathbf{K}_{ik} 本身又是一个维度为 (N_\alpha N_p N_q) \times (N_\alpha N_p N_q) 的巨型矩阵。
$$
\mathbf{K} = \begin{pmatrix}
0 & \mathbf{K}{12} & \mathbf{K} \
\mathbf{K}{21} & 0 & \mathbf{K} \
\mathbf{K}{31} & \mathbf{K} & 0
\end{pmatrix}
\quad \text{其中 } \mathbf{K}{ik} \text{ 对应于算符 } t_i G_0 P
$$
构建 \mathbf{K} 的过程,就是计算其每一个矩阵元
$$
\langle i; \alpha', m', j' | t_i G_0 P_{ki} | k; \alpha, m, j \rangle.
$$
这是整个计算中 CPU 耗时最长的部分。
4.2 置换算符与角动量重耦合#
现在,我们来深入分析计算一个核矩阵元 \langle \text{final} | t_i G_0 P_{ki} | \text{initial} \rangle 的详细步骤。这就像一个三步的流水线作业。
第一步:置换算符 P_{ki}(最难的一步)
置换算符 P_{ki} 交换粒子 k 和 i。在分波表象下,它做两件纠缠在一起的复杂事情:
- 动量变换(几何部分):它将用雅可比动量 (\vec{p}_k, \vec{q}_k) 描述的态,变为用 (\vec{p}_i, \vec{q}_i) 描述的态。新旧动量的大小和它们之间的夹角,都可以通过粒子质量和旧动量计算出来。这是一个纯粹的坐标变换。
- 角动量重耦合(代数部分):一个在 k-系下耦合的角动量态(例如 ((l_k, S_k)j_k, l_{q_k})J),必须被重新展开为 i-系下所有可能的角动量态(例如 ((l_i, S_i)j_i, l_{q_i})J)的线性叠加。
最终,P_{ki} 的矩阵元可以分解为一个几何积分和一个代数因子的乘积:
$$
\langle i; \alpha', m' | P_{ki} | k; \alpha, m \rangle = \text{GeometricFactor} \times \text{RecouplingCoefficient}
$$
- 几何因子:这是一个涉及到动量变换和基函数 g_n(p) 的积分。它本质上是计算一个变换后的基函数在另一个基函数上的投影。
- 重耦合系数 (Recoupling Coefficient):这部分是纯粹的角动量代数,与径向动量无关。它包含了所有从一套角动量耦合方案到另一套方案的变换信息。对于三体系统,这个系数可以被精确地表示为 Wigner 6-j 和 9-j 符号的乘积。
实践中的核心 (The Trick):
在编写代码时,置换算符的矩阵是一个巨大的、需要预先计算或在循环中动态计算的表格。其核心是一个调用标准库(例如一个专门的角动量计算库)来获得精确的 6-j 和 9-j 符号的子程序,以及一个执行复杂几何积分的数值积分程序。正确、高效地实现置换算符是三体分波计算中最高、最陡峭的一座山峰。
第二步:自由格林函数 G_0
置换完成后,我们得到了一系列在 i-系下的基矢。现在轮到 G_0 登场。在三体分波基矢下,G_0 是对角的。它的作用非常简单,就是给每个基矢 |i; \alpha', m', j'\rangle 乘上一个数字因子:
$$
G_0 |i; \alpha', m', j'\rangle = \frac{1}{E - E_{m'} - E_{j'} + i\epsilon} \; |i; \alpha', m', j'\rangle
$$
其中 E_{m'} 是子系统基矢 m' 的能量,E_{j'} 是旁观者基矢 j' 的能量。
第三步:两体 t-矩阵 t_i
最后,轮到我们预先计算好的“零件”——两体 t-矩阵 t_i 上场。它也只在 i-系下作用,并且只作用于子系统的自由度(即 \alpha' 和 m')。它的矩阵元
$$
\langle i; \alpha'', m'' | t_i | i; \alpha', m' \rangle
$$
就是我们在第三章中费尽心力计算出的两体 t-矩阵 \mathbf{t}^{(j,s)}_{l'' l'}(E_{sub})。注意,这里的能量 E_{sub} 是子系统的能量,它依赖于总能量 E 和旁观者能量 E_{j'}。
总结:
一个完整的核矩阵元,是以上三步流水线作业的最终产物。它是一个对所有可能的中间态求和的过程:
$$
K_{final, initial} = \sum_{\text{intermediate states}} \langle \text{final} | t_i | \text{intermediate}\rangle \cdot (\text{Propagator Factor}) \cdot \langle \text{intermediate} | P_{ki} | \text{initial}\rangle
$$
4.3 最终矩阵的结构与求解#
经过上述复杂的构建过程,我们得到了一个巨大的、但结构清晰的线性方程组 (\mathbf{I} - \mathbf{K}) \mathbf{X} = \mathbf{Y}。下面是这个矩阵的结构示意图:
+----------------------------------------------------------------------------------+
| (I - K) Matrix for a fixed (J, Pi) channel |
+==================================================================================+
| BLOCK (i=1, k=1) = I | BLOCK (i=1, k=2) = -K_12 | BLOCK (i=1, k=3) = -K_13 |
| (dim: D x D, contains many | (dim: D x D, couples all | (dim: D x D, couples all |
| sub-blocks for angular | channels) | channels) |
| momentum channels) | | |
+--------------------------------+----------------------------------+--------------------------------+
| BLOCK (i=2, k=1) = -K_21 | BLOCK (i=2, k=2) = I | BLOCK (i=2, k=3) = -K_23 |
| (dim: D x D, couples all | (dim: D x D, contains many | (dim: D x D, couples all |
| channels) | sub-blocks for angular | channels) |
| | momentum channels) | |
+--------------------------------+----------------------------------+--------------------------------+
| BLOCK (i=3, k=1) = -K_31 | BLOCK (i=3, k=2) = -K_32 | BLOCK (i=3, k=3) = I |
| (dim: D x D, couples all | (dim: D x D, couples all | (dim: D x D, contains many |
| channels) | channels) | sub-blocks for angular |
| | | momentum channels) |
+--------------------------------+----------------------------------+--------------------------------+
(where D = N_\alpha * N_p * N_q)
求解这个巨型矩阵方程,直接求逆是不可行的。必须使用迭代求解器。在现代计算中,GMRES(广义最小残差方法)是求解这类大型非对称线性系统的首选标准。它是一种 Krylov 子空间方法,能够高效、稳定地在巨大的解空间中找到最优近似解。
4.4 收获物理:从解向量 X 到可观测量#
求解器最终返回一个巨大的解向量 \mathbf{X},它包含了所有 T-矩阵分量在分波基矢下的展开系数。现在是收获物理果实的时候了。
\circ 计算单通道跃迁矩阵 T^J_{fi}
对于一个给定的总角动量 J,从初态分波 |i\rangle(例如入射 l_q=0)到末态分波 |f\rangle(例如出射 l_q=0)的物理跃迁矩阵元 T^J_{fi},可以通过将解向量 \mathbf{X} 与初末态做投影得到。
T^J_{fi} = \langle f | T | i \rangle = \sum_{k=1}^3 \langle f | T^{(k)} | i \rangle
右边的每一项 \langle f | T^{(k)} | i \rangle 都可以从 \mathbf{X} 的对应分量中线性组合出来。
\circ 构建物理散射振幅 f(\theta, \phi)
完整的散射振幅是一个在自旋空间中的矩阵。它是所有分波贡献的相干叠加:
$$
f_{m_f, m_i}(\theta, \phi) = \sum_{J, l_q, l_q', \dots} C_{\text{coeffs}} \cdot T^J_{fi} \cdot Y_{l_q' m_{l_q'}}(\theta, \phi)
$$
这里的 C_{\text{coeffs}} 是一大堆 Clebsch–Gordan 系数,它们负责将线性动量的散射角 (\theta, \phi) 与各种抽象的角动量量子数组合起来,还原出真实的角分布。
\circ 计算可观测量
- 非极化微分截面:对所有末态自旋求和,并对所有初态自旋做平均。
$$
\frac{d\sigma}{d\Omega} = \frac{1}{(2s_n+1)(2s_d+1)} \sum_{\text{all spins}} |f_{m_f, m_i}(\theta, \phi)|^2
$$ - 极化可观测量(例如分析能 A_y):需要计算初态粒子自旋向上(\uparrow)和向下(\downarrow)的散射截面。
$$
A_y(\theta) = \frac{d\sigma_{\uparrow}/d\Omega - d\sigma_{\downarrow}/d\Omega}{d\sigma_{\uparrow}/d\Omega + d\sigma_{\downarrow}/d\Omega}
$$
分析能这类可观测量对核力的自旋依赖部分(特别是张量力和自旋-轨道耦合力)以及三体力效应极为敏感,是检验理论模型的“精密放大镜”。
至此,我们完成了一次从第一性原理出发,通过严谨的理论和复杂的数值计算,最终得到可与高精度实验数据直接对比的物理预测的完整旅程。这正是现代少体核物理计算研究的核心路径和魅力所在。
创建日期: 2025-11-05