物理光学笔记

本笔记原作者YUNEZ - 知乎。在其基础上二次开发得到,感谢。

麦克斯韦方程组

麦克斯韦方程组是描述电磁场的基本方程,统合了电磁现象的经典理论。它由四个基本方程组成,分别描述了电场和磁场的生成和变化。下面,我们一步步地探讨这些方程的意义和物理内涵。

高斯定律(电场)

高斯定律(Gauss’s Law)描述了电场的源头,即电荷。它可以表示为:


$$
\nabla \cdot \mathbf{E} = \frac{\rho}{\varepsilon_0}
$$

其中,$\mathbf{E}$ 是电场,$\rho$ 是电荷密度,$\varepsilon_0$ 是真空电容率。

高斯定律告诉我们,电场中某点的散度与该点的电荷密度成正比。

这意味着电荷是电场的源头。如果一个区域内有正电荷,电场线从该区域向外发散;若是负电荷,电场线则向内收缩。

高斯定律(磁场)

与电场不同的是,磁场没有“单极”源头。对应的方程为:


$$
\nabla \cdot \mathbf{B} = 0
$$

其中,$\mathbf{B}$ 是磁感应强度(磁场)。

这个方程表明,磁场散度为零,这意味着在任何区域内,磁场没有“源”或“汇”。从数学上讲,这表示磁场线既不开始也不结束于空间中的任何点,换句话说,磁场线总是闭合的,没有起点或终点。

这意味着没有“磁单极子”的存在。磁场线总是从磁体的一极出发,经过空间再回到另一极。

法拉第定律

法拉第定律(Faraday’s Law)描述了变化的磁场如何产生电场:


$$
\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}
$$

即:

  • 时间变化的磁场会在空间中产生一个旋转的电场,
    • 电场的大小线性相关于磁场的时间变化率。

    • 电场的方向与磁场方向正交。

    • 负号表示感应电场的方向与磁场变化的方向相反,这符合楞次定律,即感应电场总是产生一个抵抗磁场变化的效果。

gh

安培-麦克斯韦定律

安培-麦克斯韦定律(Ampère-Maxwell Law)描述了电流和变化的电场如何产生磁场:


$$
\nabla \times \mathbf{B} = \mu_0 (\mathbf{J} + \mathbf{I})
$$

其中

  • $\mathbf{J}$ 是电流密度定义为 $\varepsilon_0 \frac{\partial \mathbf{\Phi_E}}{\partial t}$

  • $\mu_0$ 是真空磁导率

  • $\mathbf{I}$ 是位移电流密度定义为 $\varepsilon_0 \frac{\partial \mathbf{E}}{\partial t}$

这个方程表明,磁场的旋度不仅由传统的电流密度 $\mathbf{J}$ 引起,还包括了由于电场变化产生的位移电流 $\mathbf{I}$。即电流会产生磁场(如电流通过导线产生磁场),而变化的电场也能产生磁场。

gh

推导

麦克斯韦方程组包含四个方程,它们描述了电磁场的基本性质。尽管这四个方程看似独立,但实际上它们之间存在内在的数学联系,部分方程可以通过其他方程推导而来。这种关联性主要利用了向量微积分中的恒等式,特别是旋度的散度恒为零(即 $\nabla \cdot (\nabla \times \mathbf{F}) = 0$)。

从安培-麦克斯韦定律推导电荷守恒定律

安培-麦克斯韦定律为:


$$
\nabla \times \mathbf{B} = \mu_0 (\mathbf{J} + \varepsilon_0 \frac{\partial \mathbf{E}}{\partial t})
$$

对上述方程取散度:


$$
\nabla \cdot (\nabla \times \mathbf{B}) = \nabla \cdot \left[ \mu_0 \left( \mathbf{J} + \varepsilon_0 \frac{\partial \mathbf{E}}{\partial t} \right) \right]
$$

由于旋度的散度恒为零,左边为零:


$$
0 = \mu_0 \left( \nabla \cdot \mathbf{J} + \varepsilon_0 \frac{\partial}{\partial t} (\nabla \cdot \mathbf{E}) \right)
$$

根据高斯定律(电场的散度):


$$
\nabla \cdot \mathbf{E} = \frac{\rho}{\varepsilon_0}
$$

将其代入上式:


$$
0 = \mu_0 \left( \nabla \cdot \mathbf{J} + \varepsilon_0 \frac{\partial}{\partial t} \left( \frac{\rho}{\varepsilon_0} \right) \right) \\
0 = \nabla \cdot \mathbf{J} + \frac{\partial \rho}{\partial t}
$$

这就是电荷守恒定律


$$
\nabla \cdot \mathbf{J} + \frac{\partial \rho}{\partial t} = 0
$$

结论:安培-麦克斯韦定律通过取散度,可以推导出电荷守恒定律,这说明两者之间存在依赖关系。

从法拉第电磁感应定律推导磁场无散定律

法拉第定律为:


$$
\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}
$$

对上述方程取散度:


$$
\nabla \cdot (\nabla \times \mathbf{E}) = -\nabla \cdot \left( \frac{\partial \mathbf{B}}{\partial t} \right)
$$

由于旋度的散度恒为零,左边为零:


$$
0 = -\frac{\partial}{\partial t} (\nabla \cdot \mathbf{B})
$$

这意味着:


$$
\frac{\partial}{\partial t} (\nabla \cdot \mathbf{B}) = 0
$$

$\nabla \cdot \mathbf{B}$是一个时间常数。如果在初始时刻磁场满足无散条件:


$$
\nabla \cdot \mathbf{B} = 0
$$

则在任意时间$t$,都有:


$$
\nabla \cdot \mathbf{B} = 0
$$

结论:法拉第定律通过取散度,可以推导出磁场无散定律,即:


$$
\nabla \cdot \mathbf{B} = 0
$$

类似地,可以通过对其他麦克斯韦方程取旋度或散度,结合向量恒等式,推导出麦克斯韦方程组中的其他方程或约束关系。例如:

  • 高斯定律电荷守恒定律相结合,可以验证麦克斯韦方程组的一致性。

  • 磁场无散定律确保磁场源于闭合电流或变化的电场,而不存在磁单极子。

物质方程

在经典电磁学中,麦克斯韦方程组描述了电场和磁场的基本行为。然而,要完全解出电磁场的问题,我们还需要知道材料如何响应这些场。这就是物质方程(Constitutive Equations)的作用,它们提供了场和物质之间的关系。

在各向同性(Isotropic)和线性(Linear)的材料中,材料的电磁特性在所有方向上是相同的,并且响应是线性的。这使得物质方程可以用简单的比例关系来表示。

各向同性线性介质是应用物质方程条件!

介电常数与电场

对于电位移场(Electric Displacement Field)$\mathbf{D}$和电场(Electric Field)$\mathbf{E}$之间的关系:


$$
\mathbf{D} = \epsilon \mathbf{E}
$$
  • $\epsilon$ 是介电常数(Permittivity),它描述了材料对电场的响应能力。大的$\epsilon$表示材料能够储存更多的电能。

磁导率与磁场

对于磁感应强度(Magnetic Induction)$\mathbf{B}$和磁场(Magnetic Field)$\mathbf{H}$之间的关系:


$$
\mathbf{B} = \mu \mathbf{H}
$$
  • $\mu$ 是磁导率(Permeability),它描述了材料对磁场的响应能力。大的$\mu$表示材料能够集中更多的磁通量。

电导率与电流密度

对于电流密度(Current Density)$\mathbf{j}$和电场$\mathbf{E}$之间的关系:


$$
\mathbf{j} = \sigma \mathbf{E}
$$
  • $\sigma$ 是电导率(Conductivity),它描述了材料对电流的传导能力。大的$\sigma$表示材料是良好的导体。

电磁波的波动性

通用的波动方程

任意维度的波动可以通过方程描述:


$$
\frac{\partial^2 u(\mathbf{r},t)}{\partial t^2} = v^2 \nabla^2 u(\mathbf{r},t)
$$

其中,$\nabla^2$ 是拉普拉斯算子(Laplacian),$\mathbf{r} = (x, y, z)$

下面直观理解此公式。

假设 $u$ 代表某点的位移,那么左侧描述了该点位移的加速度,即该点在时间上的变化率。

右侧,$\nabla^2 u$$u$ 在空间上的拉普拉斯算子,表示 $u$ 在空间上的曲率或扩散程度。乘以 $v^2$ 后,右侧反映了空间曲率对时间加速度的影响。如果某点周围的 $u$ 值比该点的 $u$ 值高,拉普拉斯算子会产生一个正值,反之亦然。这意味着波的点收到附近的点的空间状态影响。

波动方程的左右两边建立了时间变化(加速度)与空间变化(曲率)之间的关系:

  • 平衡关系:某点的加速度由其周围空间曲率决定。高曲率区域会引起 $u$ 的加速度变化,从而导致波动的传播。

  • 波动传播:由于这种平衡关系,扰动在空间中以速度 $v$ 传播,形成波动。例如,在弦的振动中,弦的某点的加速度取决于其邻近点的位移差异,这导致振动沿弦传播。

想象一根绳子的一部分被扰动向上拉起并释放:

  1. 初始扰动:你向上拉动绳子的一部分(增加了 $u$)。

  2. 空间曲率:被拉起的部分与未拉起的部分形成曲率($\nabla^2 u$ 不为零)。

  3. 加速度产生:根据波动方程,曲率导致绳子被拉起的部分产生加速度,推动扰动向绳子的另一端传播。

  4. 波的传播:扰动以速度 $v$ 在绳子上传播,形成一个波动。

电磁波的存在性

麦克斯韦方程组(Maxwell’s equations)是描述电磁场(electromagnetic fields)行为的基本方程。这些方程不仅统一了电学和磁学,还预言了电磁波(electromagnetic waves)的存在。让我们开始推公式。

回顾,在自由空间(free space)中,麦克斯韦方程组的微分形式为:


$$
\begin{cases}\nabla·\mathbf E=0\\\nabla·\mathbf B=0\\\nabla\times\mathbf E=-\frac{\partial \mathbf B}{\partial t}\\\nabla \times \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t}\end{cases}
$$

其中,$\mathbf{E}$ 是电场(Electric field),$\mathbf{B}$ 是磁场(Magnetic field),$\mu_0$ 是真空磁导率(permeability of free space),$\epsilon_0$ 是真空电容率(permittivity of free space),$t$ 是时间。

首先,对法拉第电磁感应定律两边取旋度:


$$
\nabla \times (\nabla \times \mathbf{E}) = \nabla \times \left( -\frac{\partial \mathbf{B}}{\partial t} \right)
$$

左边利用向量恒等式:


$$
\nabla \times (\nabla \times \mathbf{E}) = \nabla(\nabla \cdot \mathbf{E}) - \nabla^2 \mathbf{E}
$$

根据高斯电磁定律 $\nabla \cdot \mathbf{E} = 0$,上式简化为:


$$
-\nabla^2 \mathbf{E} = -\frac{\partial}{\partial t} (\nabla \times \mathbf{B})
$$

根据安培-麦克斯韦定律:


$$
\nabla \times \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t}
$$

将其代入前式:


$$
-\nabla^2 \mathbf{E} = -\frac{\partial}{\partial t} \left( \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t} \right )
$$

即:


$$
\nabla^2 \mathbf{E} = \mu_0 \epsilon_0 \frac{\partial^2 \mathbf{E}}{\partial t^2}
$$

整理上式,得到电场的波动方程:


$$
\nabla^2 \mathbf{E} - \mu_0 \epsilon_0 \frac{\partial^2 \mathbf{E}}{\partial t^2} = 0
$$

这表明电场在空间和时间上满足波动方程,其传播速度为:


$$
c = \frac{1}{\sqrt{\mu_0 \epsilon_0}}
$$

这是光速(speed of light)的表达式。

同样地,对安培-麦克斯韦定律两边取旋度:


$$
\nabla \times (\nabla \times \mathbf{B}) = \nabla \times \left( \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t} \right )
$$

左边利用向量恒等式:


$$
\nabla \times (\nabla \times \mathbf{B}) = \nabla(\nabla \cdot \mathbf{B}) - \nabla^2 \mathbf{B}
$$

根据高斯磁定律 $\nabla \cdot \mathbf{B} = 0$,上式简化为:


$$
-\nabla^2 \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial}{\partial t} (\nabla \times \mathbf{E})
$$

根据法拉第电磁感应定律:


$$
\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}
$$

将其代入前式:


$$
-\nabla^2 \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial}{\partial t} \left( -\frac{\partial \mathbf{B}}{\partial t} \right )
$$

即:


$$
\nabla^2 \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial^2 \mathbf{B}}{\partial t^2}
$$

整理上式,得到磁场的波动方程:


$$
\nabla^2 \mathbf{B} - \mu_0 \epsilon_0 \frac{\partial^2 \mathbf{B}}{\partial t^2} = 0
$$

同样,这表明磁场在空间和时间上也满足波动方程,传播速度同样为光速 $c = \frac{1}{\sqrt{\mu_0 \epsilon_0}}$

平面电磁波

平面波

至此,我们已经推导出电磁波的波动方程,然后需要根据E,B满足的边界和初始条件来求解微分方程。解的形式有多种:平面波、球面波以及柱面波。 平面波 指电场或磁场在与传播方向正交的平面上各点具有相同值的波。

沿z方向传播的平面电磁波

考虑一种特殊情况,电磁波只沿着一个方向传播(例如 $+z$)。对于沿着$z$方向传播的平面电磁波,其 $\mathbf{E}$ $\mathbf{B}$均仅与$z,t$有关,与空间$x,y$ 无关,因此电磁场波动方程可以写为一维方向上的形式:

$\frac{\partial^2\mathbf B}{\partial z^2}-\frac{1}{v^2}\frac{\partial^2\mathbf B}{\partial t^2}=0\\\frac{\partial^2\mathbf E}{\partial z^2}-\frac{1}{v^2}\frac{\partial^2\mathbf E}{\partial t^2}=0$

其中 $v=1/\sqrt{\varepsilon\mu}$ 即光速 。我们最终可以将上式简化为一个常微分方程:

$\frac{d^2}{dz^2}E(z)+k^2E(z)=0$

其中 $k=\sqrt{\omega^2\mu\varepsilon}$

该方程是一个标准的简谐振动方程,解为正弦或余弦函数。

该方程的复数形式解为:


$$
E(z, t) = E_0 e^{i(kz - \omega t)}
$$

我们使用欧拉公式 $e^{i\theta} = \cos \theta + i \sin \theta$ 来分解它:


$$
E(z, t) = E_0 \left( \cos(kz - \omega t) + i \sin(kz - \omega t) \right)
$$

由于物理上我们只关心实数部分,所以实际的电场强度(平面波解)是:


$$
E(z, t) = \text{Re}(E_0 e^{i(kz - \omega t)}) = E_0 \cos(kz - \omega t)
$$

其中 每单位长度内的波数 $k=2\pi/\lambda$ ,波的 频率 $\nu=1/T=v/\lambda$角频率 $\omega=2\pi\nu$

在空间中以任意方向传播的平面波

更一般的,我们需要考虑在空间中以任意方向传播的平面波,波矢(或称波向量)是描述波的传播方向和波长的一个矢量量,记作 $\mathbf{k} = k \hat{z}$ 。:

$\mathbf E=\mathbf A\cos(kz'-\omega t)=\mathbf A\cos(\mathbf k·\mathbf r-\omega t)$

这里我们选取 波矢k 的方向作为新的坐标轴 $z'$ 的方向: $z'=k_0 \hat{z}$$k_0$ 是k的单位矢量,$\hat{z}$ 是平面波波面上任一点P的位置矢量,也写作 $\mathbf{r}$

平面波的波面是指波的相位相同的点的集合。

  • 因为波面是平面且垂直于波矢$\mathbf{k}$,所以称为“平面波”。

  • 平面波的波面在空间中是无限延伸的平面。

  • 方向余弦:对于一个波矢 $\mathbf{k}$,其方向可以用与坐标轴的夹角来描述。方向余弦是这些角的余弦值:

    • $\cos \alpha$ 是波矢 $\mathbf{k}$$x$ 轴的夹角余弦。

    • $\cos \beta$ 是波矢 $\mathbf{k}$$y$ 轴的夹角余弦。

    • $\cos \gamma$ 是波矢 $\mathbf{k}$$z$ 轴的夹角余弦。

展开得到方向余弦公式

$\mathbf E=\mathbf A\cos(\mathbf k·\mathbf r-\omega t)=\mathbf A\cos[k(x\cos\alpha+y\cos\beta+z\cos\gamma)-\omega t]$

复数波函数

在复数形式的平面简谐波波函数中:


$$
\mathbf{E} = \mathbf{A} \exp[\text{i}(\mathbf{k} \cdot \mathbf{r} - \omega t)]
$$

可以将其分为空间时间相关的两部分:

  1. 空间相关部分$\exp[\text{i}(\mathbf{k} \cdot \mathbf{r})]$

    • 这一部分描述了波在空间中的传播特性,与位置 $\mathbf{r}$ 相关。
  2. 时间相关部分$\exp[-\text{i}(\omega t)]$

    • 这一部分描述了波的时间演化,与时间 $t$ 相关。

为什么将空间和时间位相因子分离? 因为同一时间场振动的时间位相因子相同(仅由 $\omega,t$ 决定),因此我们只关心场振动的空间分布。

对于一个波矢量 k 平行于 xz 平面的平面简谐波,在 $z=0$ 的平面上方向余弦为 $(\cos\alpha,0,\cos\gamma)$ ,对应的复振幅分布为:

$\tilde{\mathbf E}=\mathbf A\exp(\text i\mathbf k·\mathbf r)=\mathbf A\exp(\text i kx\cos\alpha)$

平面电磁波是由电和磁构成,但是目前为止我们只讨论了电波,没有考虑磁波。为什么在光学中,通常只关注电磁波中的电场部分,而不太考虑磁场部分,这是因为电场作用更大:电场对物质中带电粒子的作用远大于磁场。这是因为电场直接作用于带电粒子,产生显著的力和位移。实验表明,电场是引起感光和视觉作用的主要因素。例如,照相底版的感光和视网膜的反应主要是由于电场的作用。

由于电场在光与物质的相互作用中更为重要,光学中通常将电场矢量 $\mathbf{E}$ 称为光矢量,并在分析光的振动性质时主要考虑电场。

因此,尽管电磁波包含电场和磁场两部分,但在光学研究中,电场的作用更为显著,所以通常只考虑电场。

给定波动方程


$$
\nabla^2 \mathbf{E} = \frac{1}{c^2} \frac{\partial^2 \mathbf{E}}{\partial t^2}
$$

$$
\nabla^2 \mathbf{B} = \frac{1}{c^2} \frac{\partial^2 \mathbf{B}}{\partial t^2}
$$

下面证明:

  1. 电场和磁场均垂直于传播方向。

  2. 在传播方向之外,电场与磁场相互垂直。

  3. 电场和磁场的振动具有相同的相位。

电磁波的横波性质

考虑电磁波沿着 $z$ 轴传播,假设电场 $\mathbf{E}$ 和磁场 $\mathbf{B}$ 仅有 $x$$y$ 方向的分量,即:


$$
\mathbf{E} = E_x(z, t) \hat{\mathbf{x}} + E_y(z, t) \hat{\mathbf{y}}
$$

$$
\mathbf{B} = B_x(z, t) \hat{\mathbf{x}} + B_y(z, t) \hat{\mathbf{y}}
$$

1. 电场与传播方向的正交性

根据高斯定律 $\nabla \cdot \mathbf{E} = 0$,在沿 $z$ 轴的传播中:


$$
\frac{\partial E_z}{\partial z} = 0
$$

由于我们假设电场无 $z$ 分量,则:


$$
E_z = 0
$$

因此,电场 $\mathbf{E}$ 与传播方向 $z$ 轴正交,即电磁波是横波。

2. 磁场与传播方向的正交性

同理,由高斯磁定律 $\nabla \cdot \mathbf{B} = 0$,得:


$$
\frac{\partial B_z}{\partial z} = 0
$$

假设磁场无 $z$ 分量,则:


$$
B_z = 0
$$

因此,磁场 $\mathbf{B}$ 也与传播方向 $z$ 轴正交。

3. 电场与磁场的相互垂直

利用法拉第电磁感应定律:


$$
\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}
$$

计算旋度 $\nabla \times \mathbf{E}$


$$
\nabla \times \mathbf{E} = \left( \frac{\partial E_y}{\partial z} - \frac{\partial E_z}{\partial y} \right) \hat{\mathbf{x}} + \left( \frac{\partial E_z}{\partial x} - \frac{\partial E_x}{\partial z} \right) \hat{\mathbf{y}} + \left( \frac{\partial E_x}{\partial y} - \frac{\partial E_y}{\partial x} \right) \hat{\mathbf{z}}
$$

由于 $E_z = 0$ 且电场仅随 $z$$t$ 变化,故:


$$
\nabla \times \mathbf{E} = \left( \frac{\partial E_y}{\partial z} \right) \hat{\mathbf{x}} - \left( \frac{\partial E_x}{\partial z} \right) \hat{\mathbf{y}}
$$

由法拉第定律:


$$
\left( \frac{\partial E_y}{\partial z} \right) \hat{\mathbf{x}} - \left( \frac{\partial E_x}{\partial z} \right) \hat{\mathbf{y}} = -\frac{\partial \mathbf{B}}{\partial t}
$$

同样,计算安培-麦克斯韦定律的旋度:


$$
\nabla \times \mathbf{B} = \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t}
$$

类似地:


$$
\nabla \times \mathbf{B} = \left( \frac{\partial B_y}{\partial z} \right) \hat{\mathbf{x}} - \left( \frac{\partial B_x}{\partial z} \right) \hat{\mathbf{y}}
$$

因此:


$$
\left( \frac{\partial B_y}{\partial z} \right) \hat{\mathbf{x}} - \left( \frac{\partial B_x}{\partial z} \right) \hat{\mathbf{y}} = \mu_0 \epsilon_0 \frac{\partial \mathbf{E}}{\partial t}
$$

将电场和磁场的关系代入,可以得到电场与磁场之间的正交关系。

4. 电场与磁场的相互垂直性

假设电场 $\mathbf{E}$ 沿 $x$ 轴方向,即:


$$
\mathbf{E} = E_x(z, t) \hat{\mathbf{x}}
$$

则根据法拉第定律:


$$
\frac{\partial E_x}{\partial z} \hat{\mathbf{y}} = -\frac{\partial \mathbf{B}}{\partial t}
$$

假设磁场 $\mathbf{B}$ 沿 $y$ 轴方向,有:


$$
\mathbf{B} = B_y(z, t) \hat{\mathbf{y}}
$$

因此:


$$
\frac{\partial E_x}{\partial z} = -\frac{\partial B_y}{\partial t}
$$

同样利用安培-麦克斯韦定律:


$$
\frac{\partial B_y}{\partial z} \hat{\mathbf{x}} = \mu_0 \epsilon_0 \frac{\partial E_x}{\partial t}
$$

这表明电场 $\mathbf{E}$ 和磁场 $\mathbf{B}$ 互相垂直,且随着传播方向 $z$ 轴的变化。

电场与磁场的同相性

从上述关系式中,我们可以进一步探讨电场和磁场的相位关系。

结合波动方程,假设解为简谐波形:


$$
E_x(z, t) = E_0 \cos(kz - \omega t + \phi_E)
$$

$$
B_y(z, t) = B_0 \cos(kz - \omega t + \phi_B)
$$

其中,$k$ 为波数,$\omega$ 为角频率,$\phi_E$$\phi_B$ 为相位常数。

根据法拉第定律:


$$
\frac{\partial E_x}{\partial z} = -E_0 k \sin(kz - \omega t + \phi_E) = -\frac{\partial B_y}{\partial t} = \omega B_0 \sin(kz - \omega t + \phi_B)
$$

比较两边的相位项,要求相位一致:


$$
\phi_E = \phi_B
$$

因此,电场和磁场同相。

沿z轴方向传播的平面电磁波

球面波和柱面波

球面波函数

一个点光源在真空中的光线传播的等相面是一个球面。

对于球面波,我们很难求出它的矢量表达式,因为空间上各点的场量与到源的距离和方向都相关,计算复杂。 一般在光学中常常忽略场的矢量性质,而把光波场的每一个正交分量孤立地看做标量场来简化计算 (例如忽略光的偏振)

具体是指将电场矢量 $\mathbf{E}$ 的每个分量(如 $E_x$, $E_y$, $E_z$)分别看作标量场来处理。

对于每个分量 $E_j$$j$ 可以是 $x$$y$$z$),满足标量波动方程:


$$
     \nabla^2 E_j - \frac{1}{v^2} \frac{\partial^2 E_j}{\partial t^2} = 0
$$

例如在计算衍射现象时,我们一般讨论的是标量衍射理论,对于大多数应用场景其精度已经足够。当然也可以利用矢量衍射理论,结果会更精确,但缺点是计算更加复杂。由于球面波具有对称性,我们只需要研究一个方向的电磁场变化规律就可以了解整个空间电磁场的分布情况。对于球面波来说,其振幅 $A_r$ 是随距离r变化的:

$E=\frac{A_1}{r}\exp[\text i(kr-\omega t)]$

球面波同样可以写成复振幅形式: $E=\frac{A_1}{r}\exp(\text i kr)\exp(-\text i\omega t)$ ,其中 $A_1$ 是单位距离处的波振幅。

柱面波函数

从狭缝发出的柱面波

柱面波 是具有无限长圆柱形波面的波。在光学中,通常利用单色平面波照明一个细长狭缝来获得接近于理想化的柱面光波。柱面波的波函数与球面波类似,推导过程同样利用光强度与单位面积、单位时间的关系:

$E=\frac{A_1}{\sqrt r}\exp[\text i(kr-\omega t)]$

边值关系

边值关系 处理的是光从一种介质到另一种介质的问题。由于两种介质的物理性质不同,在两种介质的分界面上电磁场量将是不连续的。

磁感、电感强度

分界面上的假想小圆柱体

根据麦克斯韦方程: $\oint B·d\sigma=0$ ,应用到上图中小圆柱体可得:

$\oint B·d\sigma=\oint_{顶}B·d\sigma+\oint_{底}B·d\sigma+\oint_{壁}B·d\sigma=0\\B_1·n_1\delta A+B_2·n_2\delta A+\iint_{壁}B·d\sigma=0$

我们取无穷小的小圆柱体来研究,面元 $\delta A$ 无穷小,因此磁感强度B可以看作一个常数。且由于圆柱体积无穷小,侧边壁面积也趋近于0,意味着公式中第三项趋近于0。因此上式可以简化为:

$n=n_1=-n_2\\n·(B_1-B_2)=0\rightarrow B_{1n}=B_{2n}$

这个式子表明在通过分界面时, 磁感强度B虽然整体发生了跃变,但它的法向分量却是连续的。

实际上,在静止或动态情况下,电磁场的边界条件由麦克斯韦方程组决定。对于磁场 $\mathbf{B}$ 和磁场强度 $\mathbf{H}$,其边界条件可以总结为:

  1. 磁感强度 $\mathbf{B}$ 的法向分量连续性

    
    $$
    \mathbf{B}_1 \cdot \mathbf{n} = \mathbf{B}_2 \cdot \mathbf{n}
    $$
    

    其中,$\mathbf{n}$ 是分界面的单位法向量,1 和 2 分别表示分界面两侧的介质。

  2. 磁场强度 $\mathbf{H}$ 的切向分量连续性(若无自由电流):

    
    $$
    \mathbf{H}_1 \times \mathbf{n} = \mathbf{H}_2 \times \mathbf{n}
    $$
    

    这意味着在无自由电流的情况下,$\mathbf{H}$ 的切向分量是连续的。

解释

磁感强度 $\mathbf{B}$ 的法向分量在分界面上是连续的,这可以通过高斯磁场定律(Gauss’s Law for Magnetism)来理解:


$$
\nabla \cdot \mathbf{B} = 0
$$

高斯定理应用于一个包围在分界面周围的高斯面,可以得到:


$$
\oint \mathbf{B} \cdot d\mathbf{A} = 0
$$

这表明没有单极磁荷存在,磁感强度的净通量为零。因此,在分界面上,尽管 $\mathbf{B}$ 的整体可能发生跃变,不同介质中的 $\mathbf{B}$ 必须以相同的法向分量相匹配,以确保净通量为零。

虽然 $\mathbf{B}$ 的法向分量连续,但其切向分量可能因介质磁导率(permeability)不同而发生变化。这导致了 $\mathbf{B}$ 在分界面上的整体跃变。换句话说,$\mathbf{B}$切向分量不必连续,因此 $\mathbf{B}$ 全矢量可能出现跃变。

电场、磁场强度

分界面上的假想长方形面积

根据麦克斯韦方程 $\oint E·dl=-\iint\frac{\partial B}{\partial t}d\sigma$ ,应用到上图中分界面上的长方形中,可以得到:

$\oint E·dl=(\int_{AB}+\int_{BC}+\int_{CD}+\int_{DA})E·dl=-\iint\frac{\partial B}{\partial t}d\sigma$

当长方形 ABCD 面积区域时,边长趋于零,边界上的电场强度 E 可以看作常数,右侧积分也趋于零。因此:

$\int_{AB}E·dl+\int_{CD}E·dl=0\\ E_1·t_1\delta l+E_2·t_2\delta l=0$

进一步推导可以得到: $(E_1-E_2)·t=0\rightarrow E_{1t}=E_{2t}$

上式表明分界面上电场强度的切向分量连续,同理,磁场强度满足类似的结论。综上,边值关系可以总括为: $\begin{cases} n·(B_1-B_2)=0\\ n·(D_1-D_2)=0\\ n\times(E_1-E_2)=0\\ n\times(H_1-H_2)=0\\ \end{cases}$简而言之,在两种介质的分界面上电磁场量整个是不连续的。 但在界面没有自由面电荷和面电流的情况下 ,B,D的法向分量及E,H的切向分量则是连续的。之所以看起来B和H的边值关系“相反”,是因为它们分别强调了磁场的不同方面和在物质界面上的行为:

  • B的法向连续性反映了磁通的守恒,即磁场线在进入或离开物质时的连续性。

  • H的切向连续性反映了磁场的驱动源(电流)在界面上的连续作用。

光在介质分界面的反射和折射

我们在生活中会观察到反射和透射:

  • 反射:光线遇到介质边界时,返回到原介质的现象。

  • 特征:反射角等于入射角。

  • 透射:光线穿过介质边界进入另一种介质的现象。

  • 特征:光线在进入新介质时会发生折射,改变传播方向。

菲涅耳公式给出了几何上的定量描述。

菲涅耳公式

具体来说,菲涅耳公式有两种情况:平行偏振光和垂直偏振光。

光的偏振方向通常指的是电场矢量的方向

gh

垂直偏振光(s偏振)

对于垂直于入射面偏振的光,反射和透射系数分别为:

反射系数:


$$
r_s = \frac{n_1 \cos \theta_i - n_2 \cos \theta_t}{n_1 \cos \theta_i + n_2 \cos \theta_t}
$$

透射系数:


$$
t_s = \frac{2n_1 \cos \theta_i}{n_1 \cos \theta_i + n_2 \cos \theta_t}
$$

平行偏振光(p偏振)

对于平行于入射面偏振的光,反射和透射系数分别为:

反射系数:


$$
r_p = \frac{n_2 \cos \theta_i - n_1 \cos \theta_t}{n_2 \cos \theta_i + n_1 \cos \theta_t}
$$

透射系数:


$$
t_p = \frac{2n_1 \cos \theta_i}{n_2 \cos \theta_i + n_1 \cos \theta_t}
$$
  • $n_1$$n_2$ 分别是入射介质和透射介质的折射率。

  • $\theta_i$ 是入射角。

  • $\theta_t$ 是折射角,通过斯涅尔定律 $n_1 \sin \theta_i = n_2 \sin \theta_t$ 计算。

反射率(反射光强度与入射光强度之比)是反射系数的平方。透射率(透射光强度与入射光强度之比)是透射系数的平方。

菲涅耳公式讨论

下面分别对 $n_1 (光疏介质到光密介质)和 $n_1>n_2$ (光密介质到光疏介质)两种情况进行讨论。首先讨论第一种情况,假设光从空气射向玻璃( $n_1=1,n_2=1.5$ ),根据菲涅耳公式可以画出反射系数和透射系数与入射角之间的关系,如下图。

此时s波的反射系数总是负的,因此入射波和反射波振动方向总是相反,即存在 $\pi$ 的位相跃变。p波的反射系数变化稍微复杂一些,会从负数变化为正数,中间存在一个入射角度会导致p波反射系数为零,也就是反射波不存在p分量,这个角度被称为 布儒斯特角 ,也称为 起偏角

半波损失: 当平面波在接近 正入射或掠入射 下从光疏介质与光密介质的分界面反射时,反射光振动相对于入射光振动发生了 $\pi$ 的位相跃变,意即反射时损失了半个波长。原因是在界面上,电场的相位必须满足连续性条件。当光从光疏介质反射回去时,电场矢量方向发生反转,导致相位变化,但振幅大小不变。

如果从光密到光疏介质( $n_1>n_2$ ),随着入射角的增大,有可能发生全反射现象,对应的角度为临界角(critical angle)。

光密到光疏介质反射系数随入射角的变化

布儒斯特定律

布儒斯特定律(Brewster’s Law)描述了光在介质表面反射和折射时的偏振现象。根据布儒斯特定律,当光以特定角度入射到介质表面时,反射光完全偏振。这个特定的入射角称为布儒斯特角。


$$
\tan(\theta_B) = \frac{n_2}{n_1}
$$

其中:

  • $\theta_B$ 是布儒斯特角。

  • $n_1$ 是入射介质的折射率。

  • $n_2$ 是折射介质的折射率。

全反射

在全反射时,我们无法求出任何实数的折射角 $\theta_2$ ,根据折射定律:

$\begin{equation} \sin\theta_2=\frac{n_1}{n_2}\sin\theta_1=\frac{\sin\theta_1}{n}\\ \cos\theta_2=±\text{i}\sqrt{\frac{\sin^2\theta_1}{n^2}-1} \end{equation}$

将上两式带入菲涅耳公式中可以得到此时s波的反射系数和p波的反射系数:

$\begin{equation} r_s=\frac{\cos\theta_1-i\sqrt{\sin^2\theta_1-n^2}}{\cos\theta_1+i\sqrt{\sin^2\theta_1-n^2}}\\ r_p=\frac{n^2\cos\theta_1-i\sqrt{\sin^2\theta_1-n^2}}{n^2\cos\theta_1+i\sqrt{\sin^2\theta_1-n^2}} \end{equation}$

因此反射系数在全反射时是复数,因此可以进一步写为:

$\begin{equation} r_s=|r_s|\exp(i\delta_s)\\ r_p=|r_p|\exp(i\delta_p) \end{equation}$其中复数的 ( $|r_s|,|r_p|$ )表示 反射波和入射波的实振幅之比 ,而复数的辐角( $\delta_s,\delta_p$ )表示反射时的位相变化。根据定义可以得到 $|r_s|=|r_p|=1$ ,也就是在全反射时反射系数为1,不存在折射光。此时,反射光中s波和p波有一位相差 $\delta$ :

$\tan\frac \delta 2 =\tan\frac{\delta_s-\delta_p}{2}=\frac{\cos\theta_1\sqrt{\sin^2\theta_1-n^2}}{\sin^2\theta_1}$

根据该公式可知,我们可以通过调整入射角来调整s,p波分量的位相差。因此,全反射可以使得非偏振光产生偏振光。 全反射时没有光能损失,很多光学器件利用全反射来改变光的传播方向。虽然反射镜也能通过镀膜来提高反射率,但是这种反射率的提高依赖于镀膜的性质,也就是对波长比较敏感。可能会随着环境的变换导致反射率的降低。通过全反射改变光的传播方向对光波长没有限制,且不需要镀膜,单纯利用晶体(玻璃)也不易损坏。

倏逝波

全反射时,光并非完全在界面处反射,而是透射入介质2中约一个波长的距离,并沿界面传播一小段距离,最后返回介质1。透入介质2表面的波,振幅在z方向上指数衰减,称为 倏逝波 。通常定义振幅减小到界面(z=0)出振幅的1/e的深度为 穿透深度

$z_0=\frac{n}{k_2\sqrt{\sin^2\theta_1-n^2}}$

其中穿透深度 $z_0$ 约为一个波长,且随着入射角的增加而减小,因此刚好达到全反射临界角时产生的倏逝波穿透深度最深。还有研究表明,倏逝波将会在介质界面处有一个侧向位移,称为 古斯-汉森位移 ,是全反射时反射光位相跃变的原因。

古斯汉欣位移产生的原因,或者说如何解释这种现象?

光的吸收和散射

这一部分可以参考下面两篇文章:

潘安:Pan Group生物光子学讲义(二):光与物质相互作用YUNEZ:光与组织的相互作用

叠加原理

叠加原理是线性系统中的基本原理之一,指出在系统中,多个独立作用的效果可以通过将各个效果逐一叠加得到总效果。对于物理系统,尤其是波动现象,叠加原理具有广泛的应用。

当光波场强很大时,介质对光波的响应是 非线性的 ,述叠加原理不再适用。

两列光的叠加 (Superposition of Two Light Beams)

在光学中,光可以被视为电磁波,其电场可以表示为矢量场。考虑两列光束的叠加,每一列光束的电场可以表示为:


$$
\mathbf{E}_1 = \mathbf{E}_{01} \cos(\omega t + \phi_1)
$$

$$
\mathbf{E}_2 = \mathbf{E}_{02} \cos(\omega t + \phi_2)
$$

其中:

  • $\mathbf{E}_{01}$$\mathbf{E}_{02}$ 是两光束的振幅矢量 (amplitude vectors)。

  • $\omega$ 是角频率 (angular frequency)。

  • $\phi_1$$\phi_2$ 是初相位 (initial phases)。

根据叠加原理,叠加后的总电场为:


$$
\mathbf{E}_{\text{总}} = \mathbf{E}_1 + \mathbf{E}_2 = \mathbf{E}_{01} \cos(\omega t + \phi_1) + \mathbf{E}_{02} \cos(\omega t + \phi_2)
$$

不同叠加条件下的光学现象

两列光的叠加条件主要取决于它们的相位关系及振幅关系。以下表格总结了不同叠加条件下产生的主要光学现象。

叠加条件 相位差 $\Delta \phi = \phi_2 - \phi_1$ 振幅关系 $\frac{E_{02}}{E_{01}}$ 光学现象 解释
完全相干叠加 (Fully Coherent Superposition) 固定相位差 任意 干涉条纹 (Interference Fringe) 由于相位差固定,光波在空间上某些点发生构造性干涉 (Constructive Interference) 或破坏性干涉 (Destructive Interference),形成明显的干涉条纹。
部分相干叠加 (Partially Coherent Superposition) 随机相位差 任意 模糊干涉 (Fringe Blurring) 相位差随时间或空间变化,干涉条纹变得模糊或不明显,因为相干保持时间或区域有限。
非相干叠加 (Incoherent Superposition) 相位差随机且不相关 任意 无明显干涉 相位差完全随机,无法形成稳定的干涉条纹,只有强度的简单叠加,光强显示为两光束强度的代数和。
等振幅且同频率 (Equal Amplitudes and Same Frequency) $\Delta \phi = 0$ (相位相同) $\frac{E_{02}}{E_{01}} = 1$ 完全构造性干涉 两光束振幅相同且相位一致,电场叠加时最大加强,形成明纹 (Bright Fringe)。
等振幅且相位相反 (Equal Amplitudes and Opposite Phase) $\Delta \phi = \pi$ (相位相反) $\frac{E_{02}}{E_{01}} = 1$ 完全破坏性干涉 两光束振幅相同但相位相反,电场相互抵消,形成暗纹 (Dark Fringe)。
不同振幅且固定相位差 (Different Amplitudes with Fixed Phase Difference) 固定 $\Delta \phi$ $\frac{E_{02}}{E_{01}} \neq 1$ 干涉条纹不对称 振幅不等导致干涉条纹的强度不对称,条纹亮度和对比度取决于振幅比和相位差。

同频率光波叠加

振动方向相同

假设两个频率相同(同为 $\omega$ ),振动方向相同的单色光波分别发自光源 $S_1,S_2$ ,并且在 $P$ 点相遇,则在 $P$ 点的光波叠加为:

$\begin{align} E&=E_1+E_2=a_1\cos(kr_1-\omega t)+a_2\cos(kr_2-\omega t)\\&=a_1\cos(\alpha_1-\omega t)+a_2\cos(\alpha_2-\omega t)\\ \end{align}$

最后利用三角函数公式化简为: $E=A\cos(\alpha-\omega t)\quad \tan\alpha=\frac{a_1\sin\alpha_1+a_2\sin\alpha_2}{a_1\cos\alpha_1+a_2\cos\alpha_2}$

由上式可知,P点处两束光波叠加后波的振动频率、方向都与单色光波相同。只有振幅A和初相位α发生变化。如果两单色光波在P点的振幅相等( $a_1=a_2=a$ ),则P点的合振幅为: $A^2=a^2+a^2+2a·a\cos(\alpha_2-\alpha_1)=4a^2\cos^2\frac{\delta}2=I=4I_0\cos^2\frac{\delta}2$其中 $I_0=a^2$ 是单个光波的强度, $\delta=\alpha_2-\alpha_1$ 是两束光波的 相位差。 $\lambda_0$ 是光在真空中的波长, $\lambda$ 是光在介质中的波长, $\lambda=\lambda_0/n$ 。因此我们可以知道,叠加后的振幅只和单个光波的强度和两列光波的相位差有关:

  • $\delta=±2m\pi$ 时, $I=4I_0$ P点振动光强有最大值

  • $\delta=±(m+\frac12)2\pi$ 时, $I=0$ P点振动光强有最小值

  • $\delta$ 位于两者之间时,P点光强介于0和 $4I_0$ 之间。

相位差 $\delta$ 还可以表示为:

$\delta=\alpha_2-\alpha_1=k(r_2-r_1)=\frac{2\pi}{\lambda}(r_2-r_1)=\frac{2\pi}{\lambda_0}n(r_2-r_1)$这样表示相位差的好处是我们可以通过距离r来得到该位置的合振幅强度信息,距离是一个更直观的物理量也便于直接测量,而相位差比较抽象。

这里还需要提到 光程 的定义:就是光波在某一介质中所通过的几何路程和介质折射率的乘积, $n·r$ 。其好处是把光在不同介质中的传播路程都折算为在真空中的传播路程,便于比较。相位差中的 $n(r_2-r_1)$ 就是光程差。

光程

根据光程差的定义,我们可以将影响P点光强的因此从相位差转换为光程差:

教材里还提到了 复数形式的叠加 以及 相幅矢量加法 ,得到的结论和上述公式一致,这里不再重复整理。

  • 驻波

驻波要求两列光波 振动方向相同频率相同传播方向相反。 考虑垂直入射到两种介质分界面的单色光波与反射波叠加,产生驻波。反射面z=0,z的正方向指向入射波所在的介质(折射率为 $n_1$ ),反射面背后介质的折射率为 $n_2$ [如下图]。

驻波

已知在垂直入射的情况下,如果从光疏到光密介质,即 $n_1 时,入射波和反射波存在 $\pi$ 的相位突变,此时叠加波的表达式为:

$\begin{align} E&=E_1+E_1'=a\cos(kz+\omega t)+a\cos(kz-\omega t+\delta)\\&=2a\cos(kz+\frac{\delta}2)\cos(\omega t-\frac{\delta}2) \end{align}$

其中 $2a\cos(kz+\frac{\delta}2)$ 与位置z相关,而 $\cos(\omega t-\frac{\delta}2)$ 与位置z无关,因此在某些特定的位置,波的振幅可以始终为零,只要满足条件: $\cos(kz+\frac{\delta}2)=0$ 。上式意味着叠加波不会在 z 方向上传播,故称为驻波。

振动方向垂直

参考文献

Tyalmath:工程光学(四)——光的偏振

从偏振性的角度来说,光可以分为 自然光部分偏振光偏振光 (包括线偏振光、圆偏振光、椭圆偏振光)。

  • 椭圆偏振光

对于椭圆偏振光,两个方向的分量为:

$\begin{cases}E_x(t)=A_x\cos(-\omega t)\\E_y(t)=A_y\cos\left(-\omega t\pm\cfrac{\pi}{2}\right)\end{cases}$

由下图可知,在某些特殊条件下椭圆偏振光可以转变为线偏光( $\delta=0,\pi$ )或者圆偏光( $\delta=\pi/2$ )。圆偏光的光矢量的大小不变,但方向却随时间改变。

位相差δ取不同值时的椭圆偏振

  • 左旋和右旋

根据旋转方向的不同,可以将椭圆(圆)偏振光分为右旋和左旋两种。一般规定当沿着光传播方向看去,合矢量是顺时针方向旋转时,偏振光为右旋,反之为左旋。

  • 利用全反射产生(椭)圆偏振光

我们还可以利用线偏振光在介质分界面上的全反射来产生椭圆偏振光,其原理是:全反射后垂直于入射面振动的s波和平行于入射面振动的p波之间有一个位相差δ,叠加后成为椭圆偏振光。

$\tan\frac \delta 2 =\tan\frac{\delta_s-\delta_p}{2}=\frac{\cos\theta_1\sqrt{\sin^2\theta_1-n^2}}{\sin^2\theta_1}$

菲涅耳菱体 可以使线偏振光转换为圆偏振光,只要满足特定的入射角度。

菲涅耳菱体

如果想要从非偏振光来获取偏振光,还可以利用 偏振分光镜(PBS) 。反射光和折射光中的s波和p波的反射系数和透射系数都是不同的,这就意味着反射和折射都会改变光的偏振态,特别是当光在光疏-光密界面以布儒斯特角入射时, 反射光 是振动方向垂直于入射面的 线偏振光 ,而 折射光 则是偏振度很高的 部分偏振光 .

偏振分光镜

  1. 上图中分别是 高折射率 的硫化锌膜层和 低折射率 的冰晶石膜层

  2. 为了得到更大的偏振度,需要注意选择材料的折射率, 使各分界面上均以布儒斯特角入射

  3. 另外对于膜层的厚度应该使上下表面反射的光满足干涉加强的条件

不同频率光波叠加

光拍

两个在同一方向上传播的振动方向相同,振幅相等而频率相差很小的单色光波叠加将产生光学上有意义的 “拍” 现象。从公式上来看:

$\begin{align} E&=E_1+E_2=a[\cos(k_1z-\omega_1t)+\cos(k_2z-\omega_2t)]\\&=2a\cos\frac12[(k_1+k_2)z-(\omega_1+\omega_2)t]\cos\frac12[(k_1-k_2)z-(\omega_1-\omega_2)t] \end{align}$

引入平均角频率 $\overline\omega$ 和平均波数 $\overline k$ :

$\overline\omega=\frac12(\omega_1+\omega_2),\quad \overline k=\frac12(k_1+k_2)$

以及调制频率 $\omega_m$ 和调制波数 $k_m$ :

$\omega_m=\frac12(\omega_1-\omega_2),\quad k_m=\frac12(k_1-k_2)$

因此 $E=2a\cos(k_mz-\omega_mt)\cos(\overline kz-\overline \omega t)=A\cos(\overline kz-\overline\omega t)$

上式表明,合成波可以看成一个频率为 $\overline\omega$ 而振幅受到调制的波。下图中的图a表示两个单色波,图b是合成波,图c是合成波振幅的变化曲线。由于光波的频率很高,若 $\omega_1\approx\omega_2$ ,则 $\overline\omega\gg\omega_m$ ,因而振幅A变化缓慢而场振动E变化极快(图b,c)。

如果我们分析合成波的强度:

$\begin{align} I=A^2&=4a^2\cos^2(k_mz-\omega_mt)\\ &=2a^2[1+\cos2(k_mz-\omega_zt)] \end{align}$

合成波强度变化曲线如图d,这种强度时大时小的现象称为

群速度和相速度

之前谈及的单色光波的传播速度都是相速度,对于合成波而言:

$E=2a\cos(k_mz-\omega_mt)\cos(\overline kz-\overline \omega t)=A\cos(\overline kz-\overline\omega t)$包含两种传播速度, 等相面的传播速度等幅面的传播速度 。前者就是这个合成波的相速度,后者是振幅恒值点的移动速度,即群速度。

根据定义,相速度是等相面的传播速度,因此由位相不变条件 $\overline k z-\overline\omega t=\text{常数}$ 求出, 相速度 为:

$v=\overline \omega/\overline k$

而群速度是振幅恒值点的移动速度,即图c中振幅调制包络的移动速度。由振幅不变条件 $k_mz-\omega_mt=\text{常数}$ 可以求出, 群速度 为:

$v_g=\frac{\omega_m}{k_m}=\frac{\omega_1-\omega_2}{k_1-k_2}=\frac{\Delta\omega}{\Delta k}$

如上图中的Figure 7.19所示,反常色散介质似乎会在共振频率处折射率明显下降,导致群速度和相速度的关系发生变化。

干涉方法

相干条件

光的干涉强调的是光波稳定的叠加,产生 稳定的光强的强弱分布(干涉条纹) 。任意两束光波的简单叠加并不总能产生干涉条纹,因此干涉的产生需要满足一定的条件,如下:

  1. 频率相同

  2. 振动方向相同(有相同方向的分量即可)

  3. 相位差恒定

  4. 两光波的光程差不能超过波列长度,否则两光波将不能相遇(隐含条件)

相干条件的证明过程就是对两束光的叠加进行分析,然后根据干涉的本质是光波稳定的叠加推导出相干条件。

干涉手段

  • 分波前法

相干性较弱的两个独立普通光源发出的光不会发生干涉,只有同一光源发出的光才可能发生干涉。因此,我们需要人为地从同一光源中分出两束光波。一种方法是让光波通过并排的两个小孔或利用反射和折射方法把光波的波前分割为两个部分,称为 分波前法

分波前法

  • 分振幅法

让一束光透射到透明媒质的分界面上,光能流一部分透射、一部分反射,再分别通过光具组,使反射和透射光发生交叠。 由于这些光都是从同一列光分得的,所以是相干的。因为能流正比于复振幅的模平方,而相干涉的光是将原入射光的能量(振幅)分为几部分得到的,因此被称为 分振幅法

分振幅法

需要注意的是,分波前法只适用于足够小的光源,而分振幅法则可以使用扩展光源。此外,我们还需要确保两束光波的光程差小于光波的波列长度,否则两个波列无法在空间上顺利相遇,就更不用谈干涉了。

杨氏干涉实验

杨氏干涉实验是利用分波前法产生干涉的最著名的例子,实验装置如下图,S是一个受到光源照明的小孔,从S发散出的光波射在光屏A的两个小孔 $S_1,S_2$ ,两个小孔距离很近,且到S等距。

杨氏实验装置

干涉图样计算

干涉的本质还是光波的叠加,因此两个小孔发出的光在屏幕E上一点P叠加产生的光强为:

$I=I_1+I_2+2\sqrt{I_1I_2}\cos\delta$

其中 $I_1,I_2$ 分别是两束光波在屏幕上的强度, $\delta$ 是位相差。如果两个小孔大小相同,则 $I_1=I_2=I_0$ 。P点处叠加光波的位相差只依赖于 $S_1,S_2$ 到点P的光程差,因此位相差为: $\delta=2\pi\frac{n(r_2-r_1)}{\lambda}$ 。综上,P点的光强表达式为:

$I=2I_0+2I_0\cos\left[ 2\pi\frac{r_2-r_1}{\lambda}\right]=4I_0\cos^2\left[\frac{\pi(r_2-r_1)}{\lambda}\right]$

由上式可知,P点的光强取决于 $S_1,S_2$ 到P的光程差:

  1. $P$ 点满足: $\Delta d=r_2-r_1=m\lambda\quad m=0,±1,±2,\dots$ ,光强有极大值 $I=4I_0$

  2. $P$ 点满足: $\Delta d=r_2-r_1=\left(m+\frac12\right)\lambda\quad m=0,±1,±2,\dots$ ,光强有极大值 $I=0$

  3. 其余点的光强度处于0到 $4I_0$ 之间

屏幕上极大强度点的位置决定于条件: $x=\frac{mD\lambda}{d}$ ,极小值点为 $x=(m+\frac 12)\frac{D\lambda}{d}$ 。因此 条纹间距 为:

$e=\frac{mD\lambda}{d}-\frac{(m-1)D\lambda}{d}=\frac{D\lambda}{d}$

干涉条纹的强度变化规律为: $I=4I_0\cos^2\left[ \frac{\pi xd}{\lambda D} \right]$ ,强度分布曲线如下图,沿着x轴呈余弦平方变化。

干涉条纹变化曲线

从公式 $I=4I_0\cos^2\left[ \frac{\pi xd}{\lambda D} \right]$ 中我们还能得到一些结论:

  1. $x$ 相同时为同一条纹,即当 $S_1,S_2$ 沿 $x$ 轴排布时,形成的条纹是竖的(同一条纹沿 $y$ 轴上下延伸)。

  2. $r_1,r_2$ 的夹角 $w$ 称为相干光的 会聚角 ,在 $d\ll D;x,y\ll D$ 的情况下, $w\approx d/D$ ,条纹间距e与会聚角w成反比,也就是说,两狭缝的间距越小,形成的干涉条纹间距越大。

  3. 条纹间距与光波波长成正比,波长较长的光,其条纹较疏。因此用白光做实验,屏幕上只有零级条纹是白色。

等光程面

实际要想得到上述的干涉图样,需要满足 $d\ll D$ ,并且在z轴附近的小范围内观察。我们在推导杨氏双缝干涉的结论时,使用了这两个约束条件来简化计算。此外,如果我们改变屏幕放置的位置,也可能无法得到等间距的直线条纹。

条纹对比度

基于杨氏干涉实验进行分析,已知光强 $I=I_1+I_2+2\sqrt{I_1I_2}\cos\delta$ ,其中 $I_1,I_2$ 是固定不变的,而后一项在空间中呈周期性变化,称为 干涉项 。当 $I_1=I_2=I_0$ 时,理论上 $I$ 的最小值为零,最大值为 $4I_0$ ,这就是明暗条纹的本质。但实际上,条纹的光强并不能像理想条件下那样达到0或者 $4I_0$ ,为了评价干涉的效果,提出 条纹对比度K 的概念:

$K=\frac{I_M-I_m}{I_M+I_m}$

  1. $I_m=0$ ,此时 $K=1$ ,完全相干

  2. $I_M=I_m$ ,此时 $K=0$ ,非相干

  3. 一般情况, $0 ,部分相干

其中 $I_M$ 为实际观测到的光强极大值, $I_m$ 为极小值。条纹对比度主要与三个因素有关: 光源大小光源非单色性 和两相干光波的 振幅比

光源大小的影响

实际中并不存在理想的点光源,而是具有一定尺寸的 拓展光源 。拓展光源相当于大量点光源的组合,因此干涉装置会产生若干对相干点光源,每一对相干点光源在干涉场中都可以产生一组条纹。由于点光源的位置不同,各组干涉条纹间存在位移,如下图。这样将导致暗条纹的强度不再为零,条纹的对比度下降。当光源大到一定程度时,对比度可以下降到零,干涉条纹完全消失。

多组条纹叠加

  • 临界宽度

当对比度下降到零时的光源宽度就是 临界宽度

首先假设光源只有两个发光点S’和S,这两个点光源会分别在屏幕上产生干涉条纹,条纹间距相等但彼此之间存在位移。点光源S在 $P_0$ 处是亮点,但S’在 $P_0$ 处的强度取决于光程差 $S'S_2-S'S_1$

光源只包含两个点光源时的杨氏干涉

如果 $S'S_2-S'S_1=\frac 12\lambda$ ,此时两组干涉条纹之间刚好发生半个波长的位移(上图中的虚线和实线)。这两组条纹叠加后在屏幕上的强度处处相等,因此干涉现象完全消失。

然后考虑现实中普遍存在的扩展光源, 具有一定尺寸的扩展光源可以看成一系列不同位置点光源的叠加 。如上述讨论的一组点光源的情况,如果扩展光源的边缘点S’和两狭缝 $S_1,S_2$ 的光程差为 $\lambda/2$ ,此时S’和S产生的干涉条纹均匀叠加后不再具有条纹。此时光源的宽度为 $S'S''=b_c$ ,被称为 临界宽度 。基于此,我们可以将扩展光源分解成若干相距 $b_c/2$ 的点光源对,每一对点光源产生的干涉条纹在屏幕上叠加后都不再形成干涉。

扩展光源的双缝干涉

最后根据上述光路示意图中的几何关系可以推导出临界宽度的公式:

$b_c=\lambda l/d=\lambda/\beta$

其中 $\beta=d/l$ 称为 干涉孔径

  • 条纹对比度随光源大小的变化

条纹对比度公式为:

${K=\Big|\frac{\lambda}{\pi b\beta}\sin\frac{\pi b\beta}{\lambda}\Big|}$

该公式的推导过程省略,主要思路是将扩展光源中的点光源在衍射屏上的光强进行积分。将条纹对比度K视作光源宽度b的函数,并绘制如下。第一个零值对应 $b=\lambda/\beta$ ,此时的光源宽度为临界宽度。一般认为光源宽度不超过临界宽度的1/4,条纹的对比度仍是很好的,此时 $K\geq 0.9$ ,对应的光源宽度称为 许可宽度 $b_p=b_c/4=\lambda/4\beta$

条纹对比度K随光源大小b的变化

光源非单色性

现实中的光源并不是理想的单色光,具有一定光谱宽度 $\Delta\lambda$ 。不同波长的光会各自生成不同组的干涉条纹,彼此之间可能存在位移,导致条纹对比度下降。

  • 相干长度 :如下图(a)所示,两个不同波长光产生的条纹彼此之间存在位移,这个位移量随着光程差的增加而增加,条纹对比度也因此而下降直至零。因此光源的光谱宽度会限制能产生清晰条纹的光程差范围。对于光谱宽度为 $\Delta \lambda$ 的光源,能产生干涉条纹的最大光程差 $L=\frac{\lambda^2}{\Delta\lambda}$ 。上式表明, 相干长度与光源的光谱宽度成反比 。光源的光谱宽度越小,就能够在更大的光程差下观察到干涉条纹。

光源非单色性对条纹的影响

  • 相干时间 :光通过相干长度所需的时间 $L=c·\Delta t$

振幅比的影响

从条纹对比度公式来看,最直接的影响因素就是两束相干光的光强。当两束光的振幅不等时:

$K=\frac{2\sqrt{I_1}\sqrt{I_2}}{I_1+I_2}=\frac{2(I_1/I_2)^{1/2}}{1+I_1/I_2}=\frac{2(A_1/A_2)}{1+(A_1/A_2)^2}$

此时两束光的振幅 $A_1,A_2$ 差距越大,K值越小。也就是说当两束光的振幅差距过大时,干涉现象不明显。利用这个公式,可以把干涉场强表示为: $I=I_t\left( 1+K\cos\delta \right)$

其中 $I_t=I_1+I_2=A_1^2+A_2^2$ ,上式表明干涉条纹的光强分布不仅与位相差 $\delta$ 有关,还和光的振幅比有关(K反应振幅)。

相干性理论

借用参考文献中的一张图:

平行平板干涉

对于前面讨论的分波前法产生的干涉,需要考虑光场的空间相干性,一般采用宽度很小的光源,但是这样带来一个问题,干涉条纹的亮度不够。 分振幅法 是利用平板的两个表面对入射光的反射和透射,使入射光的振幅分解为两个部分,因此可以采用拓展光源得到更加清晰的条纹(亮度更高)。

条纹的定域

如图3.33,如果观察 $\beta\ne 0$ 的条纹,这依然是 分波前 干涉。在全空间内都可以看到条纹(不同位置看到的是不同β产生的条纹),因此也称为 非定域干涉 ,当然这只是理想点光源的情况。此外,依然面临b与β的矛盾。随着扩展光源宽度的增加,空间不同区域干涉场的对比度下降,下降程度不同。

但存在一个特殊的区域,其条纹对比度始终不下降,称此区域为定域中心,这里的条纹便是 定域条纹 ,这个区域在无穷远处(或者说透镜的后焦面),而此处 $\beta=0$ ,这正是 分振幅干涉 。所以说分振幅干涉就是实现 $\beta=0$ 的干涉,这就避免了β与b的矛盾。而干涉条纹的本质是等光程差点的轨迹,在这里光程差的不同是由与光对平板的入射角的不同造成的,相同的入射角产生相同的条纹,故称 等倾条纹。 产生的条纹是圆环形条纹,而圆环是源于点光源发出的球面波的“球面”这个性质向二维平面的投影造成的。

等倾条纹

对于图3.34中的情况,光源S发出的一束光经过平行平板的两个界面反射形成两束光。两束光的光程差即折线段ABC的长度:

$\Delta D=2nh\cos\theta_2+\frac{\lambda}{2}$

后一项是由于从平板两表面反射的两支光中有一束光发生“ 半波损失 ”,因此需要添加附加光程差 $\lambda/2$ 。由上述公式可知,光程差取决于入射角 $\theta_2$ 。也就是说,具有相同入射角(倾角)的光束共同决定一种干涉条纹,因此称为 等倾干涉条纹

干涉信号的强度表达式为: $I=I_1+I_2+2\sqrt{I_1I_2}\cos\frac{2\pi \Delta l}{\lambda}$ ,因此:

  1. $\color{red}{\Delta=m\lambda}$ 时出现 亮条纹 $(m=0,1,2,\cdots)$

  2. $\color{red}{\Delta=\Big(m+\frac{1}{2}\Big)\lambda}$ 时出现 暗条纹 $(m=0,1,2,\cdots)$ .

如上图所示,等倾条纹的位置只与形成条纹的光束的人射角有关,与光源的位置无关,并且呈现圆环状。因此,光源的扩大,只会增加干涉条纹的强度,并不会影响条纹的对比度。

楔形平板干涉

定域面的位置

楔形平板类似平行平板,也可以产生非定域干涉和定域干涉。

  • 非定域条纹 :如下图3.41,点光源S进行照明,此时对于平板任一点P都有两列发自光源S的相干光到达。所以在平板外空间任意地方放置一个观察屏幕都可以观察到干涉条纹,也就是 非定域条纹

  • 定域条纹 :如图3.42,如果光源S是一个扩展光源,由于光源的空间相干性,只能在定域面及其附近看到干涉条纹,具体原因参考上文中对于光源宽度、干涉孔径和干涉条纹对比度的讨论。

定域深度 是指干涉条纹并非只在定域面上能看见,定域面附近也可以。定域深度的大小和光源宽度成反比,光源宽度越大,定域深度越小;反之,光源越小,定域深度越大。光源为点光源时,定域深度无限大,干涉变为非定域的。此外,定域深度也与干涉装置本身有关,例如对于非常薄的平板或薄膜,则不论观察点P在何处,对应的干涉孔径实际上都很小,因此干涉定域的深度很大。

等厚干涉

观察板上等厚条纹的一种实用系统

$\Delta D=2nh\cos\theta_2+\frac{\lambda}{2}$

如果楔形平板的折射率n是均匀的,且光束的入射角 $\cos\theta_2$ 为常数,譬如光源距平板较远或观察干涉条纹用的仪器的孔径很小,以致在整个视场内光束的入射角可视为常数,则由上式可知,两支反射光在相交点P的光程差只依赖于反射光反射处平板的厚度h,因此干涉条纹与平板上厚度相同点的轨迹(等厚线)相对应。

迈克尔逊干涉仪

参考文献

(a)迈克尔逊干涉仪(b) 干涉仪的平面视图

迈克尔逊干涉仪的基本构造包括光源、分束器、两个反射镜(一个固定,一个可移动),以及一个观察屏或探测器。光源发出的光被分束器分成两束,这两束光分别传向两个反射镜,反射后再次被分束器合并。由于路径长度的不同,两束光在合并时会发生干涉,形成干涉条纹。详细内容可以参考一下两篇文

傅立叶变换光谱仪

参考文献

马赫-泽德干涉仪

参考文献

马赫-泽德干涉仪和迈克尔逊干涉仪是两种常用的光学仪器,用于测量光的相干性和相位变化,但各有不同的设计和应用。马赫-泽德干涉仪通过一个分束器将光束分成两个独立的光路,这两条路径在经过不同的路程后再通过另一个分束器合并,使得光路可以完全独立地调整和修改,适用于需要高灵敏度和精细调节的科研、传感器和通信领域。迈克尔逊干涉仪则通过一个分束器分出两条光路,这两条光路在一个共同点合并并产生干涉,其中一条光路通常固定,另一条可以调节长度,适用于天文学、基础物理实验等需要简单可靠设备的场合。两者在光路设计、应用场景、灵敏度和操作复杂性上有显著的区别,具体选择哪种干涉仪取决于实验的具体需求和预期结果。

平行平板的多光束干涉

干涉场强度公式

如下图所示,实际情况中入射光在介质中发生多次反射和透射,然后利用透镜将反射光和透射光会聚起来。如同平行平板产生的两光束干涉一样,相邻两束光的光程差为: $\Delta l=2nh\cos\theta$ ,位相差为: $\delta=\frac{4\pi}{\lambda}nh\cos\theta$ .

反射光干涉场的光强分布公式(证明过程略):

$I_r=A_r·A_r^*=\frac{4R\sin^2\frac{\delta}{2}}{(1-R)^2+4R\sin^2\frac{\delta}{2}}I_i$

透射光干涉场的光强分布公式:

$I_t=A_t·A_t^*=\frac{T^2}{(1-R)^2+4R\sin^2\frac{\delta}2}I_i$

其中表面反射率R和透射率T之间满足关系: $T=1-R$

条纹精细度

引入 精细度系数 这个概念,为了方便后续的讨论: $F=\frac{4R}{(1-R)^2}$

根据精细度系数,我们可以将反射光、透射光的光强分布公式写为:

$\frac{I_r}{I_i}=\frac{F\sin^2\frac{\delta}2}{1+F\sin^2\frac{\delta}2},\quad \frac{I_t}{I_i}=\frac{1}{1+F\sin^2\frac{\delta}2}$

因此 $\frac{I_r}{I_i}+\frac{I_t}{I_i}=1$ ,证明 反射光和透射光的干涉条纹互补 ,即反射光干涉条纹为亮条纹时,透射光对应的干涉条纹为暗条纹,反之亦然。至于形成亮、暗条纹的条件,需要考虑相位差 $\delta$ 。当反射率R很小的时候,精细度系数F远小于1,此时的干涉条纹强度分布可以近似为:

$\frac{I_r}{I_i}\approx F\sin^2\frac{\delta}{2}=\frac F 2\left( 1-\cos\delta \right),\quad \frac{I_t}{I_i}\approx 1-F\sin^2\frac{\delta}{2}=1-\frac{F}{2}\left( 1-\cos\delta \right)$

近似后的公式与两光束干涉光强分布形式相似, 说明反射率R很小时只需要考虑头两束光的干涉 。此外,还引入了 锐度 这一概念来描述多光束干涉极为明锐的特征。条纹的锐度用条纹的位相差半宽度来表示,详见物理光学教材。

法布里-珀罗干涉仪

参考文献

利用多光束干涉原理最重要的仪器就是法布里-珀罗干涉仪,也记作 F-P干涉仪 ,如下图所示。F-P干涉仪由两块平行的平面玻璃板或石英板组成,板内侧镀了可以提高反射率的膜。

F-P干涉仪

F-P干涉仪可以用来测量波长相差很小的两条光谱线的波长差,一般的仪器,如棱镜和光栅光谱仪无法分开。此外,F-P干涉仪的主体还可以作为 激光器的谐振腔 ,光在两个平行平板之间来回反射,通过激活介质不断被放大,最后形成激光输出。

惠更斯—菲涅耳原理

惠更斯原理

惠更斯提出了一种解释光波在空间中传播机制的模型:认为 波前上的每一点都是一个次级波源 ,发出的球面子波形成新的波前。这个原理可以解释光通过小孔时的衍射现象,因为孔径外也有光传播到。然而, 惠更斯原理是定性而非定量的, 无法用来计算衍射光波的振幅,这是其局限性。

惠更斯原理

惠更斯-菲涅耳原理

为了定量描述衍射图样的光强分布,菲涅耳考虑到惠更斯子波都来自同一光源,应该是相干的。因此在计算波前外任意一点的光振动时,可以用波前上所有子波相干叠加来表示。

点光源S对P点的作用

如上图所示,计算单色光源S对空间中一点P的作用。根据 惠更斯-菲涅耳原理 ,选取半径为R的球面波作为波前,球面波上任意一点Q的复振幅为:

$\tilde{E}_Q=\frac{A}{R}\exp(ikR)$

在Q点选取面元 $d\sigma$ ,按照菲涅尔的假设,面元 $d\sigma$ 发出的子波在P点产生的复振幅与面元上点的复振幅、相对于P点的倾斜度K(θ)、面元大小有关。K(θ)表示子波的振幅随面元法线与QP夹角θ的变化,θ称为 衍射角。 因此面元 $d\sigma$ 在P点产生的复振幅可以表示为:

$d\tilde{E}(P)=CK(\theta)\frac{A\exp(ikR)}{R}\frac{\exp(ikr)}{r}d\sigma$

其中C是一常数,菲涅耳还假设倾斜因子K随着θ的增大而减小,当 $\theta\geq\pi/2$ 时, $K=0$ 。基于这样的假设( 虽然后续证明该假设是错误的 ),只有波面ZZ’这一部分产生的子波对点P处的振动有贡献:

$\begin{align} \tilde{E}(P)&=\frac{CA\exp(ikR)}{R}\iint_{\sum}\frac{\exp(ikr)}{r}K(\theta)d\sigma\\ &=C\tilde E_Q\iint_{\Sigma}\frac{\exp(ikr)}{r}K(\theta)d\sigma \end{align}$

上式就是惠更斯-菲涅耳原理的 菲涅耳表达式 ,原则上可以利用该公式计算任意形状的孔径或屏障的衍射问题,只要对波面完成积分,就可以得到P点的振幅和强度。实际上,该公式还能进一步推广:

$\begin{align} \tilde{E}(P)=C\iint_{\Sigma}\tilde E\left( Q \right)\frac{\exp(ikr)}{r}K(\theta)d\sigma \end{align}$

其含义是除了选择波面进行积分,其实可以选择S、P之间的任何曲面或平面。相应的,因为曲面上各点的振幅和相位都是不同的,需要将复振幅改写为 $\tilde{E}\left( Q \right)$ ,表示和Q点位置相关。

基尔霍夫衍射理论

亥姆霍兹-基尔霍夫积分定理

根据菲涅耳理论计算得到的衍射结果与实验数据高度一致,但该理论本身不够精确。例如,引入的倾斜因子缺乏理论支持,且未给出具体的公式。基尔霍夫对菲涅耳理论进行了完善,基于波动方程推导出了惠更斯-菲涅耳原理的数学表达式,并明确了倾斜因子的具体形式。然而,基尔霍夫理论仅适用于标量波的衍射,因此被称为 标量衍射理论

  • 标量理论vs矢量理论 :标量衍射理论将光波视为标量波,主要关注振幅和相位,其计算简单,适用于大多数传统光学问题。相比之下,矢量衍射理论进一步考虑了光的矢量性质,包括偏振和传播方向。

Note:下文中曲面 $S_o$ 在公式中写为 $∑’$$S_i$ 记为 $\sum'_\varepsilon$

假设一束单色光通过闭合曲面 $S_o$ 传播,电磁场的任一直角分量的复振幅满足 亥姆赫兹方程

$\nabla^2\tilde{E}+k^2\tilde{E}=0$

标量衍射理论不考虑电磁场其他分量的影响,孤立地把 $\tilde{E}$ 看成一个标量场,并用曲面上的 $\tilde{E},\frac{\partial\tilde{E}}{\partial n}$ 来表示曲面内任一点的 $\tilde{E}$ 。我们可以利用 格林定理 可以把 $\tilde{E}$ 和曲面上的值联系起来,假定 $\tilde{E}$ 与另一位置坐标的 任意复函数 $\tilde{G}$ 在曲面 $S_o$ 上和内均有连续一阶和二阶偏微商,则由格林定理有:

$\iiint_V(\tilde G\nabla^2\tilde E-\tilde E\nabla^2\tilde G)dv=\iint_{Σ'}\left( \tilde G\frac{\partial\tilde E}{\partial n}-\tilde E\frac{\partial\tilde G}{\partial n} \right)d\sigma$

式中V为闭合曲面 $S_o$ 所包围的体积, $\frac{\partial }{\partial n}$ 表示在曲面上每一点沿外法线方向的偏微商。上式的证明思路为:通过散度公式 $\unicode{8751}\vec{F} \cdot \mathbf{d}\sigma =\iiint \nabla\cdot \vec{F} \mathbf{d}v$ 证明,分别取 $\vec{F} =\tilde{G} \nabla\tilde{E} $$\vec{F} =\tilde{E} \nabla\tilde{G}$ ,利用恒等式 $\nabla \cdot\left ( \tilde{G} \nabla\tilde{E} \right ) =\nabla\tilde{G} \cdot \nabla\tilde{E}+G\nabla^{2}\tilde{E}$ 化简,再两式相减即可证明。

如果函数 $\tilde G$ 也满足亥姆霍兹方程,则:

$\nabla^2\tilde G+k^2\tilde G=0\Rightarrow\iint_{\Sigma'}\left( \tilde G\frac{\partial\tilde E}{\partial n}-\tilde E\frac{\partial\tilde G}{\partial n} \right)d\sigma=0$

根据 $\tilde G$ 所满足的条件,选取 $\tilde G$ 为球面波的波函数: $\tilde G=\frac{\exp(ikr)}{r}$ 。r是曲面 $S_o$ 内考察点 $P$ 与曲面上任一点Q之间的距离。由于r=0时,格林函数G不连续且值无穷大,不满足格林定理的成立条件,需要将P点从积分域中去掉。处理方法是以P点为圆心选取一个半径为ε的小球,取积分域为复合曲面 $S_o+S_i$ ,因此:

$\iint_{\Sigma'+\Sigma'_\varepsilon}\left( \tilde G\frac{\partial\tilde E}{\partial n}-\tilde E\frac{\partial\tilde G}{\partial n} \right)d\sigma=0$格林函数G只是一个辅助函数,不一定要选取球面波的波函数,也可以选择别的函数。最后推导得到 亥姆霍兹-基尔霍夫积分定理

$\tilde E(P)=\frac{1}{4\pi}\iint_{\Sigma'} \left\{ \frac{\partial\tilde E}{\partial n}\left[ \frac{\exp(ikr)}{r}\right]-\tilde E\frac{\partial}{\partial n}\left[ \frac{\exp(ikr)}{r}\right]\right\}d\sigma$

详细的推导过程可以参考下面这篇文章:Irasfel:标量衍射理论公式推导

简而言之,基尔霍夫积分定理的意义在于将封闭面内任一点的电磁场 $\tilde E(P)$ 用曲面上的场值 $\tilde E$$\frac{\partial\tilde E}{\partial n}$ 来表示。

菲涅耳-基尔霍夫衍射公式

相较于惠更斯-菲涅耳原理的表达式,亥姆霍兹-基尔霍夫积分定理的形式比较抽象。菲涅耳-基尔霍夫衍射公式将该积分定理简化为与菲涅耳表达式类似的形式。

球面波在孔径Σ上的衍射

如上图所示,我们依然考虑单色点光源S发出的球面波,对一个无限大不透明屏上的孔径Σ进行照明,分析此时孔径右侧一点P处的场值。可以利用上一节得到的亥姆霍兹-基尔霍夫积分定理计算P点的场值,首先需要选取一个包围P点的闭合曲面,由 $\Sigma,\Sigma_1,\Sigma_2$ 三部分组成,根据公式可以得到:

$\tilde E(P)=\frac 1{4\pi}\iint_{\Sigma+\Sigma_1+\Sigma_2}\left\{ \frac{\partial\tilde E}{\partial n}\left[ \frac{\exp(ikr)}{r}\right] - \tilde E\frac{\partial}{\partial n}\left[ \frac{\exp(ikr)}{r} \right] \right\}d\sigma$

我们需要考虑如何确定其中的 $\tilde E,\frac{\partial \tilde E}{\partial n}$ 这两项的值,最好是能够用简单的形式来近似表达。选取 $\Sigma,\Sigma_1,\Sigma_2$ 这三个面共同组成的封闭曲面作为积分面,先对 $\Sigma,\Sigma_1$ 这两个形状类似的面进行处理。对于这两个面基尔霍夫假定:

  1. 在孔径Σ上, $\tilde E=\frac{A\exp(ikl)}{l},\frac{\partial \tilde E}{\partial n}=\cos(n,l)\left( ik-\frac{1}{l} \right)\frac{\exp(ikl)}{l}$ ,这两项的值都由从光源S发出的入射波决定,不透明屏对其不产生影响。

  2. 在不透明屏右侧曲面部分 $\Sigma_1$$\tilde E=\frac{\partial\tilde E}{\partial n}=0$

上述两条假设称为 基尔霍夫边界条件 ,这两个假设都是近似的。实际上不透明屏的存在会干扰孔径Σ上的场,尤其是在孔径边缘, $\Sigma_1$ 的场也并非处处为零。但是由于光的波长很小,而孔径的线度一般比波长大得多,所以使用基尔霍夫边界条件进行计算得到的结果与真实结果误差不大。然后考虑球面 $\Sigma_2$ ,根据 索末菲辐射条件 ,只要选取的球面半径足够大,就可以忽略球面对P点处场的影响!

综上,我们在计算时只需考虑孔径面Σ的积分,可以得到 菲涅耳-基尔霍夫衍射公式

$\tilde E(P)=\frac{A}{i\lambda}\iint_{\Sigma}\frac{\exp(ikl)}{l}\frac{\exp(ikr)}{r}\left[ \frac{\cos(n,r)-\cos(n,l)}{2} \right]d\sigma$

菲涅耳-基尔霍夫衍射公式在惠更斯-菲涅耳原理的基础上确定了一些待定系数的数学表达式:

$C=\frac 1{i\lambda},\quad \tilde E(\theta)=\frac{A\exp(ikl)}{l},\quad K(\theta)=\frac{\cos(n,r)-\cos(n,l)}{2}$

按照 惠更斯-菲涅耳原理 的基本思想来解释:某一点P处的场是由孔径Σ上无穷个虚设子波源产生,子波源的复振幅与入射波在该点的复振幅 $\tilde E(Q)$ 和倾斜因子 $K(\theta)$ 成正比,与波长λ成反比。因子 $\frac 1i=\exp\left(-i\frac \pi 2\right)$ 表明子波源的振动位相超前入射波90°。如果点光源S离孔径足够远,可以将入射光近似看作垂直入射到孔径的平面波,那么对于孔径上各点都有:

$\cos\left( n,l \right)=-1,\quad\cos\left( n,r \right)=\cos\theta$

因此倾斜因子满足: $K\left( \theta \right)=\frac{1+\cos\theta}{2}$ 。当 $\theta=\pi/2$ 时, $K\left( \theta \right)\neq 0$ ,说明菲涅尔关于子波的假设 $K\left( \pi/2 \right)=0$ 是不正确的。

菲涅耳衍射和夫琅禾费衍射

推荐先看视频:https://www.youtube.com/watch?v=rdlZ8KYVtPU

基本概念

在光学中,衍射现象是波动光学的重要内容,描述了光波在遇到障碍物或通过狭缝时的传播特性。根据不同的观察距离和光源条件,衍射可以分为菲涅耳衍射(Fresnel Diffraction)和夫琅禾费衍射(Fraunhofer Diffraction)。

如上图所示,单色平面光波垂直照明在不透明屏上的圆孔,在ABC三个区域内得到的衍射图样是不同的。

  1. A区内衍射现象不明显,近似 直线传播。 观察屏上是边缘清晰、形状大小都与圆孔相似的圆形光斑。

  2. B区内光斑逐渐变大,边缘模糊,光斑大小和形状都发生变化,称为 菲涅耳衍射(近场衍射)

  3. C区距离圆孔很远,在这个区域移动观察屏,屏上的衍射图样只有大小发生变化而形式不改变,属于 夫琅禾费衍射(远场衍射) 。C区距离一般远大于衍射圆孔的直径,因此通常把夫琅禾费衍射看成是在无穷远处的衍射。

菲涅耳衍射

菲涅耳衍射是指在有限距离内观察到的衍射现象,适用于光源到障碍物以及障碍物到观察屏之间的距离较近的情况。在这种情形下,光波的传播被视为球面波或近似球面波。

菲涅耳衍射的数学处理通常基于菲涅耳近似(Fresnel Approximation),即假设衍射场点与衍射物体之间的距离相对较小,可以利用泰勒展开对相位进行近似处理。这种近似使得积分计算更为简便,但仍能准确描述近程衍射现象。

菲涅耳衍射的复振幅可以表示为:


$$
U(P) = \frac{e^{ikR}}{i \lambda R} \int \int U(Q) \frac{e^{i k \frac{(x - x')^2 + (y - y')^2}{2R}}}{i \lambda R} dx' dy'
$$

其中,$U(P)$ 是点 $P$ 处的复振幅,$U(Q)$ 是障碍物上点 $Q$ 处的复振幅,$k$ 是波数,$\lambda$ 是波长,$R$ 是距离。

菲涅耳衍射适用于:

  • 光源与衍射物体之间的距离较近。

  • 衍射物体与观察屏之间的距离较近。

  • 波前具有明显的曲率。

夫琅禾费衍射

夫琅禾费衍射描述的是在无限远处或远场情况下观察到的衍射现象,适用于光源、障碍物和观察屏之间的距离都非常远的情况。此时,光波可以近似为平面波,且波前的曲率可以忽略。

夫琅禾费衍射等效于傅里叶变换(Fourier Transform),将衍射图样与物体的几何形状进行频域关系的转换。其复振幅通常表示为物体的傅里叶变换。


$$
U(P) = \frac{e^{ikR}}{i \lambda R} e^{i \frac{k}{2R}(x^2 + y^2)} \mathcal{F}\{U(Q)\}(f_x, f_y)
$$

其中,$\mathcal{F}\{U(Q)\}$ 表示物体函数 $U(Q)$ 的傅里叶变换,$f_x$$f_y$ 是空间频率。

夫琅禾费衍射适用于:

  • 光源与衍射物体之间的距离远大于其尺寸。

  • 衍射物体与观察屏之间的距离远大于其尺寸。

  • 波前可以近似为平面波。

菲涅耳衍射与夫琅禾费衍射的对比

特性 菲涅耳衍射 夫琅禾费衍射
观察距离 近场(有限距离) 远场(无限距离或远距离)
波前形态 球面波或近似球面波 平面波
数学处理 菲涅耳积分,基于菲涅耳近似 傅里叶变换,基于平面波近似
适用条件 光源、物体和观察点之间距离较近,波前曲率明显 光源、物体和观察点之间距离远,波前可视为平面波
应用领域 近场光学显微镜,激光近距离传播 远场成像,光学频谱分析,衍射光栅等
衍射图样 随距离变化,图样较为复杂 稳定的傅里叶变换图样,便于频域分析
计算复杂度 较高,需要考虑波前曲率及多项式近似 相对较低,可以利用傅里叶光学的简化处理
物理意义 考察波前在有限区域内的传播和干涉 研究波的整体频谱特性和远场传播行为

gh

傍轴近似

孔径Σ的衍射

考察无穷大的不透明屏上的孔径Σ对垂直入射的单色平面波的衍射。通常情况下,衍射孔径的线度远小于观察屏到孔径的距离,因此可以做出如下两点近似( 傍轴近似 ):

  1. $\cos\left( n,r \right)=\cos\theta\approx 1\Rightarrow K\left( \theta \right)\approx 1$ ,参考往前数第三张图。

  2. 孔径内Q点到观察屏上P点的距离r变化不大,可以近似为 $z_1$ 。复指数中的r会影响子波的位相,对于干涉至关重要,因此不能简单近似为 $z_1$

采取上述近似策略后得到P点的复振幅分布为:

$\tilde E(P)=\frac{1}{i\lambda z_1}\iint_{\Sigma}\frac{A\exp(ikl)}{l}\exp(ikr)d\sigma$

菲涅耳近似

复指数中的r虽然不能简单近似为 $z_1$ ,但是可以根据具体的衍射问题做更精确的近似。如上图对于孔径Σ的衍射,r可以表示为:

$r=\sqrt{z_1^2+(x-x_1)^2+(y-y_1)^2}=z_1 \left[ 1+\left( \frac{x-x_1}{z_1} \right)^2 + \left( \frac{y-y_1}{z_1} \right)^2\right]^{1/2}$

$(x_1,y_1)$ 为孔径平面上的点, $(x,y)$ 为观察平面上的点。根据泰勒展开公式:

$(1+x)^n=1+nx+\frac{n(n-1)}{2!}x^2+\frac{n(n-1)(n-2)}{3!}x^3+\dots$

可以将r改写为:

$r=z_1\left\{ 1+\frac12\left[ \frac{(x-x_1)^2+(y-y_1)^2}{z_1^2} \right] -\frac18\left[ \frac{(x-x_1)^2+(y-y_1)^2}{z_1^2} \right]^2+\dots\right\}$

这样分解的好处是我们可以根据实际情况和精度要求来选择r的近似项数。当 $z_1$ 大到使得r第3项之后的项对于位相 $kr$ 的作用远小于 $\pi$ 时,可以只选取前两项来近似r 。每当位相改变 $\pi$ 时指数函数反号,这种变化不可忽略。

$kz_1\frac18\left[ \frac{(x-x_1)^2+(y-y_1)^2}{z_1^2} \right]^2\ll \pi\Rightarrow z_1^3\gg\frac{1}{4\lambda}[(x-x_1)^2+(y-y_1)^2]_{\text{max}}^2$

此时r简化为:

$\begin{align} r&=z_1\left\{ 1+\frac12\left[ \frac{(x-x_1)^2+(y-y_1)^2}{z_1^2} \right] \right\}\\ &=z_1+\frac{(x-x_1)^2+(y-y_1)^2}{2z_1} \end{align}$

这样的近似就称为 菲涅耳近似 ,观察屏置于该区域得到的衍射现象就是菲涅耳衍射。在菲涅耳近似下,球面波位相因子的形式为:

$\exp(ikr)\approx \exp\left\{ ikz_1+\frac{ik}{2z_1}\left[ (x-x_1)^2+(y-y_1)^2 \right] \right\}$

将菲涅耳近似的位相因子代入衍射公式中可以得到:

$\tilde{E}(x,y)=\frac{\exp(ikz_1)}{i\lambda z_1}\iint_\sum\tilde E(x_1,y_1)\exp\left\{ \frac{ik}{2z_1}\left[ (x-x_1)^2+(y-y_1)^2 \right] \right\}dx_1dy_1$

菲涅耳近似适用于所谓的近场衍射,也就是观察点距离孔径不是非常远的情况。在菲涅耳近似中,相位项展开至二次项,这是因为在近场情况下,波前曲率和相位变化比较显著,需要保留二次项来较好地描述这些变化。

夫琅禾费近似

菲涅耳近似中将r进一步分解可以得到:

$r=z_1+\frac{x^2+y^2}{2z_1}-\frac{xx_1+yy_1}{z_1}+\frac{x_1^2+y_1^2}{2z_1}$

其中第2项和第4项分别取决于观察屏上的考察范围和孔径线度相对于 $z_1$ 的大小,当 $z_1$ 很大而使得第4项对位相的贡献远小于 $\pi$ 时,该项可以忽略。因此:

$z_1\gg \frac{(x_1^2+y_1^2)_{\text{max}}}{\lambda} \Rightarrow r\approx z_1+\frac{x^2+y^2}{2z_1}-\frac{xx_1+yy_1}{z_1}$

上述近似称为 夫琅禾费近似 ,带入傍轴近似的衍射公式可得夫琅禾费衍射公式:

从上述简化思路可以看出,夫琅禾费近似是在菲涅尔近似的基础上进行的,因此可以说夫琅禾费衍射是菲涅尔衍射的一种特殊情况,但是一般我们将其区分开。 夫琅禾费衍射计算相比菲涅尔衍射也更加简单,因为相位因子是关于坐标的线性函数,而菲涅尔衍射是二次函数

矩孔和单缝的夫琅禾费衍射

夫琅禾费装置

夫琅禾费衍射要求光源、观察屏到衍射屏的距离均为无限远(近似),即平行光入射、平行光出射。在实验中可以利用透镜变换来实现无限远的要求。如下图所示,单色点光源发出的光经过透镜1准直后垂直地投射到孔径Σ上,孔径Σ的夫琅禾费衍射在透镜2的后焦面上观察。

典型夫琅禾费衍射装置

夫琅禾费衍射公式的意义

夫琅禾费衍射光路

按照夫琅禾费衍射公式,透镜后焦面上一点P的复振幅为:

$\tilde E(x,y)=\frac Cf\exp\left[ ik\left( f+\frac{x^2+y^2}{2f} \right) \right]\iint_\sum \tilde E(x_1,y_1)\exp\left[ -i\frac kf(xx_1+yy_1) \right]dx_1dy_1$

其中 $C=1/i\lambda$$\tilde E(x_1,y_1)$ 是孔径内的复振幅分布。假定孔径受平面波垂直照明, $\tilde E(x_1,y_1)$ 是一个常数(可以设为1,也就是假设非透明区域对孔径内的复振幅没有影响)。

  • 复指数因子1: $\exp\left[ ik\left( f+\frac{x^2+y^2}{2f} \right) \right]$ 。在菲涅尔近似中,孔径面原点 $O_1$ 到P的距离是 $r\approx f+\frac{x^2+y^2}{2f}$ ,因此该因子的位相就是 $O_1$ 到P点的位相延迟(参考菲涅尔近似的球面波位相因子)。

  • 复指数因子2: $\exp\left[ -ik\left( \frac xfx_1+\frac yfy_1 \right) \right]$ ,其辐角实际上是代表孔径内一点Q和坐标原点 $O_1$ 发出的子波到P点的相位差。

如上图所示,计算复指数因子2的相位差可以先计算光程差,也就是 $D=O_1H=(O_1IP)-(QJP)$ 。当 $P$ 靠近 $P_0$ 时,在傍轴近似下:

$l=\sin\theta_x=\frac xr\approx\frac xf,\quad w=\sin\theta_y=\frac yr\approx\frac yf$

其中 $\theta_x,\theta_y$ 分别是 $O_1I$$x_1,y_1$ 轴的夹角,称为 二维衍射角 。因此光程差又可以表示为:

$D=O_1H=lx_1+wy_1=\frac xfx_1+\frac yfy_1$

可以将光程差转换为相位差: $\delta=kD=k\left( \frac xfx_1+\frac yfy_1 \right)$ 。说明P点的光场等于孔径面内各点发出的子波在方向余弦l和w方向上的叠加。叠加的结果又受到第一个复指数因子的调制,取决于各点发出的子波和坐标原点 $O_1$ 发出的子波相位差。

夫琅禾费衍射公式还有一个重要的含义 ,首先将其改写为下面的形式:

$\begin{align} \tilde E(x,y)&=\frac Cf\exp\left[ ik\left( f+\frac{x^2+y^2}{2f} \right) \right]\iint_{-\infty}^\infty \tilde E(x_1,y_1)\exp\left[ -ik(\frac xfx_1+\frac yf y_1) \right]dx_1dy_1\\ &=\frac Cf\exp\left[ ik\left( f+\frac{x^2+y^2}{2f} \right) \right]\iint_{-\infty}^\infty \tilde E(x_1,y_1)\exp\left[ -i2\pi(ux_1+vy_1) \right]dx_1dy_1 \end{align}$

积分范围拓展到无穷是因为孔径范围之外的 $\tilde E(x_1,y_1)=0$ ,令 $u=\frac x{\lambda f},v=\frac y{\lambda f}$ 。可以发现上述公式与二维傅里叶变换的形式很像,最后可以得出一个结论: 除了一个二次位相因子,夫琅禾费衍射的复振幅分布是衍射屏平面上复振幅分布的傅里叶变换

积分外 $\exp\left[ ik\left( f+\frac{x^2+y^2}{2f} \right) \right]$ 项可以分为 $\exp(ikf),\exp\left[ \frac{ik}{2f}(x^2+y^2) \right]$ 。前一项与x,y无关,因此在只考虑复振幅的相对分布时可以忽略,第二项与x,y有关。在计算夫琅禾费衍射的光强分布时,二次位相因子与自身的复共轭相乘时自动消失,不起作用。

矩孔衍射

矩孔衍射示意图

考虑如上图所示的一个长宽为a,b的矩形孔径,根据夫琅禾费衍射公式计算观察屏上一点P的复振幅。

$\begin{align} \tilde E&=C'\exp\left[ ik\left( \frac{x^2+y^2}{2f} \right) \right]\int_{-\frac a2}^{\frac a2}\int_{-\frac b2}^{\frac b2}\exp[-ik(lx_1+wy_1)]dx_1dy_1\\ &=C'\exp\left[ ik\left( \frac{x^2+y^2}{2f}\right)\right]\int_{-\frac a2}^{\frac a2}\exp(-iklx_1)dx_1\int_{-\frac b2}^{\frac b2}\exp(-ikwy_1)dy_1\\ &=C'ab\frac{\sin\frac{kla}2}{\frac{kla}2}\frac{\sin\frac{kwb}2}{\frac{kwb}2}\exp\left[ ik\left( \frac{x^2+y^2}{2f}\right) \right] \end{align}$

其中 $C'=\frac Cf\exp(ikf)$ ,用于简化公式形式。对于透镜光轴与观察屏的交点 $P_0$ 点( $x=y=0$ ),其复振幅满足 $\tilde E_0 = C'ab$ ,带入上式得到:

$\tilde E=\tilde E_0 \frac{\sin\frac{kla}2}{\frac{kla}2}\frac{\sin\frac{kwb}2}{\frac{kwb}2}\exp\left[ ik\left( \frac{x^2+y^2}{2f}\right) \right]$

P点强度为复共轭相乘:

$\begin{align} I&=\tilde E·\tilde E^*=I_0 \left( \frac{\sin\frac{kla}2}{\frac{kla}2} \right)^2 \left( \frac{\sin\frac{kwb}2}{\frac{kwb}2} \right)^2\\ &=I_0 \left( \frac{\sin\alpha}{\alpha} \right)^2 \left( \frac{\sin\beta}{\beta} \right)^2 \end{align}$

该公式为 夫琅禾费矩孔衍射的强度分布 ,二次位相因子与自身的复共轭乘积确实相互抵消。最终的强度分布与两个因子有关: $\alpha=kla/2,\beta=kwb/2$ 。前者依赖于坐标x或方向余弦l,后者依赖于坐标y或方向余弦w。考虑矩孔衍射在某一方向上的截面强度,例如x方向如下图。

矩孔衍射在x轴上的强度分布曲线

其中零强度点满足条件: $a\sin\theta_x=n\lambda$ ,因此相邻两个零强度点之间的距离与宽度a成反比。同样的,中央亮斑满足:

$a\sin\theta_x=±\lambda\quad b\sin\theta_y=±\lambda\Rightarrow x_0=±\frac \lambda af\quad y_0=±\frac\lambda bf$

由可见衍射扩展与矩孔宽度a,b成反比,与光波长λ成正比。 一般来说,在什么方向限制波动,波动就在什么方向上扩展,限制越严,扩展也就越强,称为一对限制和反限制的矛盾 。Matlab的矩孔夫琅禾费衍射仿真结果如下图所示:

单缝衍射

单缝衍射可以看作在一个方向上受到限制的矩孔衍射,例如假设 $b\gg a$ ,矩孔宽度在x方向受限。此时中央亮斑在y方向的宽度 $y_0=±\frac \lambda bf\ll x_0=±\frac \lambda a f$ ,即在y方向的衍射扩展远小于x方向,因此y方向的衍射几乎可以忽略,只能在观察屏上看到一条沿x方向延伸的线状干涉条纹。

单缝衍射的计算方法和矩孔衍射几乎一致,最终形式也类似。因为单缝衍射在一个方向上对衍射的贡献可以忽略不记,在积分时只需要对一条线进行积分(一重积分),而不用像矩孔衍射那样进行二重积分(x,y两个方向)。最后在x轴上得到的衍射强度分布为:

$I=I_0\left( \frac{\sin\alpha}{\alpha} \right)^2\quad \alpha=\frac{kla}2=\frac{ka}{2}\sin\theta$

其中的 $\left( \frac{\sin\alpha}{\alpha} \right)^2$ 被称为 单缝衍射因子 ,而矩孔衍射的相对强度是两个方向的单缝衍射因子的乘积。中央亮条纹区域集中了单缝衍射的绝大部分能量,在宽度上是其他亮条纹的两倍(可以简单看作两条亮纹连在了一起)。

接下来的内容参考了董春华老师的课件:

4-03.pdf (ustc.edu.cn)

第一点是狭缝上下移动并不会影响衍射图案的分布,如下图所示。这是因为相位差本质上是由波列方向决定的,相同的波列方向最后经过透镜后依然会汇聚到同一点。

透镜的移动会导致衍射图案发生变化,如下图所示。虽然此时波列方向不会发生变化,但是经过透镜汇聚后的点的位置与光轴的位置有关,此时透镜的光轴相较于狭缝的相对位置发生变化,从而导致衍射图案发生相对移动。透镜光轴可以说是系统的对称轴。

圆孔的夫琅禾费衍射

衍射强度

采用和之前类似的夫琅禾费衍射装置,只是将孔径形状替换为圆形,如下图所示。假定圆孔的半径为a,圆心位于光轴上。由于圆孔的圆对称性,在计算衍射强度分布时采用 极坐标方法

圆孔的夫琅禾费衍射

孔径平面上一点Q的坐标满足: $x_1=r_1\cos\psi_1,\quad y_1=r_1\cos\psi_1$ 。进一步将夫琅禾费衍射计算公式中的表达式都用极坐标替换:

$d\sigma=r_1dr_1d\psi_1,\quad \frac xf=\frac{r\cos\psi}{f}=\theta\cos\psi,\quad \frac yf=\frac{r\sin\psi}{f}=\theta\sin\psi$ 其中θ是衍射角(衍射方向OP与光轴的夹角),带入夫琅禾费衍射公式得到:

$\begin{align} \tilde E(P)&=C'\int_0^a\int_0^{2\pi}\exp[-ik(r_1\theta\cos\psi_1\cos\psi+r_1\theta\sin\psi_1\psi)]r_1dr_1d\psi_1\\ &=C'\int_0^a\int_0^{2\pi}\exp[-ikr_1\theta\cos(\psi_1-\psi)]r_1dr_1d\psi_1 \end{align}$

其中 $C'=\frac Cf\exp(ikf)$ ,矩孔衍射中也进行了这样的简化替换。另一个位相因子 $\exp\left[ ik \left( \frac{x^2+y^2}{2f} \right)\right]$ 会在计算强度分布是和自己的复共轭相乘抵消掉,这一点在之前的矩孔衍射中进行了说明。根据零阶贝塞尔函数的积分表达式:

$J_0(Z)=\frac 1{2\pi}\int_0^{2\pi}\exp(iZ\cos\psi)d\psi$

将其带入基础的衍射公式中得到基于贝塞尔函数的衍射公式:

$\tilde E(P)=C'\int_0^a2\pi J_0(-kr_1\theta)r_1dr_1=2\pi C'\int_0^aJ_0(kr_1\theta)r_1dr_1$

进一步的可以将P点的光强度表示为:

$I=\left( \pi a^2 \right)^2\left| C' \right|^2\left[ \frac{2J_1\left( ka\theta \right)}{ka\theta} \right]^2=I_0\left[ \frac{2J_1\left( Z \right)}{Z} \right]^2$

其中 $I_0$ 是轴上点 $P_0$ 的强度, $Z=ka\theta$上述公式描述了圆孔衍射的强度分布

衍射图样

根据圆孔衍射公式可知,P点的衍射强度与衍射角θ相关,已知 $\theta=r/f$ ,因此与r有关,与极角 $\psi$ 无关。只要r相同,当前位置的衍射强度就相同,所以圆孔衍射呈圆环状条纹。进一步探究强度的极小值和极大值,还是根据圆孔衍射公式可知,强度取决于Z以及贝塞尔函数。

从下图可以看出,圆孔衍射的相邻暗条纹间距并不相等,这一点和矩孔或单缝衍射不同。圆孔衍射图样的绝大部分光强依旧集中在中央亮斑中,这个亮斑被称为 艾里斑

艾里斑的半径 $r_0$ 与第一个暗环的Z值相对应,此时:

$Z=\frac{kar_0}{f}=1.22\pi\Rightarrow r_0=0.61f\frac{\lambda}{a}$

也可以角半径表示:

$\theta_0=r_0/f=0.61\lambda/a$

上述公式也称为 瑞利判据 ,用于确定两个衍射光斑恰好能区分的条件。同时可知圆孔衍射大小与圆孔半径成反比,与光波波长成正比。我们知道衍射现象是限制光学成像呈系统分辨率的核心因素,而孔径越大衍射现象越不明显,成像分辨率越高。关于光学显微镜的分辨率极限可以参考下面两篇博文:

但是博文中的分辨率极限和瑞利判据中的系数有0.61和0.5之分,0.61是根据夫琅禾费衍射衍射现象计算得到的,0.5似乎是基于现代成像技术进一步优化得到的系数,上述博文中有简单地讨论。

光学成像系统的衍射

成像系统中的衍射

在几何光学中,理想的光学系统(如完美的透镜或反射镜)被假设为能够将来自一个点物源的所有光线精确地汇聚到一个点上。这意味着在理论上,系统能够无误差地将物体的每一点映射成像平面上的对应点,无任何失真。然而,实际的光学系统无法达到这种理想状态。每个光学系统都有一个或多个光瞳(即光束入射和出射的光学元件的孔径),如透镜的孔径或光阑,这些光瞳限制了通过系统的光束的宽度和形状。

由于光的波动性,当光波通过有限尺寸的光瞳时,会发生衍射。衍射是波动光学中一个核心现象,它导致光波在穿过开口边缘后发散,形成衍射图案,而不是在一个完美的点上重新聚焦。这意味着即使物体上的一个点发出的光束完美地通过透镜,成像点也不会是一个理论上的“点”,而是以艾里斑的形式出现。

像面夫琅禾费衍射

之前讨论的夫琅禾费衍射都是近似平行光入射的情况,然后在透镜的焦面上进行观察。但是实际的光学成像系统更多是对近处而非无穷远处的点光源成像,因此我们需要确定此时在像面观察到的衍射像斑是否可以应用夫琅禾费衍射公式计算。

成像系统对近处点物成像

如上图所示,S是理想点,L代表成像系统,S’是成像系统对S所成的像,D是系统的孔径光阑。如果不考虑系统的像差和衍射效应,那么S’应该也是一个理想的点。用波动光学来描述就是,系统L将发自S的发散完美球面波改变为会聚与S’点的完美会聚球面波。但是孔径光阑D会限制会聚球面波,所以实际系统所成的像S’会是会聚球面波在孔径光阑D上的衍射光斑。虽然通常光阑面 $x_1y_1$ 到像面xy的距离R远比光阑的口径D要大,但一般还是不适用夫琅禾费衍射公式,而是要用菲涅尔衍射的计算(这一点是教材上提到的,算是一个经验规则)。按照前面整理的菲涅尔衍射公式,像面上的复振幅分布为:

$\tilde E(x,y)=\frac{\exp(ikR)}{i\lambda R}\iint_\sum\tilde E(x_1,y_1)\exp\left\{ \frac{ik}{2R}\left[ (x-x_1)^2+(y-y_1)^2 \right] \right\}dx_1dy_1$

其中Σ是光阑面,由于光阑受会聚球面波照明,所以光阑面复振幅为 $\tilde E(x_1,y_1)=\frac{A\exp(-ikr)}{r}$ 。在傍轴近似下,上式分母中的r在光阑范围内有 $r\approx R$ ,在菲涅耳近似下,球面波位相因子为:

$\exp(-ikr)\approx\exp\left[ -ik\left( R+\frac{x_1^2+y_1^2}{2R} \right) \right]$

因此光阑面复振幅为:

$\tilde E(x_1,y_1)=\frac AR\exp(-ikR)\exp\left[ -\frac{ik}{2R}(x_1^2+y_1^2) \right]$

最后得到像面上的衍射强度:

$\tilde E(x,y)=\frac{A'}{i\lambda R}\exp\left[ \frac{ik}{2R}(x^2+y^2) \right]\iint_\sum\exp\left[ -ik\left( \frac xRx_1+\frac yRy_1 \right) \right]dx_1dy_1$

再看看夫琅禾费衍射公式:

比较两个公式发现,只是将夫琅禾费衍射中的f用R代替了。这说明在像面上观察到近处点的衍射像也是孔径光阑的夫琅禾费衍射图样,同样可以用夫琅禾费衍射公式来计算。所以可以得到结论: 成像系统对理想点在像面上所成的像是夫琅禾费衍射图样。

成像系统分辨率

参考前面的公式,艾里斑的半径满足:

$r_0=l'\theta_0=1.22l'\lambda/D$

其中l’是像距,等效于焦距f。根据几何光学,成像满足阿贝正弦条件: $n\varepsilon\sin u=n'\varepsilon'\sin u'$ 。n,n’分别是物方和像方折射率,对于显微镜 $n'=1$$\sin u'\approx u'=\frac{D/2}{l'}$ (因为 $l'\gg D$ ),所以:

$\varepsilon=\frac{\varepsilon'\sin u'}{n\sin u}=1.22\frac{l'\lambda}{D}\frac{D/2l'}{n\sin u}=\frac{0.61\lambda}{n\sin u}$

这个时候计算得到的 $\varepsilon$ 就是物镜的最小分辨距离,小于这个距离的两个点在物镜成像之后就无法分清了,因为两个艾里斑彼此重叠。从这里的推导也可以看出,分辨率公式中的系数0.61与夫琅禾费衍射有关。

多缝夫琅禾费衍射

多缝夫琅禾费衍射装置

假设有一个如上图所示的多缝夫琅禾费衍射装置,多缝夫琅禾费衍射的强度分布本质上等于多个单缝衍射的独立叠加。省略详细的推导过程, P点的光强度公式满足 多缝衍射的强度分布公式

$I=I_0\left( \frac{\sin\alpha}{\alpha} \right)^2\left( \frac{\sin\frac{N\delta}{2}}{\sin\frac{\delta}{2}} \right)^2$

其中 $I_0=|\tilde E_0|^2$ 是单缝在 $P_0$ 点产生的光强度,位相差 $\delta=\frac{2\pi}{\lambda} d\sin\theta$$\alpha=\frac{kla}2=\frac{ka}{2}\sin\theta$ 。前一项为单缝衍射因子,后一项为多光束干涉因子。从多光束干涉因子可知,当位相差满足: $\delta=\frac{2\pi}{\lambda}d\sin\theta=2m\pi\quad m=0,±1,±2,\dots$

多光束干涉因子有极大值 $N^2$ ,被称为 主极大 。此外还受到单缝衍射因子的调制,因此各级的主极大的强度为: $I_m=N^2I_0\left( \frac{\sin\alpha}{\alpha} \right)^2$

由上式可知,各级主极大的相对强度与缝数N无关,只依赖于缝距d与缝宽a之比。

4缝衍射的强度分布曲线

平面波

复振幅

我们已知对于一个波矢量为k的单色平面波,其空间上的复振幅分布可以表示为:

$\begin{align} \tilde E\left( x,y,z \right)&=A\exp\left[ ik\left( x\cos\alpha+y\cos\beta+z\cos\gamma \right) \right]\\ &=A\exp\left[ i\frac{2\pi}{\lambda}\left( x\cos\alpha+y\cos\beta+z\cos\gamma \right) \right] \end{align}$

其中 $\cos\alpha,\cos\beta,\cos\gamma$ 是k的方向余弦。如果将矢量k限制在一个方向,平面波沿着坐标轴某一个方向传播,例如沿着z轴传播的平面波:

$\tilde E(z)=A\exp(i\frac{2\pi}{\lambda}z)$

波长λ是该函数的周期,周期的倒数是频率,因此1/λ表示复振幅在传播方向上单位长度内的重复次数(频率),也称为 空间频率

空间频率

波矢量k平行于xz平面的平面波

下面我们首先考虑当平面波波矢量k(平面波传播方向)平行于xz平面时的情况,如上图a所示。此时 $\cos\beta=0$ (上图c),在 $z=z_0$ 平面上对应的平面波复振幅分布为: $\begin{align} \tilde E(x)&=A\exp\left( i\frac{2\pi}{\lambda}z_0\cos\gamma \right)·\exp\left( i\frac{2\pi}{\lambda}x\cos\alpha \right)\\ &=A'\exp\left( i\frac{2\pi}{\lambda}x\cos\alpha \right) \end{align}$

其中 $A'=A\exp\left( i\frac{2\pi}{\lambda}z_0\cos\gamma \right)$ 是一个复常数,平面波的相位呈余弦式周期分布。等相位点的轨迹一系列与x轴平行的直线,其中相位相差2π的等相位线如上图b所示。这些等相位线的距离就是复振幅在平面上变化的 空间周期 $d_x$

$d_x=\frac{\lambda}{\cos\alpha}\Rightarrow u=\frac{1}{d_x}=\frac{\cos\alpha}{\lambda}$

在一个平面上的复振幅周期分布可以用空间周期表示,也可以用 空间频率 (u)来表示。在波矢量k平行于xz平面时,复振幅分布在y方向的空间频率为 $v=1/d_y=0$ ,说明复振幅在y方向上没有变化。如果考虑平面波波矢量k对应的方向余弦为 $(\cos\alpha,\cos\beta)$ ,那么平面上沿x、y方向的复振幅分布都是周期性的,空间周期为:

$d_x=\frac{\lambda}{\cos\alpha},d_y=\frac{\lambda}{\cos\beta}$

也可以根据公式 $k_x=2\pi u,k_y=2\pi v$ 将空间频率转换为 空间角频率

复杂复振幅分布

复振幅调制

当光在空间中自由传播,其复振幅分布为简单周期分布,可用复指数函数 $\exp[i2\pi(ux+vy)]$ 表示。但是如果光波通过一个光屏,例如有限大小的孔径或者光栅传播时,其复振幅将受到光屏透射能力的调制。

衍射屏对入射光波的调制作用取决于衍射屏的 复振幅透射系数(也称为屏函数) $\tilde t(x,y)$ ,如果入射光波的复振幅分布为 $\tilde U_1(x,y)$ ,透射光波的复振幅分布为 $\tilde U_2(x,y)$ ,则屏函数为:

$\tilde t(x,y)=\frac{\tilde U_2(x,y)}{\tilde U_1(x,y)}$

因为入射光和透射光都是复数,因此屏函数也是复数,可以分解为振幅和相位:

$\tilde t(x,y)=t(x,y)\exp[i\varphi_t(x,y)]$

其中t(x,y)是屏函数的振幅, $\varphi_t(x,y)$ 是屏函数的辐角(相位)。

透镜的透射系数

透镜是成像系统中重要的光学元件,如果忽略透镜对光能的吸收和反射损失,可以认为透镜只改变了入射光波的空间相位和分布,因此可以看作 相位型衍射屏

透镜改变入射光波位相的空间分布

如上图所示,单色光波从左向右入射,光波在紧贴透镜前和后的平面上的复振幅分别为:

$\begin{align} \tilde U_1(x,y)=A\exp[i\varphi_1(x,y)]\quad \tilde U_2(x,y)=A\exp[i\varphi_2(x,y)] \end{align}$

透镜引入的相位改变是 $\varphi(x,y)=\varphi_2(x,y)-\varphi_1(x,y)$ 。相位变化最直接的原因就是透镜引入了光程差,因此相位变化也可以表示为:

$\begin{align} \varphi(x,y)&=k[d_1+d_2+nd(x,y)]\\ &=k\left\{ d_1+d_2+n[d_0-(d_1+d_2)] \right\}\\ &=knd_0-k(n-1)(d_1+d_2) \end{align}$

又如下图所示, $d_1,d_2$ 和透镜前后表面的曲率半径 $R_1,R_2$ 有关,我们可以进一步的对相位变化的表达式进行改写。第一项 $knd_0$ 为常数项可以忽略。

由上图的几何关系可知: $d_1\approx \frac{x^2+y^2}{2R_1}\quad d_2\approx -\frac{x^2+y^2}{2R_2}$ 。代入相位变化量 $\varphi(x,y)$ 中可得:

$\varphi(x,y)=-k(n-1)(\frac{1}{R_1}-\frac{1}{R_2})\frac{x^2+y^2}{2}$

如果透镜是薄透镜,利用薄透镜焦距的公式: $\frac 1f=(n-1)(\frac 1{R_1}-\frac 1{R_2})$$\varphi$ 可以最终简化为:

$\varphi(x,y)=-k\frac{x^2+y^2}{2f}$

因此薄透镜的透射系数为:

$\tilde t(x,y)=\frac{\tilde U_2(x,y)}{\tilde U_1(x,y)}=\exp[i\varphi(x,y)]=\exp\left( -ik\frac{x^2+y^2}{2f} \right)$

透镜本身是有一定的孔径的,引入 光瞳函数P(x,y) 对透镜的有限孔径效应进行描述:

$P(x,y)=\begin{cases} 1 &\text{孔径内}\\ 0 &\text{孔径外}\\ \end{cases}\Rightarrow \tilde t=P(x,y)\exp\left( -ik\frac{x^2+y^2}{2f} \right)$

复振幅分解

根据傅里叶积分定理,可以将场 $\tilde E(x,y)$ 分解为无数个形式为 $\exp[i2\pi(ux+vy)]$ 的基元函数的线性组合:

$\begin{cases} \tilde E(x,y)=\iint_{-\infty}^\infty\tilde F(u,v)\exp[i2\pi(ux+vy)]dudv\\ \tilde F(u,v)=\iint_{-\infty}^{\infty}\tilde E(x,y)\exp[-i2\pi(ux+vy)]dxdy \end{cases}$

这里的 $\exp[i2\pi(ux+vy)]$ 表示一个传播方向余弦为 $(\cos\alpha=\lambda u,\cos\beta=\lambda v)$ 的单色平面波,而对光场复振幅 $\tilde E$ 分解的物理含义是: $\tilde E$ 可以看作不同方向传播的单色平面波分量的线性叠加,这些平面波分量的传播方向和频率(u,v)相对应,而振幅和相对相位取决于频谱分量 $\tilde F$

衍射的傅里叶分析

夫琅禾费孔径变换

在第5章中讨论了夫琅禾费近似下的衍射公式:

$\tilde U(x,y)=\frac{\exp(ikz_1)}{i\lambda z_1}\exp\left[ \frac{ik}{2z_1}(x^2+y^2) \right]\iint_{-\infty}^\infty\tilde E(x_1,y_1)\exp[-i2\pi(ux+vy)]dx_1dy_1$

其中空间频率 $u=\frac{x}{\lambda z_1},v=\frac{y}{\lambda z_1}$ 。除了积分号外的常数因子和空间相位因子外, 夫琅禾费衍射图样的强度分布可以看作孔径面上的复振幅分布的傅里叶变换

$I(x,y)=|\tilde U(x,y)|^2=|\mathscr{F}\left\{ \tilde E(x_1,y_1) \right\}|^2$

这里需要注意:当我们只关心衍射场的相对强度分布,即衍射图样的光强分布 $|U(x,y,z)|^2$ 时,积分号之外因子不会影响衍射强度的分布,因为它们在计算强度时数值为1( $|e^{i\theta}|=1$ )。

利用傅里叶变换公式,我们可以快速计算不同孔径下夫琅禾费衍射的强度分布。此外,对于衍射孔径在孔径平面上平移的情况,也可以利用傅里叶变换证明其只会在夫琅禾费衍射中引入一个相位移动,不会改变衍射图样的强度分布。

菲涅耳孔径变换

菲涅耳衍射的积分号内,除了表示孔径平面内的复振幅分布 $\tilde E(x_1,y_1)$ ,还有一个二次相位因子,因此菲涅耳衍射的结果不能看作 $\tilde E$ 的傅里叶变换。此外,菲涅尔衍射的场分布还和距离 $z_1$ (观察屏到孔径平面)有关,而夫琅禾费衍射则与距离无关。