3569 words

18 minutes

Amazing Proofs in Calculation and Linear Algebra

2026-04-27

ノート / Notes

院試 / Grad Prep

/

数学 / Math

线性代数核心矩阵性质总结#

1. 实对称矩阵的谱性质 (Spectral Properties of Real Symmetric Matrices)#

谱定理 (Spectral Theorem) 是线性代数的核心结论：若 $A \in \mathbb{R}^{n \times n}$ 且 $A = A^T$ ，则其特征值全为实数，且属于不同特征值的特征向量相互正交。

1.1 特征值的实数性证明#

设 $A$ 为实对称矩阵，满足 $Ax = \lambda x$ ( $x \neq 0$ )。考虑到特征值 $\lambda$ 和特征向量 $x$ 可能为复数：

左乘共轭转置： $\bar{x}^T A x = \lambda \bar{x}^T x \quad \dots \text{(1)}$
对原式取共轭转置： 由于 $A$ 是实对称矩阵，则 $A^H = \overline{A}^T = A^T = A$ 。 $(Ax)^H = (\lambda x)^H \implies \bar{x}^T A^H = \bar{\lambda} \bar{x}^T \implies \bar{x}^T A = \bar{\lambda} \bar{x}^T$
右乘 $x$ ： $\bar{x}^T A x = \bar{\lambda} \bar{x}^T x \quad \dots \text{(2)}$
联立 (1) 与 (2)： $\lambda \bar{x}^T x = \bar{\lambda} \bar{x}^T x$ 由于 $\bar{x}^T x = \|x\|^2 > 0$ ，可约去得： $\lambda = \bar{\lambda}$

结论： 特征值 $\lambda$ 等于其共轭，故 $\lambda$ 必为实数。

1.2 特征向量的正交性证明#

设 $Ax = \lambda_1 x$ ， $Ay = \lambda_2 y$ ，且 $\lambda_1 \neq \lambda_2$ ：

构造等式： $\lambda_1 x^T y = (Ax)^T y = x^T A^T y$
利用对称性： 由于 $A^T = A$ ，则： $x^T A^T y = x^T (Ay) = x^T (\lambda_2 y) = \lambda_2 x^T y$
得出关系： $\lambda_1 x^T y = \lambda_2 x^T y \implies (\lambda_1 - \lambda_2) x^T y = 0$

结论： 由于 $\lambda_1 \neq \lambda_2$ ，必有 $x^T y = 0$ ，即特征向量相互正交。

2. 正定矩阵的特征值性质 (Positive Definite Matrices)#

2.1 定义#

若对称矩阵 $A$ 满足对于任意 $x \neq 0$ ，均有： $x^T A x > 0$ 则称 $A$ 为正定矩阵。

2.2 特征值推导#

设 $\lambda$ 为 $A$ 的特征值，则 $Ax = \lambda x$ 。代入定义式： $x^T A x = x^T (\lambda x) = \lambda (x^T x) = \lambda \|x\|^2$ 由于正定定义要求 $x^T A x > 0$ 且已知 $\|x\|^2 > 0$ ： $\lambda = \frac{x^T A x}{\|x\|^2} > 0$

结论： 正定矩阵的所有特征值均严格大于 0。

3. 马尔可夫矩阵的特征值性质 (Markov Matrices)#

3.1 定义#

马尔可夫矩阵（列随机矩阵）满足：

所有元素非负： $m_{ij} \ge 0$ 。
每一列元素之和为 1： $\sum_{i=1}^n m_{ij} = 1$ 。

3.2 存在特征值 $\lambda = 1$ 的证明#

定义全 1 向量 $\mathbf{1} = [1, 1, \dots, 1]^T$ 。
根据列和为 1 的性质，有： $\mathbf{1}^T A = \mathbf{1}^T$
取转置得： $A^T \mathbf{1} = \mathbf{1}$ 这表明 $\mathbf{1}$ 是 $A^T$ 对应于特征值 1 的特征向量。
由于 $A$ 与 $A^T$ 具有相同的特征值。

结论： 马尔可夫矩阵必有特征值 $\lambda = 1$ 。

3.3 特征值范围 $|\lambda| \le 1$ #

若存在 $|\lambda| > 1$ ，考虑幂次迭代 $A^n x = \lambda^n x$ ：

当 $n \to \infty$ 时， $\lambda^n \to \infty$ 。
然而，马尔可夫过程代表概率分布的演变，概率向量的元素之和始终受限于 1，矩阵的范数受到约束，不可能发散。
更严谨的证明可使用 格尔什戈林圆盘定理 (Gershgorin Circle Theorem)。

3.4 物理意义与收敛性#

$\lambda = 1$ ： 对应系统的稳态 (Steady State)。
$|\lambda| < 1$ ： 对应过程中的衰减项。
长期行为： 随着时间推移（矩阵幂运算），非稳态成分逐渐消失： $A^n x_0 \to v_{\text{steady}}$ 结论： 系统最终会收敛到 $\lambda=1$ 对应的特征向量方向。

微积分极限总结#

多项式基础极限#

在微积分里有一个基础极限：对任意多项式 $P(n)$ ， $\lim_{n \to \infty} \sqrt[n]{P(n)} = 1$ 。这是一个非常经典的数学分析结论：对于任意最高次项系数为正的多项式 $P(n)$ ，其 $n$ 次根的极限为 $1$ ，即：

$\lim_{n \to \infty} \sqrt[n]{P(n)} = 1$

要证明这个结论，主要有两种常见且严谨的方法：一种是利用夹逼定理（Squeeze Theorem），这更体现分析学中的放缩思想；另一种是通过取对数并使用洛必达法则（L’Hôpital’s Rule），这种方法计算上非常直观。

方法一：夹逼定理（结合多项式的渐进性质）#

设多项式 $P(n)$ 的阶数为 $k$ ，其标准形式为： $P(n) = a_k n^k + a_{k-1} n^{k-1} + \dots + a_1 n + a_0$ 其中 $a_k > 0$ （这是为了保证当 $n$ 足够大时，能确保 $P(n) > 0$ ）。

1. 提取主部： 当 $n \to \infty$ 时，多项式的值完全由其最高次项 $a_k n^k$ 决定。我们可以将 $P(n)$ 写成： $P(n) = n^k \left( a_k + \frac{a_{k-1}}{n} + \dots + \frac{a_0}{n^k} \right)$

2. 构造放缩： 因为括号内的极限为 $a_k$ ，所以当 $n$ 足够大时，括号内的值必定介于 $\frac{a_k}{2}$ 和 $2a_k$ 之间。因此我们可以得到不等式： $\frac{a_k}{2} n^k \le P(n) \le 2a_k n^k$

3. 取 $n$ 次方根并求极限： 对不等式三边同时取 $n$ 次方根： $\sqrt[n]{\frac{a_k}{2}} \cdot (\sqrt[n]{n})^k \le \sqrt[n]{P(n)} \le \sqrt[n]{2a_k} \cdot (\sqrt[n]{n})^k$

这里我们需要用到两个已知的基础极限：

常数的 $n$ 次根极限为 $1$ ： $\lim_{n \to \infty} \sqrt[n]{C} = 1$ （当 $C>0$ 时）
$n$ 的 $n$ 次根极限为 $1$ ： $\lim_{n \to \infty} \sqrt[n]{n} = 1$

将这两个基础极限代入不等式两端：

左端极限： $1 \cdot 1^k = 1$
右端极限： $1 \cdot 1^k = 1$

根据夹逼定理，两端极限都趋于 $1$ ，因此中间项的极限必定也为 $1$ ： $\lim_{n \to \infty} \sqrt[n]{P(n)} = 1$

方法二：取对数与洛必达法则#

如果你想用微积分的工具直接硬算，可以通过取对数将幂指函数转化为分式。

令 $L = \lim_{n \to \infty} (P(n))^{\frac{1}{n}}$ ，对等式两边取自然对数： $\ln L = \lim_{n \to \infty} \ln \left( (P(n))^{\frac{1}{n}} \right) = \lim_{n \to \infty} \frac{\ln(P(n))}{n}$

此时，随着 $n \to \infty$ ，分子 $\ln(P(n)) \to \infty$ ，分母 $n \to \infty$ ，这是一个标准的 $\frac{\infty}{\infty}$ 型未定式。我们可以对连续变量 $x$ 使用洛必达法则（将 $n$ 替换为实数 $x$ ）：

$\lim_{x \to \infty} \frac{\ln(P(x))}{x} \overset{\text{L'H}}{=} \lim_{x \to \infty} \frac{ \frac{d}{dx} \ln(P(x)) }{ \frac{d}{dx} x } = \lim_{x \to \infty} \frac{ \frac{P'(x)}{P(x)} }{ 1 } = \lim_{x \to \infty} \frac{P'(x)}{P(x)}$

已知 $P(x)$ 是 $k$ 次多项式，那么其导数 $P'(x)$ 必然是一个 $k-1$ 次多项式。在求极限 $\lim_{x \to \infty} \frac{P'(x)}{P(x)}$ 时，分母的阶数 $k$ 严格大于分子的阶数 $k-1$ 。

因此，这个分式的极限毫无疑问是 $0$ ： $\lim_{x \to \infty} \frac{P'(x)}{P(x)} = 0$

所以我们得到 $\ln L = 0$ 。最后解出 $L$ ： $L = e^0 = 1$

牛顿广义二项式展开定理#

寺田微积分第14页例题 A(1) 证明的是**“牛顿广义二项式展开定理”**。

这道题是很多初学者的“噩梦”，因为书本在这里跳过了一大段极其核心的代数推导。书上轻描淡写地写了一句 “このことから $(1+x)f'(x) = \alpha f(x)$ が示される（由此可证…）”，很多同学在这里卡了半天不知道是怎么“由此”得出来的。

我们分四个阶段来完美攻克这道题：

阶段一：明确目标与构造函数#

我们要证明公式： $(1+x)^\alpha = \sum_{n=0}^{\infty} \binom{\alpha}{n} x^n$ （当 $|x|<1$ 时成立）。

这里 $\alpha$ 可以是任何实数（比如 $\frac{1}{2}, -3$ ）。
$\binom{\alpha}{n}$ 是广义组合数，定义为： $\binom{\alpha}{n} = \frac{\alpha(\alpha-1)\cdots(\alpha-n+1)}{n!}$ （当 $n=0$ 时， $\binom{\alpha}{0} = 1$ ）。

作者的思路是： 先不要管等号左边，我们直接把右边这串无穷级数定义为一个新的函数： $f(x) = \sum_{n=0}^{\infty} \binom{\alpha}{n} x^n \quad (|x| < 1)$ 现在的任务变成了：我要想办法证明这个 $f(x)$ ，它就等于 $(1+x)^\alpha$ 。

阶段二：填补书本的“隐藏步骤” （全题最难点🔥）#

根据定理 A，整级数在收敛域内可以逐项求导。我们对 $f(x)$ 求导： $f'(x) = \sum_{n=1}^{\infty} \binom{\alpha}{n} n x^{n-1}$ (注意：常数项 $n=0$ 时求导变成0，所以求和从 $n=1$ 开始)

接下来，我们要硬算出 $(1+x)f'(x)$ 到底等于什么。展开它： $(1+x)f'(x) = f'(x) + xf'(x)$ 。我们把这两部分分别写出来：

第一部分 $f'(x)$ ： 为了方便等会儿相加，我们做一个“变量替换”。令 $m = n-1$ （即 $n = m+1$ ），那么当 $n$ 从 $1$ 开始时， $m$ 就从 $0$ 开始： $f'(x) = \sum_{m=0}^{\infty} (m+1) \binom{\alpha}{m+1} x^m$
第二部分 $x \cdot f'(x)$ ： 把 $x$ 乘进去，刚好把 $x^{n-1}$ 补成了 $x^n$ ： $xf'(x) = x \sum_{n=1}^{\infty} n \binom{\alpha}{n} x^{n-1} = \sum_{n=1}^{\infty} n \binom{\alpha}{n} x^n$ 为了和上面对齐，我们把下标的字母 $n$ 改写成 $m$ 。并且因为当 $m=0$ 时这一项的值刚好是0，所以我们也可以放心地让它从 $m=0$ 开始求和： $xf'(x) = \sum_{m=0}^{\infty} m \binom{\alpha}{m} x^m$
把这两部分加起来： $(1+x)f'(x) = \sum_{m=0}^{\infty} \left[ \textcolor{red}{(m+1) \binom{\alpha}{m+1}} + \textcolor{blue}{m \binom{\alpha}{m}} \right] x^m$
魔法化简（拆解红色部分）： 利用广义组合数的定义，我们来拆解红色部分： $(m+1) \binom{\alpha}{m+1} = (m+1) \frac{\alpha(\alpha-1)\cdots(\alpha-m)}{(m+1)!}$ 分母的 $(m+1)! = (m+1) \times m!$ ，所以前面的 $(m+1)$ 刚好和分母约掉！ $= \frac{\alpha(\alpha-1)\cdots(\alpha-m+1) \cdot (\alpha-m)}{m!}$ 你仔细看前面这一大坨 $\frac{\alpha(\alpha-1)\cdots(\alpha-m+1)}{m!}$ ，这不就是 $\binom{\alpha}{m}$ 吗？所以红色部分等于： $(\alpha - m) \binom{\alpha}{m} = \alpha \binom{\alpha}{m} - m \binom{\alpha}{m}$
见证奇迹的时刻： 把化简后的红色部分代回第3步的方括号里：中括号 $= \left[ \alpha \binom{\alpha}{m} - m \binom{\alpha}{m} \right] + \textcolor{blue}{m \binom{\alpha}{m}} = \alpha \binom{\alpha}{m}$ 负的 $m$ 和正的 $m$ 完美抵消了！

所以，相加的结果变成了： $(1+x)f'(x) = \sum_{m=0}^{\infty} \alpha \binom{\alpha}{m} x^m = \alpha \sum_{m=0}^{\infty} \binom{\alpha}{m} x^m = \mathbf{\alpha f(x)}$ (这就把书上那句“このことから…が示される”背后的全过程补齐了！)

阶段三：巧妙构造“验证函数”#

我们现在手里握着一个极其重要的武器（微分方程）： $(1+x)f'(x) = \alpha f(x)$ 。

作者非常聪明，为了证明 $f(x)$ 和 $(1+x)^\alpha$ 是同一个东西，他构造了一个分数（设它为 $F(x)$ ）： $F(x) = \frac{f(x)}{(1+x)^\alpha}$ 思路是：如果我能证明这个分数的导数是 0，那就说明这个分数是个常数！

我们用商的求导法则 $\left( \frac{u}{v} \right)' = \frac{u'v - uv'}{v^2}$ 来对它求导： $F'(x) = \frac{f'(x) \cdot (1+x)^\alpha - f(x) \cdot \alpha(1+x)^{\alpha-1}}{[(1+x)^\alpha]^2}$

观察分子，我们可以提取出一个公因式 $(1+x)^{\alpha-1}$ ： $\text{分子} = (1+x)^{\alpha-1} \cdot[\mathbf{f'(x)(1+x)} - \mathbf{\alpha f(x)}]$

注意看中括号里的东西！根据我们在“阶段二”拼死拼活证出来的结论， $(1+x)f'(x)$ 就等于 $\alpha f(x)$ ！所以：中括号 $= \alpha f(x) - \alpha f(x) = \mathbf{0}$ 。

既然分子是 0，那么导数 $F'(x) = 0$ 。

阶段四：收官求常数#

微积分基本常识：一个函数的导数恒为 0，意味着这个函数是一条水平的直线，也就是一个常数 $C$ 。 所以： $\frac{f(x)}{(1+x)^\alpha} = C$

怎么求这个 $C$ 是多少呢？最简单的办法就是代入一个最好算的 $x$ 值，比如 $x = 0$ 。

分母： $(1+0)^\alpha = 1^\alpha = 1$ 。
分子： $f(0)$ 是级数 $\sum \binom{\alpha}{n} x^n$ 在 $x=0$ 时的值。当 $x=0$ 时，除了 $n=0$ 的常数项外，后面所有的 $x, x^2, x^3\dots$ 全变成0了。所以 $f(0) = \binom{\alpha}{0} \cdot 0^0 = 1 \cdot 1 = 1$ 。

把 $x=0$ 代入进去： $\frac{f(0)}{(1+0)^\alpha} = \frac{1}{1} = 1 \implies \mathbf{C = 1}$

既然常数 $C=1$ ，我们把分母乘过去： $\frac{f(x)}{(1+x)^\alpha} = 1 \implies \mathbf{f(x) = (1+x)^\alpha}$

**【最终结论】**我们一开始假设的那个拖着长长尾巴的级数 $f(x)$ ，完完全全、严丝合缝地等于 $(1+x)^\alpha$ ！证明完毕！

复盘#

这道证明题之所以经典，是因为它展现了高等数学里极其高级的**“逆向思维”**：遇到不知道怎么展开的东西，先假装它是个级数 $f(x)$ $\implies$ 找 $f(x)$ 的导数规律 $\implies$ 凑出一个导数为 0 的分式 $\implies$ 锁定它是个常数。

为了理解该证明，我们还需要补充一些组合数学的背景知识：

1. 从“狭义组合数”到“下降阶乘幂”#

在高中和本科初阶，我们学的组合数 $\binom{n}{k}$ （国内常写成 $C_n^k$ ）代表“从 $n$ 个不同元素中挑出 $k$ 个的方案数”。它的计算公式是： $\binom{n}{k} = \frac{n!}{k!(n-k)!}$

但这个公式有一个致命弱点：阶乘（ $n!$ ）只对非负整数有意义。如果 $n$ 是 $0.5$ 或者 $-3$ ，这个公式直接就崩溃了。

为了突破这个限制，我们需要换一种写法。把分子展开并和分母的 $(n-k)!$ 约分： $\binom{n}{k} = \frac{n(n-1)(n-2) \cdots (n-k+1)}{k!}$

分子的这一串乘积：从 $n$ 开始，每次减 1，一共乘了 $k$ 项。在组合数学中，这被称为下降阶乘幂（Falling Factorial）。这种写法的美妙之处在于：它完全不要求 $n$ 必须是整数！ 只要 $k$ 还是个正整数（因为我们要算求导的项数），处于顶部的 $n$ 可以是任何实数。

2. 牛顿的破局：广义组合数#

基于上面的观察，牛顿直接把顶部换成了任意实数 $\alpha$ ，定义出了广义组合数： $\binom{\alpha}{n} = \frac{\alpha(\alpha-1) \cdots (\alpha-n+1)}{n!}$ (规定当 $n=0$ 时，该值为 1)

为了让读者有具体的实感，我们代入 $\alpha = \frac{1}{2}$ 来算几项：

当 $n=1$ 时： $\binom{1/2}{1} = \frac{1/2}{1!} = \frac{1}{2}$
当 $n=2$ 时： $\binom{1/2}{2} = \frac{(1/2) \cdot (1/2 - 1)}{2!} = \frac{(1/2) \cdot (-1/2)}{2} = -\frac{1}{8}$