3569 words
18 minutes
Amazing Proofs in Calculation and Linear Algebra

线性代数核心矩阵性质总结#

1. 实对称矩阵的谱性质 (Spectral Properties of Real Symmetric Matrices)#

谱定理 (Spectral Theorem) 是线性代数的核心结论:若 ARn×nA \in \mathbb{R}^{n \times n}A=ATA = A^T,则其特征值全为实数,且属于不同特征值的特征向量相互正交。

1.1 特征值的实数性证明#

AA 为实对称矩阵,满足 Ax=λxAx = \lambda x (x0x \neq 0)。考虑到特征值 λ\lambda 和特征向量 xx 可能为复数:

  1. 左乘共轭转置: xˉTAx=λxˉTx(1)\bar{x}^T A x = \lambda \bar{x}^T x \quad \dots \text{(1)}
  2. 对原式取共轭转置: 由于 AA 是实对称矩阵,则 AH=AT=AT=AA^H = \overline{A}^T = A^T = A(Ax)H=(λx)H    xˉTAH=λˉxˉT    xˉTA=λˉxˉT(Ax)^H = (\lambda x)^H \implies \bar{x}^T A^H = \bar{\lambda} \bar{x}^T \implies \bar{x}^T A = \bar{\lambda} \bar{x}^T
  3. 右乘 xx xˉTAx=λˉxˉTx(2)\bar{x}^T A x = \bar{\lambda} \bar{x}^T x \quad \dots \text{(2)}
  4. 联立 (1) 与 (2): λxˉTx=λˉxˉTx\lambda \bar{x}^T x = \bar{\lambda} \bar{x}^T x 由于 xˉTx=x2>0\bar{x}^T x = \|x\|^2 > 0,可约去得: λ=λˉ\lambda = \bar{\lambda}
  • 结论: 特征值 λ\lambda 等于其共轭,故 λ\lambda 必为实数。

1.2 特征向量的正交性证明#

Ax=λ1xAx = \lambda_1 xAy=λ2yAy = \lambda_2 y,且 λ1λ2\lambda_1 \neq \lambda_2

  1. 构造等式: λ1xTy=(Ax)Ty=xTATy\lambda_1 x^T y = (Ax)^T y = x^T A^T y
  2. 利用对称性: 由于 AT=AA^T = A,则: xTATy=xT(Ay)=xT(λ2y)=λ2xTyx^T A^T y = x^T (Ay) = x^T (\lambda_2 y) = \lambda_2 x^T y
  3. 得出关系: λ1xTy=λ2xTy    (λ1λ2)xTy=0\lambda_1 x^T y = \lambda_2 x^T y \implies (\lambda_1 - \lambda_2) x^T y = 0
  • 结论: 由于 λ1λ2\lambda_1 \neq \lambda_2,必有 xTy=0x^T y = 0,即特征向量相互正交。

2. 正定矩阵的特征值性质 (Positive Definite Matrices)#

2.1 定义#

若对称矩阵 AA 满足对于任意 x0x \neq 0,均有: xTAx>0x^T A x > 0 则称 AA 为正定矩阵。

2.2 特征值推导#

λ\lambdaAA 的特征值,则 Ax=λxAx = \lambda x。代入定义式: xTAx=xT(λx)=λ(xTx)=λx2x^T A x = x^T (\lambda x) = \lambda (x^T x) = \lambda \|x\|^2 由于正定定义要求 xTAx>0x^T A x > 0 且已知 x2>0\|x\|^2 > 0λ=xTAxx2>0\lambda = \frac{x^T A x}{\|x\|^2} > 0

  • 结论: 正定矩阵的所有特征值均严格大于 0。

3. 马尔可夫矩阵的特征值性质 (Markov Matrices)#

3.1 定义#

马尔可夫矩阵(列随机矩阵)满足:

  1. 所有元素非负:mij0m_{ij} \ge 0
  2. 每一列元素之和为 1:i=1nmij=1\sum_{i=1}^n m_{ij} = 1

3.2 存在特征值 λ=1\lambda = 1 的证明#

  1. 定义全 1 向量 1=[1,1,,1]T\mathbf{1} = [1, 1, \dots, 1]^T
  2. 根据列和为 1 的性质,有: 1TA=1T\mathbf{1}^T A = \mathbf{1}^T
  3. 取转置得: AT1=1A^T \mathbf{1} = \mathbf{1} 这表明 1\mathbf{1}ATA^T 对应于特征值 1 的特征向量。
  4. 由于 AAATA^T 具有相同的特征值。
  • 结论: 马尔可夫矩阵必有特征值 λ=1\lambda = 1

3.3 特征值范围 λ1|\lambda| \le 1#

若存在 λ>1|\lambda| > 1,考虑幂次迭代 Anx=λnxA^n x = \lambda^n x

  • nn \to \infty 时,λn\lambda^n \to \infty
  • 然而,马尔可夫过程代表概率分布的演变,概率向量的元素之和始终受限于 1,矩阵的范数受到约束,不可能发散。
  • 更严谨的证明可使用 格尔什戈林圆盘定理 (Gershgorin Circle Theorem)

3.4 物理意义与收敛性#

  • λ=1\lambda = 1 对应系统的稳态 (Steady State)
  • λ<1|\lambda| < 1 对应过程中的衰减项
  • 长期行为: 随着时间推移(矩阵幂运算),非稳态成分逐渐消失: Anx0vsteadyA^n x_0 \to v_{\text{steady}} 结论: 系统最终会收敛到 λ=1\lambda=1 对应的特征向量方向。

微积分极限总结#

多项式基础极限#

在微积分里有一个基础极限:对任意多项式 P(n)P(n)limnP(n)n=1\lim_{n \to \infty} \sqrt[n]{P(n)} = 1。 这是一个非常经典的数学分析结论:对于任意最高次项系数为正的多项式 P(n)P(n),其 nn 次根的极限为 11,即:

limnP(n)n=1\lim_{n \to \infty} \sqrt[n]{P(n)} = 1

要证明这个结论,主要有两种常见且严谨的方法:一种是利用夹逼定理(Squeeze Theorem),这更体现分析学中的放缩思想;另一种是通过取对数并使用洛必达法则(L’Hôpital’s Rule),这种方法计算上非常直观。


方法一:夹逼定理(结合多项式的渐进性质)#

设多项式 P(n)P(n) 的阶数为 kk,其标准形式为: P(n)=aknk+ak1nk1++a1n+a0P(n) = a_k n^k + a_{k-1} n^{k-1} + \dots + a_1 n + a_0 其中 ak>0a_k > 0(这是为了保证当 nn 足够大时,能确保 P(n)>0P(n) > 0)。

1. 提取主部:nn \to \infty 时,多项式的值完全由其最高次项 aknka_k n^k 决定。我们可以将 P(n)P(n) 写成: P(n)=nk(ak+ak1n++a0nk)P(n) = n^k \left( a_k + \frac{a_{k-1}}{n} + \dots + \frac{a_0}{n^k} \right)

2. 构造放缩: 因为括号内的极限为 aka_k,所以当 nn 足够大时,括号内的值必定介于 ak2\frac{a_k}{2}2ak2a_k 之间。因此我们可以得到不等式: ak2nkP(n)2aknk\frac{a_k}{2} n^k \le P(n) \le 2a_k n^k

3. 取 nn 次方根并求极限: 对不等式三边同时取 nn 次方根: ak2n(nn)kP(n)n2akn(nn)k\sqrt[n]{\frac{a_k}{2}} \cdot (\sqrt[n]{n})^k \le \sqrt[n]{P(n)} \le \sqrt[n]{2a_k} \cdot (\sqrt[n]{n})^k

这里我们需要用到两个已知的基础极限:

  • 常数的 nn 次根极限为 11limnCn=1\lim_{n \to \infty} \sqrt[n]{C} = 1 (当 C>0C>0 时)
  • nnnn 次根极限为 11limnnn=1\lim_{n \to \infty} \sqrt[n]{n} = 1

将这两个基础极限代入不等式两端:

  • 左端极限:11k=11 \cdot 1^k = 1
  • 右端极限:11k=11 \cdot 1^k = 1

根据夹逼定理,两端极限都趋于 11,因此中间项的极限必定也为 11limnP(n)n=1\lim_{n \to \infty} \sqrt[n]{P(n)} = 1


方法二:取对数与洛必达法则#

如果你想用微积分的工具直接硬算,可以通过取对数将幂指函数转化为分式。

L=limn(P(n))1nL = \lim_{n \to \infty} (P(n))^{\frac{1}{n}},对等式两边取自然对数: lnL=limnln((P(n))1n)=limnln(P(n))n\ln L = \lim_{n \to \infty} \ln \left( (P(n))^{\frac{1}{n}} \right) = \lim_{n \to \infty} \frac{\ln(P(n))}{n}

此时,随着 nn \to \infty,分子 ln(P(n))\ln(P(n)) \to \infty,分母 nn \to \infty,这是一个标准的 \frac{\infty}{\infty} 型未定式。我们可以对连续变量 xx 使用洛必达法则(将 nn 替换为实数 xx):

limxln(P(x))x=L’Hlimxddxln(P(x))ddxx=limxP(x)P(x)1=limxP(x)P(x)\lim_{x \to \infty} \frac{\ln(P(x))}{x} \overset{\text{L'H}}{=} \lim_{x \to \infty} \frac{ \frac{d}{dx} \ln(P(x)) }{ \frac{d}{dx} x } = \lim_{x \to \infty} \frac{ \frac{P'(x)}{P(x)} }{ 1 } = \lim_{x \to \infty} \frac{P'(x)}{P(x)}

已知 P(x)P(x)kk 次多项式,那么其导数 P(x)P'(x) 必然是一个 k1k-1 次多项式。 在求极限 limxP(x)P(x)\lim_{x \to \infty} \frac{P'(x)}{P(x)} 时,分母的阶数 kk 严格大于分子的阶数 k1k-1

因此,这个分式的极限毫无疑问是 00limxP(x)P(x)=0\lim_{x \to \infty} \frac{P'(x)}{P(x)} = 0

所以我们得到 lnL=0\ln L = 0。最后解出 LLL=e0=1L = e^0 = 1

牛顿广义二项式展开定理#

寺田微积分第14页例题 A(1) 证明的是**“牛顿广义二项式展开定理”**。

这道题是很多初学者的“噩梦”,因为书本在这里跳过了一大段极其核心的代数推导。书上轻描淡写地写了一句 “このことから (1+x)f(x)=αf(x)(1+x)f'(x) = \alpha f(x) が示される(由此可证…)”,很多同学在这里卡了半天不知道是怎么“由此”得出来的。

我们分四个阶段来完美攻克这道题:


阶段一:明确目标与构造函数#

我们要证明公式:(1+x)α=n=0(αn)xn(1+x)^\alpha = \sum_{n=0}^{\infty} \binom{\alpha}{n} x^n (当 x<1|x|<1 时成立)。

  • 这里 α\alpha 可以是任何实数(比如 12,3\frac{1}{2}, -3)。
  • (αn)\binom{\alpha}{n} 是广义组合数,定义为:(αn)=α(α1)(αn+1)n!\binom{\alpha}{n} = \frac{\alpha(\alpha-1)\cdots(\alpha-n+1)}{n!} (当 n=0n=0 时,(α0)=1\binom{\alpha}{0} = 1)。

作者的思路是: 先不要管等号左边,我们直接把右边这串无穷级数定义为一个新的函数: f(x)=n=0(αn)xn(x<1)f(x) = \sum_{n=0}^{\infty} \binom{\alpha}{n} x^n \quad (|x| < 1) 现在的任务变成了:我要想办法证明这个 f(x)f(x),它就等于 (1+x)α(1+x)^\alpha


阶段二:填补书本的“隐藏步骤” (全题最难点🔥)#

根据定理 A,整级数在收敛域内可以逐项求导。我们对 f(x)f(x) 求导: f(x)=n=1(αn)nxn1f'(x) = \sum_{n=1}^{\infty} \binom{\alpha}{n} n x^{n-1} (注意:常数项 n=0n=0 时求导变成0,所以求和从 n=1n=1 开始)

接下来,我们要硬算出 (1+x)f(x)(1+x)f'(x) 到底等于什么。 展开它:(1+x)f(x)=f(x)+xf(x)(1+x)f'(x) = f'(x) + xf'(x)。我们把这两部分分别写出来:

  1. 第一部分 f(x)f'(x) 为了方便等会儿相加,我们做一个“变量替换”。令 m=n1m = n-1(即 n=m+1n = m+1),那么当 nn11 开始时,mm 就从 00 开始: f(x)=m=0(m+1)(αm+1)xmf'(x) = \sum_{m=0}^{\infty} (m+1) \binom{\alpha}{m+1} x^m

  2. 第二部分 xf(x)x \cdot f'(x)xx 乘进去,刚好把 xn1x^{n-1} 补成了 xnx^nxf(x)=xn=1n(αn)xn1=n=1n(αn)xnxf'(x) = x \sum_{n=1}^{\infty} n \binom{\alpha}{n} x^{n-1} = \sum_{n=1}^{\infty} n \binom{\alpha}{n} x^n 为了和上面对齐,我们把下标的字母 nn 改写成 mm。并且因为当 m=0m=0 时这一项的值刚好是0,所以我们也可以放心地让它从 m=0m=0 开始求和: xf(x)=m=0m(αm)xmxf'(x) = \sum_{m=0}^{\infty} m \binom{\alpha}{m} x^m

  3. 把这两部分加起来: (1+x)f(x)=m=0[(m+1)(αm+1)+m(αm)]xm(1+x)f'(x) = \sum_{m=0}^{\infty} \left[ \textcolor{red}{(m+1) \binom{\alpha}{m+1}} + \textcolor{blue}{m \binom{\alpha}{m}} \right] x^m

  4. 魔法化简(拆解红色部分): 利用广义组合数的定义,我们来拆解红色部分: (m+1)(αm+1)=(m+1)α(α1)(αm)(m+1)!(m+1) \binom{\alpha}{m+1} = (m+1) \frac{\alpha(\alpha-1)\cdots(\alpha-m)}{(m+1)!} 分母的 (m+1)!=(m+1)×m!(m+1)! = (m+1) \times m!,所以前面的 (m+1)(m+1) 刚好和分母约掉! =α(α1)(αm+1)(αm)m!= \frac{\alpha(\alpha-1)\cdots(\alpha-m+1) \cdot (\alpha-m)}{m!} 你仔细看前面这一大坨 α(α1)(αm+1)m!\frac{\alpha(\alpha-1)\cdots(\alpha-m+1)}{m!},这不就是 (αm)\binom{\alpha}{m} 吗? 所以红色部分等于:(αm)(αm)=α(αm)m(αm)(\alpha - m) \binom{\alpha}{m} = \alpha \binom{\alpha}{m} - m \binom{\alpha}{m}

  5. 见证奇迹的时刻: 把化简后的红色部分代回第3步的方括号里: 中括号 =[α(αm)m(αm)]+m(αm)=α(αm)= \left[ \alpha \binom{\alpha}{m} - m \binom{\alpha}{m} \right] + \textcolor{blue}{m \binom{\alpha}{m}} = \alpha \binom{\alpha}{m} 负的 mm 和正的 mm 完美抵消了!

    所以,相加的结果变成了: (1+x)f(x)=m=0α(αm)xm=αm=0(αm)xm=αf(x)(1+x)f'(x) = \sum_{m=0}^{\infty} \alpha \binom{\alpha}{m} x^m = \alpha \sum_{m=0}^{\infty} \binom{\alpha}{m} x^m = \mathbf{\alpha f(x)} (这就把书上那句“このことから…が示される”背后的全过程补齐了!)


阶段三:巧妙构造“验证函数”#

我们现在手里握着一个极其重要的武器(微分方程):(1+x)f(x)=αf(x)(1+x)f'(x) = \alpha f(x)

作者非常聪明,为了证明 f(x)f(x)(1+x)α(1+x)^\alpha 是同一个东西,他构造了一个分数(设它为 F(x)F(x)): F(x)=f(x)(1+x)αF(x) = \frac{f(x)}{(1+x)^\alpha} 思路是:如果我能证明这个分数的导数是 0,那就说明这个分数是个常数!

我们用商的求导法则 (uv)=uvuvv2\left( \frac{u}{v} \right)' = \frac{u'v - uv'}{v^2} 来对它求导: F(x)=f(x)(1+x)αf(x)α(1+x)α1[(1+x)α]2F'(x) = \frac{f'(x) \cdot (1+x)^\alpha - f(x) \cdot \alpha(1+x)^{\alpha-1}}{[(1+x)^\alpha]^2}

观察分子,我们可以提取出一个公因式 (1+x)α1(1+x)^{\alpha-1}分子=(1+x)α1[f(x)(1+x)αf(x)]\text{分子} = (1+x)^{\alpha-1} \cdot[\mathbf{f'(x)(1+x)} - \mathbf{\alpha f(x)}]

注意看中括号里的东西!根据我们在“阶段二”拼死拼活证出来的结论,(1+x)f(x)(1+x)f'(x) 就等于 αf(x)\alpha f(x)! 所以:中括号 =αf(x)αf(x)=0= \alpha f(x) - \alpha f(x) = \mathbf{0}

既然分子是 0,那么导数 F(x)=0F'(x) = 0


阶段四:收官求常数#

微积分基本常识:一个函数的导数恒为 0,意味着这个函数是一条水平的直线,也就是一个常数 CC 所以: f(x)(1+x)α=C\frac{f(x)}{(1+x)^\alpha} = C

怎么求这个 CC 是多少呢?最简单的办法就是代入一个最好算的 xx 值,比如 x=0x = 0

  • 分母:(1+0)α=1α=1(1+0)^\alpha = 1^\alpha = 1
  • 分子:f(0)f(0) 是级数 (αn)xn\sum \binom{\alpha}{n} x^nx=0x=0 时的值。当 x=0x=0 时,除了 n=0n=0 的常数项外,后面所有的 x,x2,x3x, x^2, x^3\dots 全变成0了。所以 f(0)=(α0)00=11=1f(0) = \binom{\alpha}{0} \cdot 0^0 = 1 \cdot 1 = 1

x=0x=0 代入进去: f(0)(1+0)α=11=1    C=1\frac{f(0)}{(1+0)^\alpha} = \frac{1}{1} = 1 \implies \mathbf{C = 1}

既然常数 C=1C=1,我们把分母乘过去: f(x)(1+x)α=1    f(x)=(1+x)α\frac{f(x)}{(1+x)^\alpha} = 1 \implies \mathbf{f(x) = (1+x)^\alpha}

**【最终结论】**我们一开始假设的那个拖着长长尾巴的级数 f(x)f(x),完完全全、严丝合缝地等于 (1+x)α(1+x)^\alpha!证明完毕!

复盘#

这道证明题之所以经典,是因为它展现了高等数学里极其高级的**“逆向思维”**: 遇到不知道怎么展开的东西,先假装它是个级数 f(x)f(x)     \impliesf(x)f(x) 的导数规律     \implies 凑出一个导数为 0 的分式     \implies 锁定它是个常数。

为了理解该证明,我们还需要补充一些组合数学的背景知识:

1. 从“狭义组合数”到“下降阶乘幂”#

在高中和本科初阶,我们学的组合数 (nk)\binom{n}{k}(国内常写成 CnkC_n^k)代表“从 nn 个不同元素中挑出 kk 个的方案数”。 它的计算公式是: (nk)=n!k!(nk)!\binom{n}{k} = \frac{n!}{k!(n-k)!}

但这个公式有一个致命弱点:阶乘(n!n!)只对非负整数有意义。如果 nn0.50.5 或者 3-3,这个公式直接就崩溃了。

为了突破这个限制,我们需要换一种写法。把分子展开并和分母的 (nk)!(n-k)! 约分: (nk)=n(n1)(n2)(nk+1)k!\binom{n}{k} = \frac{n(n-1)(n-2) \cdots (n-k+1)}{k!}

分子的这一串乘积:nn 开始,每次减 1,一共乘了 kk。在组合数学中,这被称为下降阶乘幂(Falling Factorial)。 这种写法的美妙之处在于:它完全不要求 nn 必须是整数! 只要 kk 还是个正整数(因为我们要算求导的项数),处于顶部的 nn 可以是任何实数。

2. 牛顿的破局:广义组合数#

基于上面的观察,牛顿直接把顶部换成了任意实数 α\alpha,定义出了广义组合数(αn)=α(α1)(αn+1)n!\binom{\alpha}{n} = \frac{\alpha(\alpha-1) \cdots (\alpha-n+1)}{n!} (规定当 n=0n=0 时,该值为 1)

为了让读者有具体的实感,我们代入 α=12\alpha = \frac{1}{2} 来算几项:

  • n=1n=1 时:(1/21)=1/21!=12\binom{1/2}{1} = \frac{1/2}{1!} = \frac{1}{2}
  • n=2n=2 时:(1/22)=(1/2)(1/21)2!=(1/2)(1/2)2=18\binom{1/2}{2} = \frac{(1/2) \cdot (1/2 - 1)}{2!} = \frac{(1/2) \cdot (-1/2)}{2} = -\frac{1}{8}

如果对 1+x\sqrt{1+x}(即 (1+x)1/2(1+x)^{1/2})进行泰勒展开,会发现它前两项的系数正好就是 12\frac{1}{2}18-\frac{1}{8}。广义组合数完美地把任意次幂的泰勒展开系数统一在了一个极其优雅的符号之下。

3. 证明中用到的终极武器:“吸收恒等式”#

在上面的推导“阶段二”中,有一个红色的化简步骤堪称全场最佳: (m+1)(αm+1)=(αm)(αm)(m+1) \binom{\alpha}{m+1} = (\alpha - m) \binom{\alpha}{m}

很多同学死记硬背这个步骤,但其实它是组合数学中**“吸收恒等式(Absorption Identity)”**的广义版本。我们用广义组合数的定义来把它彻底拆解:

等式左边的展开是: (m+1)α(α1)(αm+1)(αm)(m+1)!(m+1) \cdot \frac{\alpha(\alpha-1) \cdots (\alpha-m+1)(\alpha-m)}{(m+1)!}

因为分母 (m+1)!=(m+1)×m!(m+1)! = (m+1) \times m!,所以前面的常数 (m+1)(m+1) 刚好可以把分母里的 (m+1)(m+1) 给**“吸收”**(约掉): =α(α1)(αm+1)(αm)m!= \frac{\alpha(\alpha-1) \cdots (\alpha-m+1)(\alpha-m)}{m!}

接下来,我们把分子最后面的那一项 (αm)(\alpha-m) 单独拎出来,放在最前面: =(αm)[α(α1)(αm+1)m!]= (\alpha-m) \cdot \left[ \frac{\alpha(\alpha-1) \cdots (\alpha-m+1)}{m!} \right]

仔细看方括号里的部分,它从 α\alpha 乘到 (αm+1)(\alpha-m+1),一共 mm 项,底下是 m!m!。这不正是广义组合数 (αm)\binom{\alpha}{m} 的定义吗! 所以它等于: (αm)(αm)(\alpha-m) \binom{\alpha}{m}

这就是为什么在推导时,可以用这个恒等式把 (m+1)(m+1) 和底下的阶乘约掉,从而实现前后两项 mm 的完美抵消。


掌握了这三点,那个极其复杂的系数推导其实就是一层窗户纸,核心全在那个展开的 (m+1)!(m+1)! 上。

关于这个广义二项式展开,它还有一个严格的前提条件是 x<1|x| < 1

--- To Be Continued -> ---

Amazing Proofs in Calculation and Linear Algebra
https://blog.yirong.site/posts/0052/
Author
Kuchina
Published at
2026-04-27
License
CC BY-NC-SA 4.0
ページ閲覧数: 読み込み中…
サイト閲覧数: 読み込み中…