Commit on 2025/04/26 周六 19:57:54.76
This commit is contained in:
parent
f6f3097112
commit
99686ea1af
32
科研/卡尔曼滤波.md
32
科研/卡尔曼滤波.md
@ -46,6 +46,10 @@ $$
|
||||
|
||||
|
||||
|
||||
这里是真实状态、真实测量、过程噪声、测量噪声。在卡尔曼滤波的预测和更新阶段中,**只需在每个时刻把新测得的 $z_k$ (再加上可用的控制输入 $u_{k-1}$)喂进去,滤波器就会自动递推状态估计**。
|
||||
|
||||
|
||||
|
||||
## 递归过程
|
||||
|
||||
卡尔曼滤波的递归过程主要分为两大步:**预测(Prediction)** 和 **更新(Update)**。
|
||||
@ -67,7 +71,7 @@ $$
|
||||
$$
|
||||
\mathbf{P}_k^- = \mathbf{A} \mathbf{P}_{k-1} \mathbf{A}^\mathrm{T} + \mathbf{Q}
|
||||
$$
|
||||
这个预测协方差反映了预测状态的置信程度,不确定性通常会因过程噪声的加入而增大。
|
||||
这个预测协方差反映了预测状态的**置信程度**,不确定性通常会因过程噪声的加入而**增大**。
|
||||
|
||||
### 更新步骤
|
||||
|
||||
@ -92,12 +96,36 @@ $$
|
||||
$$
|
||||
\mathbf{P}_k = (\mathbf{I} - \mathbf{K}_k \mathbf{H}) \mathbf{P}_k^-
|
||||
$$
|
||||
一般来说,经过更新后,状态的不确定性会降低(即协方差矩阵的数值减小)。
|
||||
一般来说,经过更新后,状态的不确定性会降低(即协方差矩阵的数值**减小**)。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
## 疑问:
|
||||
|
||||
状态转移模型:为什么包含噪声?
|
||||
|
||||
状态转移模型描述的是系统状态的真实动态行为,它是一个**理论模型**,表示状态如何从 $\mathbf{x}_{k-1}$ 演化到 $\mathbf{x}_k$。由于现实系统存在不确定性(如建模误差、外部扰动等),这些无法精确建模的部分被抽象为**过程噪声 $\mathbf{w}_{k-1}$**。因此,模型写作:
|
||||
$$
|
||||
\mathbf{x}_k = \mathbf{A} \mathbf{x}_{k-1} + \mathbf{B} \mathbf{u}_{k-1} + \mathbf{w}_{k-1}
|
||||
$$
|
||||
状态预测:为什么不带噪声?
|
||||
|
||||
在卡尔曼滤波的**预测步骤**中,我们计算的是状态的**期望值(即最优估计)**,而非真实状态本身。由于噪声 $\mathbf{w}_{k-1}$ 的均值为零,它在预测时的期望贡献为零:
|
||||
$$
|
||||
\mathbb{E}[\mathbf{x}_k] = \mathbf{A} \mathbb{E}[\mathbf{x}_{k-1}] + \mathbf{B} \mathbf{u}_{k-1} + \mathbb{E}[\mathbf{w}_{k-1}] = \mathbf{A} \hat{\mathbf{x}}_{k-1} + \mathbf{B} \mathbf{u}_{k-1}
|
||||
$$
|
||||
协方差预测:噪声的体现
|
||||
|
||||
虽然噪声的均值在状态预测中被忽略,但其随机性会导致**不确定性累积**。因此,协方差预测公式中显式加入了 $\mathbf{Q}$:
|
||||
$$
|
||||
\mathbf{P}_k^- = \mathbf{A} \mathbf{P}_{k-1} \mathbf{A}^\mathrm{T} + \mathbf{Q}
|
||||
$$
|
||||
|
||||
|
||||
# 扩展卡尔曼滤波
|
||||
|
||||
扩展卡尔曼滤波(Extended Kalman Filter,简称 EKF)是一种针对非线性系统状态估计问题的滤波方法。传统的卡尔曼滤波要求系统的状态转移和观测模型都是线性的,而在实际问题中,很多系统往往存在非线性特性。
|
||||
|
@ -1134,7 +1134,7 @@ $$
|
||||
|
||||
## **谱分解**与网络重构
|
||||
|
||||
一个对称矩阵可以通过其特征值和特征向量进行分解。对于一个 $n \times n$ 的对称矩阵 $A$,其谱分解可以表示为:
|
||||
一个对称矩阵可以通过其特征值和特征向量进行分解。对于一个 $n \times n$ 的**对称矩阵** $A$,其谱分解可以表示为:
|
||||
|
||||
$$
|
||||
A = Q \Lambda Q^T \\
|
||||
|
127
科研/草稿.md
127
科研/草稿.md
@ -1,47 +1,108 @@
|
||||
分布式计算和集中式计算是完全等价的。将分布式算法中的本地观测
|
||||
$$
|
||||
b_i(k) = \sum_j a_{ij} x_j(k)
|
||||
$$
|
||||
代入瑞利商公式
|
||||
$$
|
||||
y(k) = \frac{\sum_i x_i(k) b_i(k)}{\sum_i x_i(k)^2}
|
||||
$$
|
||||
即可得到集中式计算的Rayleigh商形式
|
||||
$$
|
||||
\frac{x(k)^T (A x(k))}{x(k)^T x(k)},
|
||||
$$
|
||||
这与特征值估计的幂迭代公式
|
||||
$$
|
||||
\lambda_{\max} \approx \frac{x^T A x}{x^T x}
|
||||
$$
|
||||
完全一致。
|
||||
### 严格推导过程(修正用户对白噪声的理解)
|
||||
|
||||
您提出的疑问非常关键。让我们重新梳理这个推导过程,特别注意白噪声项的处理。
|
||||
|
||||
---
|
||||
|
||||
### 代数示例
|
||||
|
||||
考虑一个简单的2×2矩阵
|
||||
#### **1. 模型设定**
|
||||
AR(1)模型定义为:
|
||||
$$
|
||||
A = \begin{pmatrix}2 & 1\\1 & 2\end{pmatrix}, \quad x = \begin{pmatrix}2\\1\end{pmatrix}.
|
||||
z_t = \rho z_{t-1} + \varepsilon_t
|
||||
$$
|
||||
其中:
|
||||
- $\varepsilon_t \sim \text{WN}(0, \sigma_\varepsilon^2)$ 是白噪声(独立同分布)
|
||||
- $|\rho| < 1$ 保证平稳性
|
||||
|
||||
---
|
||||
|
||||
#### **2. 递推展开(关键步骤)**
|
||||
通过无限递推将 $z_t$ 表示为历史噪声的线性组合:
|
||||
$$
|
||||
\begin{aligned}
|
||||
z_t &= \varepsilon_t + \rho z_{t-1} \\
|
||||
&= \varepsilon_t + \rho (\varepsilon_{t-1} + \rho z_{t-2}) \\
|
||||
&= \varepsilon_t + \rho \varepsilon_{t-1} + \rho^2 \varepsilon_{t-2} + \cdots \\
|
||||
&= \sum_{j=0}^\infty \rho^j \varepsilon_{t-j}
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
1. **集中式计算**
|
||||
**为什么需要 $\varepsilon_{t-j}$?**
|
||||
虽然所有 $\varepsilon_{t-j}$ 的方差都是 $\sigma_\varepsilon^2$,但它们是**不同时刻**的独立随机变量。不能合并为一个 $\varepsilon$,因为:
|
||||
- 每个时间点 $t-j$ 的噪声 $\varepsilon_{t-j}$ 是独立的新信息
|
||||
- 合并会丢失时间维度信息,破坏模型结构
|
||||
|
||||
---
|
||||
|
||||
#### **3. 方差计算(严格推导)**
|
||||
利用方差的性质(独立变量线性组合的方差):
|
||||
$$
|
||||
\lambda \approx \frac{x^T A x}{x^T x}
|
||||
= \frac{\begin{pmatrix}2 & 1\end{pmatrix} \begin{pmatrix}5\\4\end{pmatrix}}{2^2 + 1^2}
|
||||
= \frac{10 + 4}{5}
|
||||
= \frac{14}{5} = 2.8.
|
||||
\text{Var}(z_t) = \text{Var}\left( \sum_{j=0}^\infty \rho^j \varepsilon_{t-j} \right)
|
||||
$$
|
||||
|
||||
2. **分布式计算**
|
||||
各节点分别计算本地观测值
|
||||
**步骤分解:**
|
||||
1. **独立性**:$\varepsilon_{t-j}$ 相互独立 ⇒ 方差可加
|
||||
$$
|
||||
b_1 = (2 \cdot 2 + 1 \cdot 1) = 5, \quad b_2 = (1 \cdot 2 + 2 \cdot 1) = 4,
|
||||
= \sum_{j=0}^\infty \text{Var}(\rho^j \varepsilon_{t-j})
|
||||
$$
|
||||
然后通过全网共识计算
|
||||
2. **常数提取**:$\rho^j$ 是非随机系数
|
||||
$$
|
||||
y = \frac{2 \cdot 5 + 1 \cdot 4}{2^2 + 1^2}
|
||||
= \frac{14}{5} = 2.8.
|
||||
= \sum_{j=0}^\infty \rho^{2j} \text{Var}(\varepsilon_{t-j})
|
||||
$$
|
||||
3. **同方差性**:$\text{Var}(\varepsilon_{t-j}) = \sigma_\varepsilon^2$ 对所有 $j$ 成立
|
||||
$$
|
||||
= \sigma_\varepsilon^2 \sum_{j=0}^\infty \rho^{2j}
|
||||
$$
|
||||
4. **级数求和**:$|\rho|<1$ 时几何级数收敛
|
||||
$$
|
||||
= \sigma_\varepsilon^2 \cdot \frac{1}{1-\rho^2} = \frac{\sigma_\varepsilon^2}{1-\rho^2}
|
||||
$$
|
||||
|
||||
两种方法得到的结果完全相同。
|
||||
---
|
||||
|
||||
#### **4. 为什么不能简化为单一 $\varepsilon$?**
|
||||
若错误地尝试合并:
|
||||
$$
|
||||
\text{错误写法:} \quad z_t \overset{?}{=} \varepsilon_t (1 + \rho + \rho^2 + \cdots) = \frac{\varepsilon_t}{1-\rho}
|
||||
$$
|
||||
会导致:
|
||||
1. **方差计算错误**:
|
||||
$$
|
||||
\text{Var}(z_t) \overset{?}{=} \frac{\text{Var}(\varepsilon_t)}{(1-\rho)^2} = \frac{\sigma_\varepsilon^2}{(1-\rho)^2}
|
||||
$$
|
||||
(与正确结果 $\frac{\sigma_\varepsilon^2}{1-\rho^2}$ 不符)
|
||||
|
||||
2. **物理意义错误**:
|
||||
- 忽略了不同时刻噪声的独立性
|
||||
- 错误地假设所有历史噪声完全相关
|
||||
|
||||
---
|
||||
|
||||
#### **5. 结论**
|
||||
- **正确结果**:
|
||||
$$
|
||||
\text{Var}(z_t) = \frac{\sigma_\varepsilon^2}{1-\rho^2} \quad \text{(与时间 $t$ 无关)}
|
||||
$$
|
||||
- **核心要点**:
|
||||
1. 必须保留 $\varepsilon_{t-j}$ 的下标,表示不同时刻的独立噪声
|
||||
2. 几何级数求和时,系数是 $\rho^{2j}$(不是 $\rho^j$),因为方差运算涉及平方
|
||||
|
||||
---
|
||||
|
||||
### 补充说明
|
||||
此推导方法是时间序列分析的标准技术(参考Box & Jenkins《Time Series Analysis》)。白噪声的独立性是保证方差可加性的关键,任何简化合并 $\varepsilon_{t-j}$ 的操作都会破坏模型的时间依赖性结构。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
根据引理1,$\text{Var}[\lambda_1(A_t)] \approx 2\sigma^2 = \sigma_1^2$。为使模型与理论一致,可设:
|
||||
|
||||
$$
|
||||
\sigma_\varepsilon^2 = (1 - \rho^2) \cdot 2\sigma^2
|
||||
$$
|
||||
|
||||
此时:
|
||||
|
||||
$$
|
||||
\text{Var}[\tilde{z}_t] = 2\sigma^2 = \sigma_1^2
|
||||
$$
|
114
科研/颜佳佳论文.md
114
科研/颜佳佳论文.md
@ -4,25 +4,115 @@
|
||||
|
||||
### 基于扰动理论的特征向量估算方法
|
||||
|
||||
**计算特征值扰动**
|
||||
设原矩阵为 $A$,扰动后矩阵为 $A+\zeta C$(扰动矩阵 $\zeta C$,$\zeta$是小参数),令其第 $i$ 个特征值、特征向量分别为 $\lambda_i,x_i$ 和 $\tilde\lambda_i,\tilde x_i$。
|
||||
|
||||
$$\Delta \lambda_{A_i} = \lambda_{A2} - \lambda_{A1}$$
|
||||
|
||||
**特征向量修正项**
|
||||
**特征向量的一阶扰动公式:**
|
||||
$$
|
||||
U_B = \sum_{k=1}^{n} \frac{\Delta \lambda_{A_i} U_k}{(\lambda_{A_i} - \lambda_{A_k})}
|
||||
\Delta x_i
|
||||
=\tilde x_i - x_i
|
||||
\;\approx\;
|
||||
\zeta \sum_{k\neq i}
|
||||
\frac{x_k^T\,C\,x_i}{\lambda_i - \lambda_k}\;x_k,
|
||||
$$
|
||||
|
||||
- **解释**:
|
||||
- $U_k$ 是 $A_{t1}$ 的第 $k$ 个特征向量
|
||||
- 分母 $(\lambda_{A_i} - \lambda_{A_k})$ 表示特征值差异,避免奇异(需假设 $\lambda_{A_i} \neq \lambda_{A_k}$)
|
||||
- 分子 $\Delta \lambda_{A_i}$ 反映特征值变化对特征向量的影响
|
||||
- **输出**:对应第 $i$ 个特征向量修正量 $\Delta x_i$。
|
||||
|
||||
**更新特征向量**
|
||||
|
||||
|
||||
**特征值的一阶扰动公式:**
|
||||
$$
|
||||
U_{A2} = U_{A1} + U_B
|
||||
\Delta\lambda_i = \tilde\lambda_i - \lambda_i \;\approx\;\zeta\,x_i^T\,C\,x_i
|
||||
$$
|
||||
**意义**:通过一阶扰动修正当前特征向量,得到未来时刻的 $U_{A2}$
|
||||
**关键假设:**当扰动较小( $\zeta\ll1$) 且各模态近似正交均匀时,常作进一步近似
|
||||
$$
|
||||
x_k^T\,C\,x_i \;\approx\; x_i^T\,C\,x_i \;
|
||||
$$
|
||||
正交: $\{x_k\}$ 本身是正交基,这是任何对称矩阵特征向量天然具有的属性。
|
||||
|
||||
均匀:我们把 $C$ 看作“**不偏向任何特定模态**”的随机小扰动——换句话说,投影到任何两个方向 $(x_i,x_k)$ 上的耦合强度 $x_k^T\,C\,x_i\quad\text{和}\quad x_i^T\,C\,x_i$ 在数值量级上应当差不多,因此可以互相近似。
|
||||
|
||||
|
||||
|
||||
因此,将所有的 $x_k^T C x_i$ 替换为 $x_i^T C x_i$:
|
||||
$$
|
||||
\Delta x_i \approx \zeta \sum_{k\neq i} \frac{x_i^T C x_i}{\lambda_i - \lambda_k} x_k = \zeta (x_i^T C x_i) \sum_{k\neq i} \frac{1}{\lambda_i - \lambda_k} x_k = \sum_{k\neq i} \frac{\Delta \lambda_i}{\lambda_i - \lambda_k} x_k \tag{*}
|
||||
$$
|
||||
|
||||
$$
|
||||
\Delta x_i \approx\sum_{k\neq i} \frac{\Delta \lambda_i}{\lambda_i - \lambda_k} x_k \tag{*}
|
||||
$$
|
||||
|
||||
问题:
|
||||
|
||||
1. **当前时刻的邻接矩阵**
|
||||
$$
|
||||
A^{(1)}\in\mathbb R^{n\times n},\qquad
|
||||
A^{(1)}\,x_i^{(1)}=\lambda_i^{(1)}\,x_i^{(1)},\quad \|x_i^{(1)}\|=1.
|
||||
$$
|
||||
|
||||
2. **下一时刻的邻接矩阵**
|
||||
$$
|
||||
A^{(2)}\in\mathbb R^{n\times n},
|
||||
$$
|
||||
**已知**它的第 $i$ 个特征值 $\lambda_i^{(2)}$(卡尔曼滤波得来). **求**当前时刻的特征向量 $x_i^{(2)}$。
|
||||
|
||||
|
||||
|
||||
**下一时刻**第 $i$ 个特征向量的预测为
|
||||
$$
|
||||
\boxed{
|
||||
x_i^{(2)}
|
||||
\;=\;
|
||||
x_i^{(1)}+\Delta x_i
|
||||
\;\approx\;
|
||||
x_i^{(1)}
|
||||
+\sum_{k\neq i}
|
||||
\frac{\lambda_i^{(2)}-\lambda_i^{(1)}}
|
||||
{\lambda_i^{(1)}-\lambda_k^{(1)}}\;
|
||||
x_k^{(1)}.
|
||||
}
|
||||
$$
|
||||
通过该估算方法可以依次求出下一时刻的所有特征向量。
|
||||
|
||||
|
||||
|
||||
### 多智能体随机网络特征值滤波建模
|
||||
|
||||
#### **1. 状态转移模型**
|
||||
|
||||
系统的特征值向量 $\lambda_k$(状态向量)随时间演化的动态方程为:
|
||||
$$
|
||||
\lambda_k = \lambda_{k-1} + w_{k-1}
|
||||
$$
|
||||
|
||||
- **参数说明**:
|
||||
- $\lambda_k \in \mathbb{R}^{r \times 1}$:$k$ 时刻的特征值向量,$r$ 为特征值个数。
|
||||
- $w_{k-1} \sim \mathcal{N}(0, {Q})$:过程噪声,均值为零,协方差矩阵为对角阵 $\mathbf{Q} \in \mathbb{R}^{r \times r}$(因特征值独立)。
|
||||
- **简化假设**:
|
||||
- 状态转移矩阵 $\mathbf{A}$ 和控制输入矩阵 $\mathbf{B}$ 为单位阵或零(无外部控制输入),故模型简化为随机游走形式。
|
||||
|
||||
#### **2. 测量模型**
|
||||
|
||||
观测到的特征值向量 $z_k$ 为:
|
||||
$$
|
||||
z_k = \lambda_k + v_k
|
||||
$$
|
||||
|
||||
- **参数说明**:
|
||||
- $z_k \in \mathbb{R}^{r \times 1}$:观测向量,维度与状态向量相同。
|
||||
- $v_k \sim \mathcal{N}(0, \mathbf{R})$:测量噪声,协方差 $\mathbf{R} \in \mathbb{R}^{r \times r}$ 为对角阵(噪声独立)。
|
||||
- **简化假设**:
|
||||
- 测量矩阵 $\mathbf{H}$ 为单位阵,即观测直接反映状态。
|
||||
|
||||
#### **3. 噪声协方差矩阵的设定**
|
||||
|
||||
- $\mathbf{Q}$ 和 $\mathbf{R}$ 为对角矩阵,对角元素由特征值方差确定:
|
||||
$$
|
||||
\mathbf{Q} = \text{diag}(2\sigma_1^2, 2\sigma_2^2, \dots, 2\sigma_r^2), \quad \mathbf{R} = \text{diag}(\sigma_1^2, \sigma_2^2, \dots, \sigma_r^2)
|
||||
$$
|
||||
其中 $\sigma_i^2$ 为第 $i$ 个特征值的初始方差(由引理3-1推导)。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
232
科研/高飞论文.md
232
科研/高飞论文.md
@ -1,5 +1,237 @@
|
||||
# 高飞论文
|
||||
|
||||
## 证明特征值序列为平稳的时间序列
|
||||
|
||||
### 问题设定
|
||||
|
||||
- **研究对象**
|
||||
设 $\{\lambda_1(A)_t\}_{t\in\mathbb Z}$ 是随时间变化的随机对称矩阵 $A_t$ 的最大特征值序列(如动态网络的邻接矩阵)。
|
||||
- **目标**
|
||||
证明 $\{\lambda_1(A)_t\}$ 是 **二阶(弱)平稳**的时间序列,即
|
||||
1. $E[\lambda_1(A)_t]=\mu_1$(与 $t$ 无关);
|
||||
2. $\operatorname{Var}[\lambda_1(A)_t]=\sigma_1^2<\infty$(与 $t$ 无关);
|
||||
3. $\operatorname{Cov}(\lambda_1(A)_t,\lambda_1(A)_{t-k})=\gamma(k)$ 只依赖滞后 $k$。
|
||||
|
||||
|
||||
|
||||
### 关键假设
|
||||
|
||||
- **矩阵统计特性(引理 1)**
|
||||
|
||||
- $A_t$ 为 $N\times N$ 实对称随机矩阵;元素 $\{a_{ij}\}_{i\le j}$ 相互独立且有界:$|a_{ij}|\le K$。
|
||||
|
||||
- 非对角元素:$E[a_{ij}]=\mu>0,\ \operatorname{Var}(a_{ij})=\sigma^2$;对角元素:$E[a_{ii}]=v$。
|
||||
|
||||
- $N$ 足够大时
|
||||
$$
|
||||
E[\lambda_1(A_t)]\approx(N-1)\mu+v+\tfrac{\sigma^2}{\mu}\equiv\mu_1,\qquad
|
||||
\operatorname{Var}[\lambda_1(A_t)]\approx2\sigma^2\equiv\sigma_1^2 .
|
||||
$$
|
||||
|
||||
说明:
|
||||
|
||||
- **$\sigma^2$**
|
||||
这是随机矩阵 $A_t$ 的非对角线元素 $a_{ij}$ ($i \neq j$) 的方差,即
|
||||
$$
|
||||
\text{Var}(a_{ij}) = \sigma^2.
|
||||
$$
|
||||
根据引理1的假设,所有非对角线元素独立同分布,均值为 $\mu$,方差为 $\sigma^2$。
|
||||
|
||||
- **$\sigma_1^2$**
|
||||
这是最大特征值 $\lambda_1(A_t)$ 的方差,即
|
||||
$$
|
||||
\text{Var}[\lambda_1(A_t)] \equiv \sigma_1^2.
|
||||
$$
|
||||
当 $N$ 足够大时,$\sigma_1^2$ 近似为 $2\sigma^2$。
|
||||
|
||||
- **时间序列模型**
|
||||
对**去中心化序列**
|
||||
$$
|
||||
\tilde z_t:=\lambda_1(A)_t-\mu_1
|
||||
$$
|
||||
假设其服从 AR(1)
|
||||
$$
|
||||
\tilde z_t=\rho\,\tilde z_{t-1}+\varepsilon_t,\qquad
|
||||
\varepsilon_t\stackrel{\text{i.i.d.}}{\sim}\text{WN}(0,\sigma_\varepsilon^{2}),\ \ |\rho|<1,
|
||||
$$
|
||||
且 $\varepsilon_t$ 与历史 $\{\tilde z_{s}\}_{s<t}$ 独立。
|
||||
|
||||
|
||||
|
||||
### 证明主特征值序列平稳
|
||||
|
||||
#### **(1) 均值恒定性的推导**
|
||||
|
||||
- 去中心化后 $E[\tilde z_t]=0$。因此
|
||||
$$
|
||||
E[\lambda_1(A)_t]=E[\tilde z_t]+\mu_1=\mu_1,
|
||||
$$
|
||||
与 $t$ 无关,满足第一条。
|
||||
|
||||
#### (2) 方差恒定
|
||||
|
||||
AR(1)模型定义为:
|
||||
$$
|
||||
z_t = \rho z_{t-1} + \varepsilon_t
|
||||
$$
|
||||
|
||||
$$
|
||||
\begin{aligned}
|
||||
z_t &= \varepsilon_t + \rho z_{t-1} \\
|
||||
&= \varepsilon_t + \rho (\varepsilon_{t-1} + \rho z_{t-2}) \\
|
||||
&= \varepsilon_t + \rho \varepsilon_{t-1} + \rho^2 \varepsilon_{t-2} + \cdots \\
|
||||
&= \sum_{j=0}^\infty \rho^j \varepsilon_{t-j}
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
$$
|
||||
\text{Var}(z_t) = \text{Var}\left( \sum_{j=0}^\infty \rho^j \varepsilon_{t-j} \right)= \sum_{j=0}^\infty \rho^{2j} \text{Var}(\varepsilon_{t-j})
|
||||
$$
|
||||
|
||||
由于$\text{Var}(\varepsilon_{t-j}) = \sigma_\varepsilon^2$ 对所有 $j$ 成立,
|
||||
$$
|
||||
= \sigma_\varepsilon^2 \sum_{j=0}^\infty \rho^{2j}=\frac{\sigma_\varepsilon^2}{1-\rho^2}
|
||||
$$
|
||||
|
||||
- **$|\rho| < 1$** 是保证级数收敛和方差有限的充要条件。
|
||||
|
||||
|
||||
|
||||
根据引理1,$\text{Var}[\lambda_1(A_t)] \approx 2\sigma^2 = \sigma_1^2$。为使模型与理论一致,可设:
|
||||
$$
|
||||
\sigma_\varepsilon^2 = (1 - \rho^2) \cdot 2\sigma^2
|
||||
$$
|
||||
|
||||
此时:
|
||||
|
||||
$$
|
||||
\text{Var}[\tilde{z}_t] = 2\sigma^2 = \sigma_1^2
|
||||
$$
|
||||
|
||||
|
||||
|
||||
|
||||
#### **(3) 协方差仅依赖滞后 $k$**
|
||||
|
||||
对 $k\ge0$,
|
||||
$$
|
||||
\gamma(k):=\operatorname{Cov}(\tilde z_t,\tilde z_{t-k})
|
||||
=\rho^{k}\sigma_{\tilde z}^{2},
|
||||
$$
|
||||
仅含 $k$ 而与 $t$ 无关;于是
|
||||
$$
|
||||
\operatorname{Cov}(\lambda_1(A)_t,\lambda_1(A)_{t-k})=\gamma(k),
|
||||
$$
|
||||
满足第三条。
|
||||
|
||||
|
||||
|
||||
#### (4) 平稳性的核心条件
|
||||
|
||||
1. **|ρ| < 1 是关键条件**
|
||||
- 直观上:$\rho$ 越小,当前特征值对过去的依赖越弱;
|
||||
- $\rho=\pm1$ 会让方差发散,不可能稳态。
|
||||
2. **噪声独立性**:$\varepsilon_t$ 为白噪声,确保新信息与历史无关。
|
||||
|
||||
|
||||
|
||||
### 证明剩余特征值平稳:
|
||||
|
||||
#### 1. 收缩操作(Deflation)的严格定义
|
||||
|
||||
设 $A_t$ 的谱分解为:
|
||||
$$
|
||||
A_t = \sum_{i=1}^N \lambda_i u_i u_i^\top,
|
||||
$$
|
||||
其中 $\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_N$,且 $\{u_i\}$ 是标准正交基。
|
||||
|
||||
- **第一次收缩**:
|
||||
定义剩余矩阵 $A_{t,2} = A_t - \lambda_1 u_1 u_1^\top$,其性质为:
|
||||
|
||||
- 特征值:$\lambda_2, \lambda_3, \dots, \lambda_N$(即移除 $\lambda_1$ 后剩余特征值不变)。
|
||||
- 特征向量:$u_2, \dots, u_N$ 保持不变(因 $u_1$ 与其他特征向量正交)。
|
||||
|
||||
- **第 $k$ 次收缩**:
|
||||
递归定义:
|
||||
$$
|
||||
A_{t,k+1} = A_{t,k} - \lambda_k u_k u_k^\top,
|
||||
$$
|
||||
剩余矩阵 $A_{t,k+1}$ 的特征值为 $\lambda_{k+1}, \dots, \lambda_N$。
|
||||
|
||||
每次收缩移除当前主成分,剩余矩阵的特征值是原始矩阵中未被移除的部分。
|
||||
|
||||
---
|
||||
|
||||
#### 2. 剩余特征值的统计特性
|
||||
|
||||
**目标**:证明 $\{\lambda_k(A_t)\}_{t \in \mathbb{Z}}$ 对 $k \geq 2$ 也是弱平稳的。
|
||||
|
||||
##### **(1) 均值恒定性**
|
||||
|
||||
- **剩余矩阵的期望**:
|
||||
由线性性:
|
||||
$$
|
||||
E[A_{t,k+1}] = E[A_t] - \sum_{i=1}^k E[\lambda_i u_i u_i^\top].
|
||||
$$
|
||||
若 $A_t$ 的元素分布时不变,且 $\lambda_i$ 和 $u_i$ 的期望稳定(由主特征值的平稳性保证),则 $E[A_{t,k+1}]$ 与 $t$ 无关。
|
||||
|
||||
- **特征值期望**:
|
||||
对剩余矩阵 $A_{t,k+1}$,其主特征值 $\lambda_{k+1}(A_t)$ 的期望近似为:
|
||||
$$
|
||||
E[\lambda_{k+1}(A_t)] \approx (N-k-1)\mu + v + \frac{\sigma^2}{\mu} \equiv \mu_{k+1},
|
||||
$$
|
||||
其中 $(N-k-1)\mu$ 是剩余非对角元素的贡献(假设每次收缩后非对角元素统计特性不变)。
|
||||
|
||||
##### **(2) 方差恒定性**
|
||||
|
||||
- **剩余矩阵的方差**:
|
||||
收缩操作通过正交投影移除 $\lambda_k u_k u_k^\top$,因此剩余矩阵 $A_{t,k+1}$ 的元素方差仍为 $\sigma^2$(对角元素可能需调整)。
|
||||
由引理1的推广:
|
||||
$$
|
||||
\text{Var}[\lambda_{k+1}(A_t)] \approx 2\sigma^2 \equiv \sigma_{k+1}^2.
|
||||
$$
|
||||
|
||||
- **动态模型**:
|
||||
假设去中心化序列 $\tilde{z}_{k+1,t} = \lambda_{k+1}(A_t) - \mu_{k+1}$ 服从AR(1):
|
||||
$$
|
||||
\tilde{z}_{k+1,t} = \rho_{k+1} \tilde{z}_{k+1,t-1} + \varepsilon_{k+1,t}, \quad |\rho_{k+1}| < 1,
|
||||
$$
|
||||
稳态方差为:
|
||||
$$
|
||||
\sigma_{\tilde{z}_{k+1}}^2 = \frac{\sigma_{\varepsilon_{k+1}}^2}{1-\rho_{k+1}^2} = \sigma_{k+1}^2.
|
||||
$$
|
||||
|
||||
##### **(3) 协方差仅依赖滞后 $m$**
|
||||
|
||||
- 协方差函数:
|
||||
$$
|
||||
\gamma_{k+1}(m) = \text{Cov}(\tilde{z}_{k+1,t}, \tilde{z}_{k+1,t-m}) = \rho_{k+1}^{|m|} \sigma_{\tilde{z}_{k+1}}^2.
|
||||
$$
|
||||
仅依赖 $m$,与 $t$ 无关。
|
||||
|
||||
---
|
||||
|
||||
#### **3. 递推证明的完整性**
|
||||
|
||||
1. **归纳基础**:
|
||||
$k=1$ 时(主特征值),平稳性已证。
|
||||
|
||||
2. **归纳假设**:
|
||||
假设 $\lambda_k(A_t)$ 的平稳性成立,即:
|
||||
- $E[\lambda_k(A_t)] = \mu_k$(常数),
|
||||
- $\text{Var}[\lambda_k(A_t)] = \sigma_k^2$(有限),
|
||||
- $\text{Cov}(\lambda_k(A_t), \lambda_k(A_{t-m})) = \gamma_k(m)$。
|
||||
|
||||
3. **归纳步骤**:
|
||||
- 通过收缩操作,$\lambda_{k+1}(A_t)$ 成为 $A_{t,k+1}$ 的主特征值。
|
||||
- 若 $A_{t,k+1}$ 满足与 $A_t$ 相同的统计假设(独立性、有界性、时不变性),则 $\lambda_{k+1}(A_t)$ 的平稳性可类比主特征值的证明。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
## 网络重构分析
|
||||
|
||||
假设网络中有 $n$ 个节点,则矩阵 $A(G)$ 的维度为 $n \times n$,预测得到特征值和特征向量后,可以根据矩阵谱分解理论进行逆向重构网络邻接矩阵,表示如下:
|
||||
|
Loading…
x
Reference in New Issue
Block a user