diff --git a/科研/卡尔曼滤波.md b/科研/卡尔曼滤波.md index a4764ca..ff965ac 100644 --- a/科研/卡尔曼滤波.md +++ b/科研/卡尔曼滤波.md @@ -46,6 +46,10 @@ $$ +这里是真实状态、真实测量、过程噪声、测量噪声。在卡尔曼滤波的预测和更新阶段中,**只需在每个时刻把新测得的 $z_k$ (再加上可用的控制输入 $u_{k-1}$)喂进去,滤波器就会自动递推状态估计**。 + + + ## 递归过程 卡尔曼滤波的递归过程主要分为两大步:**预测(Prediction)** 和 **更新(Update)**。 @@ -67,7 +71,7 @@ $$ $$ \mathbf{P}_k^- = \mathbf{A} \mathbf{P}_{k-1} \mathbf{A}^\mathrm{T} + \mathbf{Q} $$ - 这个预测协方差反映了预测状态的置信程度,不确定性通常会因过程噪声的加入而增大。 + 这个预测协方差反映了预测状态的**置信程度**,不确定性通常会因过程噪声的加入而**增大**。 ### 更新步骤 @@ -92,12 +96,36 @@ $$ $$ \mathbf{P}_k = (\mathbf{I} - \mathbf{K}_k \mathbf{H}) \mathbf{P}_k^- $$ - 一般来说,经过更新后,状态的不确定性会降低(即协方差矩阵的数值减小)。 + 一般来说,经过更新后,状态的不确定性会降低(即协方差矩阵的数值**减小**)。 + + +## 疑问: + +状态转移模型:为什么包含噪声? + +状态转移模型描述的是系统状态的真实动态行为,它是一个**理论模型**,表示状态如何从 $\mathbf{x}_{k-1}$ 演化到 $\mathbf{x}_k$。由于现实系统存在不确定性(如建模误差、外部扰动等),这些无法精确建模的部分被抽象为**过程噪声 $\mathbf{w}_{k-1}$**。因此,模型写作: +$$ +\mathbf{x}_k = \mathbf{A} \mathbf{x}_{k-1} + \mathbf{B} \mathbf{u}_{k-1} + \mathbf{w}_{k-1} +$$ +状态预测:为什么不带噪声? + +在卡尔曼滤波的**预测步骤**中,我们计算的是状态的**期望值(即最优估计)**,而非真实状态本身。由于噪声 $\mathbf{w}_{k-1}$ 的均值为零,它在预测时的期望贡献为零: +$$ +\mathbb{E}[\mathbf{x}_k] = \mathbf{A} \mathbb{E}[\mathbf{x}_{k-1}] + \mathbf{B} \mathbf{u}_{k-1} + \mathbb{E}[\mathbf{w}_{k-1}] = \mathbf{A} \hat{\mathbf{x}}_{k-1} + \mathbf{B} \mathbf{u}_{k-1} +$$ +协方差预测:噪声的体现 + +虽然噪声的均值在状态预测中被忽略,但其随机性会导致**不确定性累积**。因此,协方差预测公式中显式加入了 $\mathbf{Q}$: +$$ +\mathbf{P}_k^- = \mathbf{A} \mathbf{P}_{k-1} \mathbf{A}^\mathrm{T} + \mathbf{Q} +$$ + + # 扩展卡尔曼滤波 扩展卡尔曼滤波(Extended Kalman Filter,简称 EKF)是一种针对非线性系统状态估计问题的滤波方法。传统的卡尔曼滤波要求系统的状态转移和观测模型都是线性的,而在实际问题中,很多系统往往存在非线性特性。 diff --git a/科研/数学基础.md b/科研/数学基础.md index fecdb4f..d31577c 100644 --- a/科研/数学基础.md +++ b/科研/数学基础.md @@ -1134,7 +1134,7 @@ $$ ## **谱分解**与网络重构 -一个对称矩阵可以通过其特征值和特征向量进行分解。对于一个 $n \times n$ 的对称矩阵 $A$,其谱分解可以表示为: +一个对称矩阵可以通过其特征值和特征向量进行分解。对于一个 $n \times n$ 的**对称矩阵** $A$,其谱分解可以表示为: $$ A = Q \Lambda Q^T \\ @@ -1183,7 +1183,7 @@ $$ 3. **网络重构** 在随机网络中,网络的邻接矩阵 $A$ 通常是对称的。利用预测算法得到的谱参数 $\{\lambda_i, x_i\}$ 后,就可以用以下公式重构网络矩阵: $$ - A(G) = \sum_{i=1}^{n} \lambda_i x_i x_i^T +A(G) = \sum_{i=1}^{n} \lambda_i x_i x_i^T $$ diff --git a/科研/草稿.md b/科研/草稿.md index b7628be..7584c01 100644 --- a/科研/草稿.md +++ b/科研/草稿.md @@ -1,47 +1,108 @@ -分布式计算和集中式计算是完全等价的。将分布式算法中的本地观测 -$$ -b_i(k) = \sum_j a_{ij} x_j(k) -$$ -代入瑞利商公式 -$$ -y(k) = \frac{\sum_i x_i(k) b_i(k)}{\sum_i x_i(k)^2} -$$ -即可得到集中式计算的Rayleigh商形式 -$$ -\frac{x(k)^T (A x(k))}{x(k)^T x(k)}, -$$ -这与特征值估计的幂迭代公式 -$$ -\lambda_{\max} \approx \frac{x^T A x}{x^T x} -$$ -完全一致。 +### 严格推导过程(修正用户对白噪声的理解) + +您提出的疑问非常关键。让我们重新梳理这个推导过程,特别注意白噪声项的处理。 --- -### 代数示例 - -考虑一个简单的2×2矩阵 +#### **1. 模型设定** +AR(1)模型定义为: $$ -A = \begin{pmatrix}2 & 1\\1 & 2\end{pmatrix}, \quad x = \begin{pmatrix}2\\1\end{pmatrix}. +z_t = \rho z_{t-1} + \varepsilon_t +$$ +其中: +- $\varepsilon_t \sim \text{WN}(0, \sigma_\varepsilon^2)$ 是白噪声(独立同分布) +- $|\rho| < 1$ 保证平稳性 + +--- + +#### **2. 递推展开(关键步骤)** +通过无限递推将 $z_t$ 表示为历史噪声的线性组合: +$$ +\begin{aligned} +z_t &= \varepsilon_t + \rho z_{t-1} \\ +&= \varepsilon_t + \rho (\varepsilon_{t-1} + \rho z_{t-2}) \\ +&= \varepsilon_t + \rho \varepsilon_{t-1} + \rho^2 \varepsilon_{t-2} + \cdots \\ +&= \sum_{j=0}^\infty \rho^j \varepsilon_{t-j} +\end{aligned} $$ -1. **集中式计算** +**为什么需要 $\varepsilon_{t-j}$?** +虽然所有 $\varepsilon_{t-j}$ 的方差都是 $\sigma_\varepsilon^2$,但它们是**不同时刻**的独立随机变量。不能合并为一个 $\varepsilon$,因为: +- 每个时间点 $t-j$ 的噪声 $\varepsilon_{t-j}$ 是独立的新信息 +- 合并会丢失时间维度信息,破坏模型结构 + +--- + +#### **3. 方差计算(严格推导)** +利用方差的性质(独立变量线性组合的方差): $$ -\lambda \approx \frac{x^T A x}{x^T x} -= \frac{\begin{pmatrix}2 & 1\end{pmatrix} \begin{pmatrix}5\\4\end{pmatrix}}{2^2 + 1^2} -= \frac{10 + 4}{5} -= \frac{14}{5} = 2.8. +\text{Var}(z_t) = \text{Var}\left( \sum_{j=0}^\infty \rho^j \varepsilon_{t-j} \right) $$ -2. **分布式计算** -各节点分别计算本地观测值 +**步骤分解:** +1. **独立性**:$\varepsilon_{t-j}$ 相互独立 ⇒ 方差可加 + $$ + = \sum_{j=0}^\infty \text{Var}(\rho^j \varepsilon_{t-j}) + $$ +2. **常数提取**:$\rho^j$ 是非随机系数 + $$ + = \sum_{j=0}^\infty \rho^{2j} \text{Var}(\varepsilon_{t-j}) + $$ +3. **同方差性**:$\text{Var}(\varepsilon_{t-j}) = \sigma_\varepsilon^2$ 对所有 $j$ 成立 + $$ + = \sigma_\varepsilon^2 \sum_{j=0}^\infty \rho^{2j} + $$ +4. **级数求和**:$|\rho|<1$ 时几何级数收敛 + $$ + = \sigma_\varepsilon^2 \cdot \frac{1}{1-\rho^2} = \frac{\sigma_\varepsilon^2}{1-\rho^2} + $$ + +--- + +#### **4. 为什么不能简化为单一 $\varepsilon$?** +若错误地尝试合并: $$ -b_1 = (2 \cdot 2 + 1 \cdot 1) = 5, \quad b_2 = (1 \cdot 2 + 2 \cdot 1) = 4, +\text{错误写法:} \quad z_t \overset{?}{=} \varepsilon_t (1 + \rho + \rho^2 + \cdots) = \frac{\varepsilon_t}{1-\rho} $$ -然后通过全网共识计算 +会导致: +1. **方差计算错误**: + $$ + \text{Var}(z_t) \overset{?}{=} \frac{\text{Var}(\varepsilon_t)}{(1-\rho)^2} = \frac{\sigma_\varepsilon^2}{(1-\rho)^2} + $$ + (与正确结果 $\frac{\sigma_\varepsilon^2}{1-\rho^2}$ 不符) + +2. **物理意义错误**: + - 忽略了不同时刻噪声的独立性 + - 错误地假设所有历史噪声完全相关 + +--- + +#### **5. 结论** +- **正确结果**: + $$ + \text{Var}(z_t) = \frac{\sigma_\varepsilon^2}{1-\rho^2} \quad \text{(与时间 $t$ 无关)} + $$ +- **核心要点**: + 1. 必须保留 $\varepsilon_{t-j}$ 的下标,表示不同时刻的独立噪声 + 2. 几何级数求和时,系数是 $\rho^{2j}$(不是 $\rho^j$),因为方差运算涉及平方 + +--- + +### 补充说明 +此推导方法是时间序列分析的标准技术(参考Box & Jenkins《Time Series Analysis》)。白噪声的独立性是保证方差可加性的关键,任何简化合并 $\varepsilon_{t-j}$ 的操作都会破坏模型的时间依赖性结构。 + + + + + +根据引理1,$\text{Var}[\lambda_1(A_t)] \approx 2\sigma^2 = \sigma_1^2$。为使模型与理论一致,可设: + $$ -y = \frac{2 \cdot 5 + 1 \cdot 4}{2^2 + 1^2} -= \frac{14}{5} = 2.8. +\sigma_\varepsilon^2 = (1 - \rho^2) \cdot 2\sigma^2 $$ -两种方法得到的结果完全相同。 \ No newline at end of file +此时: + +$$ +\text{Var}[\tilde{z}_t] = 2\sigma^2 = \sigma_1^2 +$$ \ No newline at end of file diff --git a/科研/颜佳佳论文.md b/科研/颜佳佳论文.md index 99becac..512fb77 100644 --- a/科研/颜佳佳论文.md +++ b/科研/颜佳佳论文.md @@ -4,25 +4,115 @@ ### 基于扰动理论的特征向量估算方法 -**计算特征值扰动** +设原矩阵为 $A$,扰动后矩阵为 $A+\zeta C$(扰动矩阵 $\zeta C$,$\zeta$是小参数),令其第 $i$ 个特征值、特征向量分别为 $\lambda_i,x_i$ 和 $\tilde\lambda_i,\tilde x_i$。 -$$\Delta \lambda_{A_i} = \lambda_{A2} - \lambda_{A1}$$ - -**特征向量修正项** +**特征向量的一阶扰动公式:** $$ -U_B = \sum_{k=1}^{n} \frac{\Delta \lambda_{A_i} U_k}{(\lambda_{A_i} - \lambda_{A_k})} +\Delta x_i +=\tilde x_i - x_i +\;\approx\; +\zeta \sum_{k\neq i} +\frac{x_k^T\,C\,x_i}{\lambda_i - \lambda_k}\;x_k, $$ -- **解释**: - - $U_k$ 是 $A_{t1}$ 的第 $k$ 个特征向量 - - 分母 $(\lambda_{A_i} - \lambda_{A_k})$ 表示特征值差异,避免奇异(需假设 $\lambda_{A_i} \neq \lambda_{A_k}$) - - 分子 $\Delta \lambda_{A_i}$ 反映特征值变化对特征向量的影响 +- **输出**:对应第 $i$ 个特征向量修正量 $\Delta x_i$。 -**更新特征向量** + + +**特征值的一阶扰动公式:** $$ -U_{A2} = U_{A1} + U_B +\Delta\lambda_i = \tilde\lambda_i - \lambda_i \;\approx\;\zeta\,x_i^T\,C\,x_i $$ -**意义**:通过一阶扰动修正当前特征向量,得到未来时刻的 $U_{A2}$ +**关键假设:**当扰动较小( $\zeta\ll1$) 且各模态近似正交均匀时,常作进一步近似 +$$ +x_k^T\,C\,x_i \;\approx\; x_i^T\,C\,x_i \; +$$ +正交: $\{x_k\}$ 本身是正交基,这是任何对称矩阵特征向量天然具有的属性。 + +均匀:我们把 $C$ 看作“**不偏向任何特定模态**”的随机小扰动——换句话说,投影到任何两个方向 $(x_i,x_k)$ 上的耦合强度 $x_k^T\,C\,x_i\quad\text{和}\quad x_i^T\,C\,x_i$ 在数值量级上应当差不多,因此可以互相近似。 + + + +因此,将所有的 $x_k^T C x_i$ 替换为 $x_i^T C x_i$: +$$ +\Delta x_i \approx \zeta \sum_{k\neq i} \frac{x_i^T C x_i}{\lambda_i - \lambda_k} x_k = \zeta (x_i^T C x_i) \sum_{k\neq i} \frac{1}{\lambda_i - \lambda_k} x_k = \sum_{k\neq i} \frac{\Delta \lambda_i}{\lambda_i - \lambda_k} x_k \tag{*} +$$ + +$$ +\Delta x_i \approx\sum_{k\neq i} \frac{\Delta \lambda_i}{\lambda_i - \lambda_k} x_k \tag{*} +$$ + +问题: + +1. **当前时刻的邻接矩阵** + $$ + A^{(1)}\in\mathbb R^{n\times n},\qquad + A^{(1)}\,x_i^{(1)}=\lambda_i^{(1)}\,x_i^{(1)},\quad \|x_i^{(1)}\|=1. + $$ + +2. **下一时刻的邻接矩阵** + $$ + A^{(2)}\in\mathbb R^{n\times n}, + $$ + **已知**它的第 $i$ 个特征值 $\lambda_i^{(2)}$(卡尔曼滤波得来). **求**当前时刻的特征向量 $x_i^{(2)}$。 + + + +**下一时刻**第 $i$ 个特征向量的预测为 +$$ +\boxed{ +x_i^{(2)} +\;=\; +x_i^{(1)}+\Delta x_i +\;\approx\; +x_i^{(1)} ++\sum_{k\neq i} +\frac{\lambda_i^{(2)}-\lambda_i^{(1)}} + {\lambda_i^{(1)}-\lambda_k^{(1)}}\; +x_k^{(1)}. +} +$$ +通过该估算方法可以依次求出下一时刻的所有特征向量。 + + + +### 多智能体随机网络特征值滤波建模 + +#### **1. 状态转移模型** + +系统的特征值向量 $\lambda_k$(状态向量)随时间演化的动态方程为: +$$ +\lambda_k = \lambda_{k-1} + w_{k-1} +$$ + +- **参数说明**: + - $\lambda_k \in \mathbb{R}^{r \times 1}$:$k$ 时刻的特征值向量,$r$ 为特征值个数。 + - $w_{k-1} \sim \mathcal{N}(0, {Q})$:过程噪声,均值为零,协方差矩阵为对角阵 $\mathbf{Q} \in \mathbb{R}^{r \times r}$(因特征值独立)。 +- **简化假设**: + - 状态转移矩阵 $\mathbf{A}$ 和控制输入矩阵 $\mathbf{B}$ 为单位阵或零(无外部控制输入),故模型简化为随机游走形式。 + +#### **2. 测量模型** + +观测到的特征值向量 $z_k$ 为: +$$ +z_k = \lambda_k + v_k +$$ + +- **参数说明**: + - $z_k \in \mathbb{R}^{r \times 1}$:观测向量,维度与状态向量相同。 + - $v_k \sim \mathcal{N}(0, \mathbf{R})$:测量噪声,协方差 $\mathbf{R} \in \mathbb{R}^{r \times r}$ 为对角阵(噪声独立)。 +- **简化假设**: + - 测量矩阵 $\mathbf{H}$ 为单位阵,即观测直接反映状态。 + +#### **3. 噪声协方差矩阵的设定** + +- $\mathbf{Q}$ 和 $\mathbf{R}$ 为对角矩阵,对角元素由特征值方差确定: + $$ + \mathbf{Q} = \text{diag}(2\sigma_1^2, 2\sigma_2^2, \dots, 2\sigma_r^2), \quad \mathbf{R} = \text{diag}(\sigma_1^2, \sigma_2^2, \dots, \sigma_r^2) + $$ + 其中 $\sigma_i^2$ 为第 $i$ 个特征值的初始方差(由引理3-1推导)。 + + diff --git a/科研/高飞论文.md b/科研/高飞论文.md index 5b21bf7..941d53e 100644 --- a/科研/高飞论文.md +++ b/科研/高飞论文.md @@ -1,5 +1,237 @@ # 高飞论文 +## 证明特征值序列为平稳的时间序列 + +### 问题设定 + +- **研究对象** + 设 $\{\lambda_1(A)_t\}_{t\in\mathbb Z}$ 是随时间变化的随机对称矩阵 $A_t$ 的最大特征值序列(如动态网络的邻接矩阵)。 +- **目标** + 证明 $\{\lambda_1(A)_t\}$ 是 **二阶(弱)平稳**的时间序列,即 + 1. $E[\lambda_1(A)_t]=\mu_1$(与 $t$ 无关); + 2. $\operatorname{Var}[\lambda_1(A)_t]=\sigma_1^2<\infty$(与 $t$ 无关); + 3. $\operatorname{Cov}(\lambda_1(A)_t,\lambda_1(A)_{t-k})=\gamma(k)$ 只依赖滞后 $k$。 + + + +### 关键假设 + +- **矩阵统计特性(引理 1)** + + - $A_t$ 为 $N\times N$ 实对称随机矩阵;元素 $\{a_{ij}\}_{i\le j}$ 相互独立且有界:$|a_{ij}|\le K$。 + + - 非对角元素:$E[a_{ij}]=\mu>0,\ \operatorname{Var}(a_{ij})=\sigma^2$;对角元素:$E[a_{ii}]=v$。 + + - $N$ 足够大时 + $$ + E[\lambda_1(A_t)]\approx(N-1)\mu+v+\tfrac{\sigma^2}{\mu}\equiv\mu_1,\qquad + \operatorname{Var}[\lambda_1(A_t)]\approx2\sigma^2\equiv\sigma_1^2 . + $$ + +说明: + +- **$\sigma^2$** + 这是随机矩阵 $A_t$ 的非对角线元素 $a_{ij}$ ($i \neq j$) 的方差,即 + $$ + \text{Var}(a_{ij}) = \sigma^2. + $$ + 根据引理1的假设,所有非对角线元素独立同分布,均值为 $\mu$,方差为 $\sigma^2$。 + +- **$\sigma_1^2$** + 这是最大特征值 $\lambda_1(A_t)$ 的方差,即 + $$ + \text{Var}[\lambda_1(A_t)] \equiv \sigma_1^2. + $$ + 当 $N$ 足够大时,$\sigma_1^2$ 近似为 $2\sigma^2$。 + +- **时间序列模型** + 对**去中心化序列** + $$ + \tilde z_t:=\lambda_1(A)_t-\mu_1 + $$ + 假设其服从 AR(1) + $$ + \tilde z_t=\rho\,\tilde z_{t-1}+\varepsilon_t,\qquad + \varepsilon_t\stackrel{\text{i.i.d.}}{\sim}\text{WN}(0,\sigma_\varepsilon^{2}),\ \ |\rho|<1, + $$ + 且 $\varepsilon_t$ 与历史 $\{\tilde z_{s}\}_{s