OAMP的理解

admin • 2021-11-22 20:36 • 人工智能

Orthogonal Approximate Message Passing, OAMP

1 前言
2 绪论
3 AMP
- 3.1 AMP算法
- 3.2 AMP-state evolution与等效信号模型
4 OAMP
5 总结
6 参考

1 前言

本次博文主要介绍了OAMP论文，同时加了一些粗浅的理解。一方面，前两部分涉及了一些AMP相关的知识以及我自己给出的解释，另一方面，博文所推公式可能与论文稍有偏差，笔者才疏学浅，又是第一次写博客，这两个部分都不敢保证能理解到位和描述清晰，难免解释可能会有所偏差，甚至有歪曲原文的不当之处，还希望各位读者能够包涵。下一篇博文可能会是对VAMP的解读，希望这可以在年内完成，之后博客可能会推出一些与消息传递算法较相关的论文介绍，以及自认为有价值的积累。

2 绪论

简短回顾一下Approximate Message Passing (AMP) 的问题模型

(1a)

pmb y=pmb A pmb x + pmb n tag{1a}

$y y y = A A A x x x + n n n (1 a)$

∼

(

)

∀

(1b)

mathit x_{j} sim P_{X}(x), forall x tag{1b}

$x_{j} \sim P_{X} (x), \forall x (1 b)$

其中

∈

pmb A in mathbb C^{M times N}

$A A A \in C^{M \times N}$ 是感知矩阵，

∈

pmb n in mathbb C^{M times 1}

$n n n \in C^{M \times 1}$ 是均值为

$0$ ，方差为

sigma^{2}

$σ^{2}$ 的高斯向量。AMP的一个重要性质就是其算法性能可以用state evolution来精确刻画，就是说给定真实的

pmb x

$x x x$ ，我们可以依据state evolution的结果

tau^{t}

$τ^{t}$ ，预测AMP在第

$t$ 次迭代过程中估计得到的

{hat {pmb x}}^{t}

$x x x^^{t}$ 与真实

pmb x

$x x x$ 的均方差（MSE）

[

∥

−

∥

]

mathbb E[{Vert pmb x-{hat {pmb x}}^{t} Vert}^2_{2} ]

$E [∥ x x x - x x x^^{t} ∥_{22}]$ ，表示为

→

∥

−

∥

(

→

∞

)

(2)

{ tau_{t} }^{2} rightarrow frac{1}{N} {Vert pmb x-{hat {pmb x}}^{t} Vert}^2_{2}, (N rightarrow infty) tag{2}

$τ_{t}^{2} \to \frac{1}{N} ∥ x x x - x x x^^{t} ∥_{22}, (N \to \infty) (2)$

事实上，式(2)为趋近于而不是严格等于，因为

∥

−

∥

frac{1}{N} {Vert pmb x-{hat {pmb x}}^{t} Vert}^2_{2}

$\frac{1}{N} ∥ x x x - x x x^^{t} ∥_{22}$ 是关于

{hat {pmb x}}^{t}

$x x x^^{t}$ 的二阶Lipschitz函数，满足如下收敛关系

∥

−

∥

→

[

∥

−

∥

]

(

→

∞

)

(3)

frac{1}{N} {Vert pmb x-{hat {pmb x}}^{t} Vert}^2_{2} rightarrow mathbb E[{Vert pmb x-{hat {pmb x}}^{t} Vert}^2_{2} ] , (N rightarrow infty) tag{3}

$\frac{1}{N} ∥ x x x - x x x^^{t} ∥_{22} \to E [∥ x x x - x x x^^{t} ∥_{22}], (N \to \infty) (3)$

但遗憾的是，大部分情况下，只有当

pmb A

$A A A$ 为高斯矩阵或者次高斯矩阵时，state evolution才能与AMP估计的结果统一，如果感知矩阵的特征值分布与高斯矩阵的特征值分布相差较远，AMP的性能就不能保证，甚至可能会出现不收敛的情况。为了解决该问题，Junjie Ma和Li Ping提出了OAMP^[1]。

AMP还有一个重要的点是其线性迭代过程中含有"onsager"这一项，它的作用是为了消除迭代过程中感知矩阵

pmb A

$A A A$ 与估计结果

{hat {pmb x}}^{t}

$x x x^^{t}$ 之间的相关性。虽然OAMP把AMP中的“onsager”这一项给去掉了，但是为了补偿"onsager"原来的作用，OAMP在非线性估计中加入了divergence-free的约束（可能divergence-free这个概念有点抽象，简单理解为导数为0就行）。

备注：其实OAMP并没有严格意义的数学推导，作者先是给了两个独立性的假设（假设1和假设2），而OAMP-state evolution就是由该假设条件推出来的。让OAMP迭代开始(

t

=

0

t=0

$t = 0$ 时刻)先保证独立性，满足两个假设条件之一，如果之后的每一次迭代假设1和假设2都能互相推出对方，那么我们可以认为每一次迭代的程始终可以保证独立条件成立，也就保证了state evolution。但略有遗憾，假设1和假设2只能“部分”地互相推出对方，可以保证不相关（由正交推出），但是不能保证独立。幸运的是，仿真结果表明，虽然迭代过程中的独立条件不能始终保持，但是state evolution还是能够和OAMP估计结果统一，论文作者将此描述为：假设1和假设2是只是state evolution的充分条件。

3 AMP

在开始OAMP之前，先回顾一下AMP。

3.1 AMP算法

假设矩阵

[

…

]

pmb A=[pmb a_{1}, pmb a_{2}, text{…},pmb a_{N}]

$A A A = [a a a_{1}, a a a_{2}, \dots, a a a_{N}]$ 是列归一化的，即，

∀

∈

{

...

}

∈

{forall i} in {1,text{...} ,N}, pmb a_{i} in mathbb C^{M times 1}

$\forall i \in {1, ..., N}, a a a_{i} \in C^{M \times 1}$ ，满足

[

∥

]

mathbb E[{Vert pmb a_{i} Vert}_2]=1

$E [∥ a a a_{i} ∥_{2}] = 1$ 。AMP的迭代过程如下

(

−

)

−

′

(

−

)

(

−

)

⏟

(4a)

pmb r^{t}=pmb s^{t} + pmb A^{T}(pmb y - pmb A pmb s^{t}) +\ underbrace {frac {N}{M} <{eta_{t-1}}^{'}( pmb r^{t-1})>( pmb r^{t-1}-pmb s^{t-1} )}_{onsager text{ } term} tag{4a}

$r r r^{t} = s s s^{t} + A A A^{T} (y y y - A A A s s s^{t}) + o n s a g e r t e r m$

MN<ηt−1′(rrrt−1)>(rrrt−1−ssst−1)(4a)

(

)

(4b)

pmb {s^{t+1}}={eta}_{t}(pmb r^t) tag{4b}

$s^{t + 1} s^{t + 1} s^{t + 1} = η_{t} (r r r^{t}) (4 b)$

其中

{eta}_{t}

$η_{t}$ 是关于

pmb r^t

$r r r^{t}$ 的一个Lipschitz连续函数(component-wise)，

pmb s^t

$s s s^{t}$ 是最后的估计，

−

pmb r^{t}-pmb s^{t}

$r r r^{t} - s s s^{t}$ 其实就是一般AMP表达的“残差”(residual error)。式(4a)的最后一项就是前言所描述的"onsager"项，这一项是根据松弛信念传播算法（relaxed-Belief-Propagation, relaxed-BP）在极限条件下

→

∞

M,N rightarrow infty

$M, N \to \infty$ 时依据大数定律、中心极限定理和消息近似补偿（为了补偿经过近似的

(

)

O(frac {1}{sqrt N})

$O (N$

1)的消息），以及泰勒展开逐步推导出来的。

"onsager"项隐含的意义："onsager"项的存在确保了AMP-state evolution的正确性，但是在推导AMP之前，relaxed-BP里边的方差项其实跟state-evolution是对应的（只是对应，并不相等），区别在于当

M

,

N

<

∞

M,N lt infty

$M, N < \infty$ 时，relaxed-BP的方差项（指消息传递过程中，消息分布的方差逐渐积累）一般记为

Σ

m

n

(

t

)

Sigma^n_{m}(t)

$Σ_{m n} (t)$ ，这里不去管具体的

n

,

m

n,m

$n, m$ 是什么含义了，

t

t

$t$ 是指迭代到第

t

t

$t$ 步，只是它隐式地强调了

A

pmb A

$A A A$ 和估计

s

t

pmb s^{t}

$s s s^{t}$ 具有相关性。而

M

,

N

→

∞

M,N rightarrow infty

$M, N \to \infty$ 时借助大数定理和中心极限定理进一步推导可以使得

lim

⁡

M

,

N

→

∞

Σ

m

n

(

t

)

→

Σ

(

t

)

lim_{M,Nto infty}Sigma^n_{m}(t) rightarrow Sigma(t)

$lim_{M, N \to \infty} Σ_{m n} (t) \to Σ (t)$ ，即去掉了相关性。

3.2 AMP-state evolution与等效信号模型

为了方便之后OAMP的讨论，下面的叙述几乎都是基于OAMP原论文的，表达式跟一般的AMP表达式有些差异，是为了类比，在后面方便证明正交性，本质上并无差异。

定义两种误差，第一种误差是非线性估计结果

pmb s^t

$s s s^{t}$ 与真实值的差，第二种误差是线性估计结果

pmb r^t

$r r r^{t}$ 与真实值的差，分别定义为

−

(5a)

pmb q^t = pmb s^t - pmb x tag{5a}

$q q q^{t} = s s s^{t} - x x x (5 a)$

−

(5b)

pmb h^t = pmb r^t - pmb x tag{5b}

$h h h^{t} = r r r^{t} - x x x (5 b)$

结合(5), (4)可以被展开为

(

−

)

−

′

(

−

)

(

−

)

(6a)

pmb h^t = (pmb I - pmb A^T pmb A)pmb q^t + pmb A^Tpmb n + \frac {N}{M}<eta^{'}_{t-1}(pmb x + pmb h^{t-1})>(pmb h^{t-1}-pmb q^{t-1}) tag{6a}

$h h h^{t} = (I I I - A A A^{T} A A A) q q q^{t} + A A A^{T} n n n + \frac{N}{M} < η_{t - 1^{'}} (x x x + h h h^{t - 1}) > (h h h^{t - 1} - q q q^{t - 1}) (6 a)$

(

)

−

(6b)

pmb q^{t+1}=eta_{t}(pmb x + pmb h^t)-pmb x tag{6b}

$q q q^{t + 1} = η_{t} (x x x + h h h^{t}) - x x x (6 b)$

式(6)并不是要给迭代算法，因为真实值

pmb x

$x x x$ 作为一个已知的量参与其中。

与AMP对应的evolution由下式直接给出，这里不展开描述，因为AMP-evolution的证明过程极其复杂，但是如果只是理解，有一个简单的思路，就是如上面所述，从relaxed-BP入手，着眼于其方差演变，可以在一定程度上帮助理解。

(7a)

tau^2_{t}=frac {N}{M} v^2_{t}+sigma^2 tag{7a}

$τ_{t 2} = \frac{N}{M} v_{t 2} + σ^{2} (7 a)$

{

[

(

)

−

]

}

(7b)

v^2_{t+1}=mathbb E{[eta_{t}(X+tau_{t}Z)-X]^2} tag{7b}

$v_{t + 1 2} = E {[η_{t} (X + τ_{t} Z) - X]^{2}} (7 b)$

注意式(7b)中的

X,Z

$X, Z$ 表示随机变量，并且

∼

(

)

Z sim mathcal N(0,1)

$Z \sim N (0, 1)$ 与

$X$ 独立。这里的理解对AMP以及AMP-state evolution是至关重要的，因为其独立性，我们可以将每次迭代估计得到的结果模型等效为

∼

(

)

(8)

hat X^t=X+tau^2_{t}Z, Z sim mathcal N(0,1) tag{8}

$X^^{t} = X + τ_{t 2} Z, Z \sim N (0, 1) (8)$

这也意味着

∼

(

)

(9)

hat X^t sim mathcal N(X,tau^2_{t}) tag{9}

$X^^{t} \sim N (X, τ_{t 2}) (9)$

τ

t

2

tau^2_{t}

$τ_{t 2}$ 指的是估计后的方差，结合式(7a)可以看出，方差项由高斯噪声的方差

σ

2

sigma^2

$σ^{2}$ 和非线性估计结果与真实值之间的MSE构成。这反映了两点，一方面，高斯噪声与其他各个变量都保持独立，另一方面，AMP从始至终虽然都旨在接近真实值，因为

τ

t

tau^t

$τ^{t}$ 一直在变小，但是依然没有克服高斯噪声。

等效模型还有一个重要的作用就是，在部分

eta

$η$ 函数的推导过程中，使用等效模型的概念可以一定程度上简化推导过程，比如推导MMSE函数，或者退化为LMMSE等。以及，

tau^2_{t}

$τ_{t 2}$ 可能作为其中的一个参数，然而实际的仿真中我们并不知道真实

tau^2_{t}

$τ_{t 2}$ ，这个时候就需要将其近似为

hat tau^2_{t}

$τ^_{t 2}$ ，具体表示为

∥

−

∥

(10)

hat tau^2_{t}=frac {1}{N} {Vert pmb r^t - pmb s^t Vert}^2_{2} tag {10}

$τ^_{t 2} = \frac{1}{N} ∥ r r r^{t} - s s s^{t} ∥_{22} (10)$

4 OAMP

4.1 OAMP产生的动机

在阐述动机之前，先描述论文给出的一个定义

定义1： Divergence-free
对函数

η

:

R

↦

R

eta: mathbb R mapsto mathbb R

$η : R \mapsto R$ ，如果满足

E

[

η

′

(

R

)

]

=

0

mathbb E [eta^{'}(R)]=0

$E [η^{^{'}} (R)] = 0$

那么就认为

η

eta

$η$ 是devergence-free

根据定义1，一个divergence-free的函数可以被构造成

(

)

⋅

(

)

−

[

(

)

]

⋅

)

(11)

eta(r)=C cdot (hat eta( r)-mathbb E[hat eta(R)] cdot r) tag{11}

$η (r) = C \cdot (η^(r) - E [η^(R)] \cdot r) (11)$

其中

hat eta

$η^$ 是任意一个一阶可导的函数，C是常数。

如果把AMP迭代公式(4)中的"onsager"项给去掉，

eta

$η$ 函数按照式(11)的方式给出，其中

hat eta

$η^$ 是软阈值函数（压缩感知常用来恢复稀疏信号的函数），在这样的设置下，作者发现即使感知矩阵

pmb A

$A A A$ 不是高斯矩阵，而是一个离散余弦变换矩阵，state evolution的结果却意外地与去"onsager"的AMP迭代结果一致。这个发现也就引出了OAMP。

4.2 去相关的线性估计

先给出两个定义

定义2： 酉不变矩阵(Unitarily-Invariant Matrix)
如果矩阵

U

,

V

,

Σ

pmb U,pmb V,pmb Sigma

$U U U, V V V, Σ Σ Σ$ 三者之间相互独立，并且

U

,

V

pmb U,pmb V

$U U U, V V V$ 满足Haar分布(随机各向同性)是正交阵，

Σ

pmb Sigma

$Σ Σ Σ$ 是对角阵，那么认为

A

=

U

Σ

V

pmb A= pmb U pmb Sigma pmb V

$A A A = U U U Σ Σ Σ V V V$ 是酉不变的。

定义3： 去相关矩阵
如果感知矩阵

A

=

U

Σ

V

pmb A= pmb U pmb Sigma pmb V

$A A A = U U U Σ Σ Σ V V V$ 是酉不变的，矩阵

W

pmb W

$W W W$ 如果满足

t

r

(

I

−

W

A

)

=

0

tr(pmb I - pmb W pmb A)=0

$t r (I I I - W W W A A A) = 0$ ，就说

W

pmb W

$W W W$ 是关于

A

pmb A

$A A A$ 的一个去相关矩阵。指定准去相关矩阵

W

^

=

U

G

V

T

(12)

hat {pmb W}=pmb U pmb G pmb V^T tag{12}

$W W W^= U U U G G G V V V^{T} (12)$

那么满足

t

r

(

I

−

W

A

)

tr(pmb I - pmb W pmb A)

$t r (I I I - W W W A A A)$ 的去相关矩阵

W

pmb W

$W W W$ 可以被构建为

W

=

N

t

r

(

W

^

A

)

W

^

(13)

pmb W= frac {N}{tr(hat {pmb W} pmb A)} hat {pmb W} tag{13}

$W W W = \frac{N}{t r ( W W W ^ A A A )} W W W^(13)$

其实定义3在论文中并没有直接给出，是我抽出来的，而且跟论文稍有出入，但是问题不大。我刚开始读到这里的去相关概念的时候非常不理解，如果矩阵A的映射是单射或者双射，可能稍微懂个大概，满射可能把

pmb W

$W W W$ 乘在右边，但是概念依然很模糊，后来请教了一下数院的学长，大概意思就说作者就是这么叫了而已。所以这里也就理解个大概吧，没有再细究。

下面给出三个常用的准去相关矩阵
（1）匹配滤波器(Matched Filter, MF)

(14a)

hat {pmb W}^{MF}=pmb A^T tag{14a}

$W W W^^{M F} = A A A^{T} (14 a)$

（2）伪逆(Pseudo-inverse, PINV)

{

(

)

−

;

(

)

−

;

(14b)

hat {pmb W}^{PINV}= left{ begin{array}{lr} pmb A^T (pmb A pmb A^T)^{-1}; M<N \ (pmb A^T pmb A)^{-1} pmb A^T; M>N end{array} right tag{14b}.

$WWW^PINV={AAAT(AAAAAAT)−1;M<N(AAATAAA)−1AAAT;M>N(14b)$

（3）LMMSE

(

)

−

(14c)

hat {pmb W}^{LMMSE}=pmb A^T(pmb A pmb A^T+frac {sigma^2}{v^2} pmb I)^{-1} tag{14c}

$W W W^^{L M M S E} = A A A^{T} (A A A A A A^{T} + \frac{σ ^{2}}{v ^{2}} I I I)^{- 1} (14 c)$

其实式(14c)中

v^2

$v^{2}$ 的含义有些微妙，将在后面合适的地方做更深的阐述。

LMMSE的简述
假设模型为

y

=

A

x

+

n

pmb y = pmb A pmb x + pmb n

$y y y = A A A x x x + n n n$ ，假设随机向量

X

,

Y

X,Y

$X, Y$ 的均值都为0（实际当中不满足的话可以先减去均值），

n

∼

C

N

(

0

,

σ

2

I

)

pmb n sim mathcal C mathcal N(0,sigma^2 pmb I)

$n n n \sim C N (0, σ^{2} I I I)$ ，那么LMMSE的估计为

x

^

=

Σ

x

y

Σ

y

−

1

y

hat {pmb x} = Sigma_{xy} Sigma^{-1}_{y} pmb y

$x x x^= Σ_{x y} Σ_{y - 1} y y y$

其中

Σ

x

y

=

E

[

x

y

H

]

=

E

[

x

(

A

x

+

n

)

H

]

=

E

[

x

x

H

A

+

x

n

H

]

=

Σ

x

A

Sigma_{xy} = mathbb E[pmb x pmb y^{H}]=mathbb E[pmb x pmb (pmb A pmb x+pmb n)^{H}]=mathbb E[pmb x pmb x^Hpmb A+pmb xpmb n^H]=Sigma_{x} pmb A

$Σ_{x y} = E [x x x y y y^{H}] = E [x x x (((A A A x x x + n n n)^{H}] = E [x x x x x x^{H} A A A + x x x n n n^{H}] = Σ_{x} A A A$

Σ

y

=

E

[

y

y

H

]

=

E

[

(

A

x

+

n

)

(

A

x

+

n

)

H

]

=

A

Σ

x

A

H

+

σ

2

I

begin{aligned} Sigma_{y} &= mathbb E[pmb y pmb y^{H}] \ &=mathbb E[(pmb A pmb x+pmb n) pmb (pmb A pmb x+pmb n)^{H}] \ &=pmb A Sigma_{x} pmb A^H+sigma^2 pmb I end{aligned}

$Σ_{y} = E [y y y y y y^{H}] = E [(A A A x x x + n n n) (((A A A x x x + n n n)^{H}] = A A A Σ_{x} A A A^{H} + σ^{2} I I I$

那么LMMSE的估计可以转化为

x

^

=

Σ

x

A

(

A

Σ

x

A

H

+

σ

2

I

)

−

1

y

hat {pmb x} = Sigma_{x} pmb A (pmb A Sigma_{x} pmb A^H+sigma^2 pmb I)^{-1}y

$x x x^= Σ_{x} A A A (A A A Σ_{x} A A A^{H} + σ^{2} I I I)^{- 1} y$

该结果还可以继续延申，根据

(

E

+

B

C

D

)

−

1

=

E

−

1

−

E

−

1

B

(

C

−

1

+

D

E

−

1

B

)

−

1

D

E

−

1

(pmb E + pmb B pmb C pmb D)^{-1}=pmb E^{-1}- pmb E^{-1} pmb B (pmb C^{-1}+ D pmb E^{-1} pmb B)^{-1} pmb D pmb E^{-1}

$(E E E + B B B C C C D D D)^{- 1} = E E E^{- 1} - E E E^{- 1} B B B (C C C^{- 1} + D E E E^{- 1} B B B)^{- 1} D D D E E E^{- 1}$

将上述公式代入

Σ

y

Sigma_{y}

$Σ_{y}$ 项即可。

4.3 OAMP算法

OAMP的迭代公式

(

−

)

(15a)

pmb r^{t}=pmb s^{t} + pmb W_{t}(pmb y - pmb A pmb s^{t}) tag{15a}

$r r r^{t} = s s s^{t} + W W W_{t} (y y y - A A A s s s^{t}) (15 a)$

(

)

(15b)

pmb s^{t+1} = eta_{t}(pmb r^t) tag{15b}

$s s s^{t + 1} = η_{t} (r r r^{t}) (15 b)$

其中

pmb W_{t}

$W W W_{t}$ 是去相关矩阵，

eta_{t}

$η_{t}$ 是满足divergence-free的约束，即式(11)。将该式与AMP迭代式(4)做比较，可以发现线性估计中的矩阵

pmb A^T

$A A A^{T}$ 变得更一般化，不再局限于匹配滤波，而且末尾缺少了"onsager"项，把“onsager”的作用加在了divergence-free约束里，这也跟OAMP动机部分所阐述的内容一致。

4.4 估计误差迭代与OAMP-state evolution

依然保持式(5a, 5b)所述的误差符号

pmb h^t, pmb q^t

$h h h^{t}, q q q^{t}$ ，可以类比AMP中的式(6)写出OAMP的误差迭代，如下

(16a)

pmb h^t = pmb B_{t} pmb q^t + pmb W_{t} pmb n tag{16a}

$h h h^{t} = B B B_{t} q q q^{t} + W W W_{t} n n n (16 a)$

(

)

−

(16b)

pmb q^{t+1}=eta_{t}(pmb x+pmb h^t) - pmb x tag{16b}

$q q q^{t + 1} = η_{t} (x x x + h h h^{t}) - x x x (16 b)$

其中

−

pmb B_{t} = pmb I-pmb W_{t} pmb A

$B B B_{t} = I I I - W W W_{t} A A A$ ，然后如AMP一样，指定

[

∥

]

(17a)

tau^2_{t}=frac {1}{N} mathbb E[{Vert pmb h^t Vert}^2_{2}] tag{17a}

$τ_{t 2} = \frac{1}{N} E [∥ h h h^{t} ∥_{22}] (17 a)$

[

∥

]

(17b)

v^2_{t+1}=frac {1}{N} mathbb E[{Vert pmb q^{t+1} Vert}^2_{2}] tag{17b}

$v_{t + 1 2} = \frac{1}{N} E [∥ q q q^{t + 1} ∥_{22}] (17 b)$

式(17)就是所谓的state evolution，可以对式(17a)做进一步推导

[

∥

]

[

∥

]

{

[

∥

]

[

∥

]

}

{

[

(

)

]

[

(

)

]

}

{

[

(

)

]

⋅

[

∥

]

[

(

)

]

⋅

[

∥

]

}

{

[

(

)

]

⋅

[

(

)

]

⋅

}

[

(

)

]

⋅

[

(

)

]

⋅

begin{aligned} tau^2_{t}&= frac {1}{N} mathbb E[{Vert pmb h^t Vert}^2_{2}] \ &=frac {1}{N} mathbb E[{Vert pmb B_{t} pmb q^t + pmb W_{t} pmb n Vert}^2_{2}] \ &=frac {1}{N} { mathbb E [{Vert pmb B_t pmb q^t Vert}^2_{2}] + mathbb E [{Vert pmb W_t pmb n Vert}^2_{2}] } \ &=frac {1}{N} { mathbb E [tr ( (pmb q^t)^T pmb B^T_t pmb B_t pmb q^t) )] + mathbb E [tr(pmb n^T pmb W^T_t pmb W_t pmb n)] } \ &=frac {1}{N} { mathbb E [tr(pmb B^T_t pmb B_t )] cdot E[{Vert pmb q^{t} Vert}^2_{2}] + mathbb E [tr(pmb W^T_t pmb W_t )] cdot E[{Vert pmb n Vert}^2_{2}] } \ &=frac {1}{N} { mathbb E [tr(pmb B^T_t pmb B_t )] cdot N v^2_t + mathbb E [tr(pmb W^T_t pmb W_t )] cdot M sigma^2 } \ &=mathbb E [tr(pmb B^T_t pmb B_t )] cdot v^2_t + frac {M}{N} mathbb E [tr(pmb W^T_t pmb W_t )] cdot sigma^2 end{aligned}

$τ_{t 2} = \frac{1}{N} E [∥ h h h^{t} ∥_{22}] = \frac{1}{N} E [∥ B B B_{t} q q q^{t} + W W W_{t} n n n ∥_{22}] = \frac{1}{N} {E [∥ B B B_{t} q q q^{t} ∥_{22}] + E [∥ W W W_{t} n n n ∥_{22}]} = \frac{1}{N} {E [t r ((q q q^{t})^{T} B B B_{t T} B B B_{t} q q q^{t}))] + E [t r (n n n^{T} W W W_{t T} W W W_{t} n n n)]} = \frac{1}{N} {E [t r (B B B_{t T} B B B_{t})] \cdot E [∥ q q q^{t} ∥_{22}] + E [t r (W W W_{t T} W W W_{t})] \cdot E [∥ n n n ∥_{22}]} = \frac{1}{N} {E [t r (B B B_{t T} B B B_{t})] \cdot N v_{t 2} + E [t r (W W W_{t T} W W W_{t})] \cdot M σ^{2}} = E [t r (B B B_{t T} B B B_{t})] \cdot v_{t 2} + \frac{M}{N} E [t r (W W W_{t T} W W W_{t})] \cdot σ^{2}$

注意：上面推导出来的结果与OAMP论文式(23)给出的在系数上有差异，感觉应该上面是正确的，不管如何，思路应该没什么问题。那么，据此，就可以轻易地写出OAMP-state evolution

[

(

)

]

⋅

[

(

)

]

⋅

(18a)

tau^2_{t}=mathbb E [tr(pmb B^T_t pmb B_t )] cdot v^2_t + frac {M}{N} mathbb E [tr(pmb W^T_t pmb W_t )] cdot sigma^2 tag{18a}

$τ_{t 2} = E [t r (B B B_{t T} B B B_{t})] \cdot v_{t 2} + \frac{M}{N} E [t r (W W W_{t T} W W W_{t})] \cdot σ^{2} (18 a)$

[

∣

(

)

−

∣

]

(18b)

v^2_{t+1}=mathbb E[{vert eta_t(X+tau_t Z) - X vert}^2] tag{18b}

$v_{t + 1 2} = E [∣ η_{t} (X + τ_{t} Z) - X ∣^{2}] (18 b)$

其中

∼

(

)

X sim P_X(x)

$X \sim P_{X} (x)$ ，与

∼

(

)

Z sim mathcal N(0,1)

$Z \sim N (0, 1)$ 独立。

4.5 关于OAMP的合理性以及两个重要假设

关于OAMP的合理性，前言部分已经做了简短的铺垫，这里再详细展开。论文作者提出了两个假设，虽然OAMP的证明并不严格，但是基于两个假设展开的讨论还是比较合理的。

假设1：式(16a)中的

h

t

∼

N

(

0

,

τ

t

2

)

pmb h^t sim mathcal N(0,tau^2_t)

$h h h^{t} \sim N (0, τ_{t 2})$ ，并且独立于真实值

x

pmb x

$x x x$ 。
假设2：式(16b)中的

q

t

+

1

pmb q^{t+1}

$q q q^{t + 1}$ 里的元素是独立同分布的(i.i.d)，并且独立于

A

,

n

pmb A, pmb n

$A A A, n n n$ 。

一般的条件会有

pmb x

$x x x$ 是i.i.d.的，独立于

pmb A, pmb n

$A A A, n n n$ ，在OAMP中，当迭代次数

−

t=-1

$t = - 1$ 时，

−

pmb q^0=- pmb x

$q q q^{0} = - x x x$ ，因此假设2在

−

t=-1

$t = - 1$ 时是成立的。虽然OAMP的线性迭代式(15a)比AMP的线性迭代式(4a)少了"onsager"这一项，但是只有我们能证明假设2在迭代过程中一直成立，那么式(15a)便是合理的，因为"onsager"的作用就是去除迭代估计结果与

pmb A

$A A A$ 的相关性。接下来会提出两个推论来更直观地理解OAMP。

4.5.1 从假设2看假设1

推论1：如果假设2是成立的，矩阵

A

pmb A

$A A A$ 是酉不变的，

W

t

pmb W_t

$W W W_{t}$ 是去相关矩阵，那么就有

h

t

pmb h^t

$h h h^{t}$ 的元素与

x

pmb x

$x x x$ 的元素不相关，以及，

h

t

pmb h^t

$h h h^{t}$ 的元素彼此之间不相关，而且它们拥有共同的方差，均值为0。

证明：从式(16b)

q

t

+

1

=

η

t

(

x

+

h

t

)

−

x

pmb q^{t+1}=eta_{t}(pmb x+pmb h^t) - pmb x

$q q q^{t + 1} = η_{t} (x x x + h h h^{t}) - x x x$ 可以看出，

q

t

pmb q^t

$q q q^{t}$ 与

x

pmb x

$x x x$ 具有相关性，这可能会进一步导致

h

t

pmb h^t

$h h h^{t}$ 与

x

pmb x

$x x x$ 的相关，因为式(16a)中

h

t

pmb h^t

$h h h^{t}$ 由

q

t

pmb q^t

$q q q^{t}$ 生成。但去相关矩阵

W

t

pmb W_t

$W W W_{t}$ 的引入可以抑制此相关性，具体描述如下。
因为

A

=

V

Σ

U

T

pmb A=pmb V Sigma pmb U^T

$A A A = V V V Σ U U U^{T}$ ，

W

t

=

U

G

t

V

T

pmb W_t=pmb U pmb G_t pmb V^T

$W W W_{t} = U U U G G G_{t} V V V^{T}$ ，

B

=

I

−

W

t

A

=

U

(

I

−

G

t

Σ

)

U

T

pmb B = pmb I- pmb W_t pmb A = pmb U(pmb I-pmb G_t Sigma) pmb U^T

$B B B = I I I - W W W_{t} A A A = U U U (I I I - G G G_{t} Σ) U U U^{T}$ ，那么

E

U

[

(

B

t

)

i

,

j

]

=

∑

m

=

1

N

E

[

U

i

,

m

U

j

,

m

]

⋅

(

1

−

g

m

λ

m

)

mathbb E_U[(pmb B_t)_{i,j}] = sum_{m=1}^N mathbb E[U_{i,m} U_{j,m}] cdot (1-g_m lambda_m)

$E_{U} [(B B B_{t})_{i, j}] = m = 1 \sum N E [U_{i, m} U_{j, m}] \cdot (1 - g_{m} λ_{m})$

其中

λ

m

,

g

m

lambda_m, g_m

$λ_{m}, g_{m}$ 分别是矩阵

A

,

W

t

pmb A, pmb W_t

$A A A, W W W_{t}$ 的奇异值，并且当

m

>

M

m>M

$m > M$ 时，

λ

m

=

g

m

=

0

lambda_m=g_m=0

$λ_{m} = g_{m} = 0$ 。
对于一个Haar分布的矩阵

U

pmb U

$U U U$ ，有

E

[

U

i

,

m

U

j

,

m

]

=

{

0

;

i

≠

j

N

−

1

;

i

=

j

mathbb E[U_{i,m} U_{j,m}]= left{ begin{array}{lr} 0; i neq j \ N^{-1}; i=j end{array} right.

$E [U_{i, m} U_{j, m}] = {0; i \neq = j N^{- 1}; i = j$

那么就有

E

U

[

(

B

t

)

i

,

j

]

=

{

0

;

i

≠

j

1

N

t

r

(

B

t

)

;

i

=

j

mathbb E_U[(pmb B_t)_{i,j}]= left{ begin{array}{lr} 0; i neq j \ frac {1}{N} tr ( pmb B_t ); i=j end{array} right.

$E_{U} [(B B B_{t})_{i, j}] = {0; i \neq = j \frac{1}{N} t r (B B B_{t}); i = j$

因为

W

t

pmb W_t

$W W W_{t}$ 是去相关矩阵，根据定义3，有

t

r

(

B

t

)

=

t

r

(

I

−

W

t

A

)

=

0

tr(pmb B_t)=tr(pmb I - pmb W_t pmb A)=0

$t r (B B B_{t}) = t r (I I I - W W W_{t} A A A) = 0$ ，所以

E

[

B

t

]

=

0

mathbb E[pmb B_t] = 0

$E [B B B_{t}] = 0$

假设2给出了条件，

q

t

pmb q^t

$q q q^{t}$ 独立于

A

pmb A

$A A A$ ，显然也独立于

B

t

pmb B_t

$B B B_{t}$ ，那么

E

[

h

t

]

=

E

[

B

t

q

t

]

+

E

[

W

t

n

]

=

E

[

B

t

]

E

[

q

t

]

+

E

[

W

t

]

E

[

n

]

=

0

N

(19)

begin{aligned} mathbb E[pmb h^t] &= mathbb E[pmb B_t pmb q^t] + mathbb E[pmb W_t pmb n] \ &=mathbb E[pmb B_t] mathbb E[pmb q^t] + mathbb E[pmb W_t] mathbb E[pmb n] \ &=pmb 0_N end{aligned} tag{19}

$E [h h h^{t}] = E [B B B_{t} q q q^{t}] + E [W W W_{t} n n n] = E [B B B_{t}] E [q q q^{t}] + E [W W W_{t}] E [n n n] = 000_{N} (19)$

又

h

t

=

B

t

q

t

+

W

t

n

pmb h^t = pmb B_{t} pmb q^t + pmb W_{t} pmb n

$h h h^{t} = B B B_{t} q q q^{t} + W W W_{t} n n n$ ，要证

x

pmb x

$x x x$ 与

h

t

pmb h^t

$h h h^{t}$ 不相关，只需要证

x

pmb x

$x x x$ 与

B

t

q

t

pmb B_{t} pmb q^t

$B B B_{t} q q q^{t}$ 不相关（已经有

E

[

B

t

q

t

]

=

0

N

mathbb E[pmb B_t pmb q^t]=pmb 0_N

$E [B B B_{t} q q q^{t}] = 000_{N}$ ，所以满足正交性即可）

E

[

h

t

x

T

]

=

E

[

B

t

q

t

x

T

]

=

E

[

B

t

]

E

[

q

t

x

T

]

=

0

N

×

N

(20)

mathbb E[pmb h^t pmb x^T]= mathbb E[pmb B_t pmb q^t pmb x^T]=mathbb E[pmb B_t] mathbb E[ pmb q^t pmb x^T]=pmb 0_{N times N} tag{20}

$E [h h h^{t} x x x^{T}] = E [B B B_{t} q q q^{t} x x x^{T}] = E [B B B_{t}] E [q q q^{t} x x x^{T}] = 000_{N \times N} (20)$

所以，根据

E

[

h

t

]

=

0

N

mathbb E[pmb h^t]=pmb 0_N

$E [h h h^{t}] = 000_{N}$ 和

E

[

h

t

x

T

]

=

0

N

×

N

mathbb E[pmb h^t pmb x^T]=pmb 0_{N times N}

$E [h h h^{t} x x x^{T}] = 000_{N \times N}$ （正交性），必然有

x

pmb x

$x x x$ 与

h

t

pmb h^t

$h h h^{t}$ 不相关。要证

h

t

pmb h^t

$h h h^{t}$ 的元素彼此之间不相关，而且它们拥有共同的方差，均值为0，只需证明

h

t

pmb h^t

$h h h^{t}$ 为对角阵的系数，这里省略。

事实上，因为

[

]

[

]

mathbb E[pmb B_t]=mathbb E[pmb n]

$E [B B B_{t}] = E [n n n]$ 都为0，式(19)隐含了

pmb h^t ,pmb q^t

$h h h^{t}, q q q^{t}$ 的正交性

[

(

)

]

(21)

mathbb E[pmb h^t (pmb q^t)^T]=pmb 0_{N times N} tag{21}

$E [h h h^{t} (q q q^{t})^{T}] = 000_{N \times N} (21)$

从推论1的证明过程中可以看出，去相关矩阵

pmb W_t

$W W W_{t}$ 在里边起到了重要的去相关作用(间接地借助了

−

pmb B = pmb I- pmb W_t pmb A

$B B B = I I I - W W W_{t} A A A$ )。除此之外，还可以看出OAMP对矩阵

pmb A

$A A A$ 的特征值没有任何束缚，所以潜在的应用范围会更广一些相对于AMP。

4.5.2 从假设1看假设2

在这一部分，我们尝试基于假设1，来推出假设2，从式(16)可以看出，如果

pmb q^{t+1}

$q q q^{t + 1}$ 与

pmb h^t

$h h h^{t}$ 独立，那么

pmb q^{t+1}

$q q q^{t + 1}$ 与

pmb A, pmb n

$A A A, n n n$ 也独立，因为(16b)中

pmb q^{t+1}

$q q q^{t + 1}$ 只跟

pmb h^t

$h h h^{t}$ 和

pmb x

$x x x$ 有关系，那么就存在这样一条马尔可夫链(注意上标

$t$ )

→

pmb A, pmb n rightarrow pmb h^t rightarrow pmb q^{t+1}

$A A A, n n n \to h h h^{t} \to q q q^{t + 1}$

也就是说，如果我们能够证明

pmb q^{t+1}

$q q q^{t + 1}$ 与

pmb h^t

$h h h^{t}$ 独立，那么假设2就自然而然成立。但遗憾的是我们并不能证明独立性，只能证明正交性，再推广到不相关（推论2将阐述）。

回到定义1里边所阐述的divergence-free函数，利用Lipchitz函数期望的收敛性，我们可以构建一个近似divergence-free函数，如下

(

)

⋅

{

(

)

−

(

∑

′

(

)

⋅

}

(22)

eta_t(pmb r^t)=C cdot { hat eta_t(pmb r^t)-mathbb (frac{1}{N} sum_{j=1}^N hat eta^{'}_t( r^t_j)) cdot pmb r^t } tag{22}

$ηt(rrrt)=C⋅{η^t(rrrt)−(N1j=1∑Nη^t′(rjt))⋅rrrt}(22)$

备注：式(22)的近似divergence-free函数与OAMP的迭代公式(15)结合，便是真正的实际所采用的OAMP算法。

推论2：如果

η

eta

$η$ 是divergence-free函数，那么

E

[

τ

t

Z

⋅

η

(

X

+

τ

t

Z

)

]

=

0

(23)

mathbb E[tau_t Z cdot eta(X+tau_t Z )]=0 tag{23}

$E [τ_{t} Z \cdot η (X + τ_{t} Z)] = 0 (23)$

在证明上式之前，先引入一个重要引理
Stein引理：对

∀

ψ

:

R

↦

R

forall psi: R mapsto R

$\forall ψ : R \mapsto R$ ，使得下式中的期望存在，有

E

[

Z

⋅

ψ

(

Z

)

]

=

E

[

ψ

′

(

Z

)

]

(24)

mathbb E[Z cdot psi(Z)]=mathbb E[psi^{'}(Z)] tag{24}

$E [Z \cdot ψ (Z)] = E [ψ^{^{'}} (Z)] (24)$

让

ϕ

(

Z

)

=

η

t

(

X

+

τ

t

Z

)

phi(Z)=eta_t(X+tau_t Z)

$ϕ (Z) = η_{t} (X + τ_{t} Z)$ ，根据Stein引理，

E

[

τ

t

Z

⋅

η

t

(

X

+

τ

t

Z

)

]

=

τ

t

⋅

E

X

{

E

Z

∣

X

[

Z

⋅

η

t

(

X

+

τ

t

Z

)

]

}

=

τ

t

2

⋅

E

X

{

E

Z

∣

X

[

η

t

′

(

X

+

τ

t

Z

)

]

}

=

τ

t

2

⋅

E

[

η

t

′

(

X

+

τ

t

Z

)

]

begin{aligned} mathbb E[tau_t Z cdot eta_t(X+tau_t Z )] &= tau_t cdot mathbb E_X { mathbb E_{Z|X} [Z cdot eta_t(X+tau_t Z )] } \ &=tau^2_t cdot mathbb E_X { mathbb E_{Z|X} [ eta^{'}_t(X+tau_t Z )] } \ &=tau^2_t cdot mathbb E [ eta^{'}_t(X+tau_t Z )] end{aligned}

$E [τ_{t} Z \cdot η_{t} (X + τ_{t} Z)] = τ_{t} \cdot E_{X} {E_{Z ∣ X} [Z \cdot η_{t} (X + τ_{t} Z)]} = τ_{t 2} \cdot E_{X} {E_{Z ∣ X} [η_{t^{'}} (X + τ_{t} Z)]} = τ_{t 2} \cdot E [η_{t^{'}} (X + τ_{t} Z)]$

因为

η

t

eta_t

$η_{t}$ 是divergence-free函数，所以

E

[

η

t

′

(

X

+

τ

t

Z

)

]

=

0

mathbb E [ eta^{'}_t(X+tau_t Z )]=0

$E [η_{t^{'}} (X + τ_{t} Z)] = 0$ ，也就证明了(23)。而(23)等价于

E

[

(

R

t

−

X

)

⋅

(

η

t

(

R

t

)

−

X

)

]

=

0

(25)

mathbb E[(R^t-X) cdot (eta_t(R^t)-X)]=0 tag{25}

$E [(R^{t} - X) \cdot (η_{t} (R^{t}) - X)] = 0 (25)$

其中

R

t

=

X

+

τ

t

Z

R^t= X+ tau_t Z

$R^{t} = X + τ_{t} Z$ 。

式(25)直接推广可以得到

[

(

)

]

(26)

mathbb E[pmb h^t (pmb q^{t+1})^T]=pmb 0_{N times N} tag{26}

$E [h h h^{t} (q q q^{t + 1})^{T}] = 000_{N \times N} (26)$

强调为什么叫OAMP：式(21)说明了线性估计(16a)中，“input-error”

q

t

pmb q^t

$q q q^{t}$ 和"output-error"

h

t

pmb h^t

$h h h^{t}$ 是正交的（由推论1得出）；式(26)说明了非线性估计(16b)中，"before-error"

h

t

pmb h^t

$h h h^{t}$ 和"after-error"

q

t

+

1

pmb q^{t+1}

$q q q^{t + 1}$ 是正交的（由推论2得出）。这也就是OAMP名字里正交的由来。

4.6 MSE估计和state evolution仿真

在开始这部分之前，先回顾一下式(14c)LMMSE中的参数

v^2

$v^{2}$ ，OAMP迭代公式

(

−

)

(

−

)

pmb r^{t}=pmb s^{t} + pmb W_{t}(pmb y - pmb A pmb s^{t})=pmb s^{t} + pmb W_{t}(pmb A ( pmb x - pmb s^{t} )+ pmb n)

$r r r^{t} = s s s^{t} + W W W_{t} (y y y - A A A s s s^{t}) = s s s^{t} + W W W_{t} (A A A (x x x - s s s^{t}) + n n n)$ ，所以LMMSE中的参数

v^2

$v^{2}$ 表示

[

(

−

)

(

−

)

]

mathbb E[( pmb x - pmb s^{t} ) ( pmb x - pmb s^{t} )^T]=v^2 pmb I

$E [(x x x - s s s^{t}) (x x x - s s s^{t})^{T}] = v^{2} I I I$

两个MSE：

[

∥

]

v^2_t=frac{1}{N}{mathbb E[{Vert pmb q^t Vert}^2_2]}

$v_{t 2} = \frac{1}{N} E [∥ q q q^{t} ∥_{22}]$ ，

[

∥

]

tau^2_t=frac{1}{N}{mathbb E[{Vert pmb h^t Vert}^2_2]}

$τ_{t 2} = \frac{1}{N} E [∥ h h h^{t} ∥_{22}]$ ，它们可以看作是去相关矩阵

pmb W_t

$W W W_{t}$ 和divergence-free函数

eta_t

$η_{t}$ 的两个参数（这也就是为什么

pmb W_t

$W W W_{t}$ 有下标

$t$ 的原因）

4.6.1 非线性均方误差的估计

非线性均方误差

v^2_t

$v_{t 2}$ 的估计表达式

∥

−

∥

−

⋅

(

)

(27)

hat {v}^2_t=frac{1}{N} frac {{Vert {pmb y - pmb A pmb s^t} Vert}^2_2 - M cdot sigma^2} {tr(pmb A^T pmb A)} tag{27}

$v^_{t 2} = \frac{1}{N} \frac{∥ y y y - A A A s s s ^{t} ∥ _{22} - M \cdot σ ^{2}}{t r ( A A A ^{T} A A A )} (27)$

(27)的理解：

E

[

∥

y

−

A

s

t

∥

2

2

]

=

E

[

∥

A

x

−

A

s

t

+

n

∥

2

2

]

=

E

[

∥

A

(

x

−

s

t

)

∥

2

2

]

+

E

[

∥

n

∥

2

2

]

=

E

[

∥

(

x

−

s

t

)

∥

2

2

]

⋅

E

[

t

r

(

A

T

A

)

]

+

M

⋅

σ

2

=

E

[

∥

q

t

∥

2

2

]

⋅

E

[

t

r

(

A

T

A

)

]

+

M

⋅

σ

2

begin{aligned} mathbb E[{Vert {pmb y - pmb A pmb s^t} Vert}^2_2] &= mathbb E[{Vert {pmb A pmb x - pmb A pmb s^t + pmb n} Vert}^2_2] \ &=mathbb E[{Vert {pmb A( pmb x - pmb s^t )} Vert}^2_2] + mathbb E[{Vert {pmb n} Vert}^2_2] \ &= mathbb E[{Vert {( pmb x - pmb s^t )} Vert}^2_2] cdot mathbb E[tr(pmb A^T pmb A)] + M cdot sigma^2 \ &=mathbb E[{Vert pmb q^t Vert}^2_2] cdot mathbb E[tr(pmb A^T pmb A)] + M cdot sigma^2 \ end{aligned}

$E [∥ y y y - A A A s s s^{t} ∥_{22}] = E [∥ A A A x x x - A A A s s s^{t} + n n n ∥_{22}] = E [∥ A A A (x x x - s s s^{t}) ∥_{22}] + E [∥ n n n ∥_{22}] = E [∥ (x x x - s s s^{t}) ∥_{22}] \cdot E [t r (A A A^{T} A A A)] + M \cdot σ^{2} = E [∥ q q q^{t} ∥_{22}] \cdot E [t r (A A A^{T} A A A)] + M \cdot σ^{2}$

⇒

Rightarrow

$\Rightarrow$

v

^

t

2

=

1

N

E

[

∥

q

t

∥

2

2

]

=

1

N

E

[

∥

y

−

A

s

t

∥

2

2

]

−

M

⋅

σ

2

E

[

t

r

(

A

T

A

)

]

hat {v}^2_t=frac{1}{N} mathbb E[{Vert pmb q^t Vert}^2_2]=frac{1}{N} frac{mathbb E[{Vert {pmb y - pmb A pmb s^t} Vert}^2_2] - M cdot sigma^2}{mathbb E[tr(pmb A^T pmb A)]}

$v^_{t 2} = \frac{1}{N} E [∥ q q q^{t} ∥_{22}] = \frac{1}{N} \frac{E [ ∥ y y y - A A A s s s ^{t} ∥ _{22} ] - M \cdot σ ^{2}}{E [ t r ( A A A ^{T} A A A ) ]}$

式(27)跟论文差了一个系数

frac{1}{N}

$\frac{1}{N}$ ，感觉(27)会合适一些。

4.6.2 线性均方误差的估计

非线性估计与式(18a)一致

(

)

⋅

(

)

⋅

(28)

hat {tau}^2_t=tr(pmb B^T_t pmb B_t ) cdot hat {v}^2_t + frac {M}{N} tr(pmb W^T_t pmb W_t ) cdot sigma^2 tag{28}

$τ^_{t 2} = t r (B B B_{t T} B B B_{t}) \cdot v^_{t 2} + \frac{M}{N} t r (W W W_{t T} W W W_{t}) \cdot σ^{2} (28)$

强调：如果仿真OAMP迭代过程中需要用到

v

^

t

2

hat {v}^2_t

$v^_{t 2}$ 和

τ

^

t

2

hat {tau}^2_t

$τ^_{t 2}$ ，那么就是由(27,28)确定的。

5 总结

如果线性估计中的

{

}

{ pmb q^t, pmb h^t }

${q q q^{t}, h h h^{t}}$ 相互独立，非线性非线性估计中的

{

}

{ pmb q^{t+1}, pmb h^t }

${q q q^{t + 1}, h h h^{t}}$ 相互独立，那么假设1，2就自然而然成立。然而论文只能证明正交性，不能证明独立性，这也是OAMP里边正交的来源，虽然推论1，2弱于假设1，2，但是仿真结果表面OAMP-state evolution还是可靠的。即使对于一般的酉不变矩阵，对奇异值的分布没有严格的束缚，OAMP的性能依然可以被OAMP-state evolution表征，这也是AMP和AMP-state evolution所不能比拟的。因此，相对宽泛的感知矩阵使得OAMP的应用也更加广泛。

6 参考

[1] J. Ma and L. Ping, “Orthogonal AMP,” in IEEE Access, vol. 5, pp. 2020-2033, 2017, doi: 10.1109/ACCESS.2017.2653119.

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

启发式算法概率论矩阵算法线性代数

二维码

《结构体在内存中的对齐规则》多图易理解

< <上一篇

【PCA】2D-PCA原始文献《Two-Dimensional PCA》理解

下一篇>>

搜索内容

OAMP的理解

Orthogonal Approximate Message Passing, OAMP

1 前言

2 绪论

3 AMP

3.1 AMP算法

3.2 AMP-state evolution与等效信号模型

4 OAMP

4.1 OAMP产生的动机

4.2 去相关的线性估计

4.3 OAMP算法

4.4 估计误差迭代与OAMP-state evolution

4.5 关于OAMP的合理性以及两个重要假设

4.5.1 从假设2看假设1

4.5.2 从假设1看假设2

4.6 MSE估计和state evolution仿真

4.6.1 非线性均方误差的估计

4.6.2 线性均方误差的估计

5 总结

6 参考

最新文章

分类

标签云