刘伊君 Yijun Liu

再读经典:《用于脑电数据的独立成分分析》

2022-01-15


论文原文标题: Independent Component Analysis of Electroencephalographic Data
作者: Scott Makeig, Anthony J. Bell, Tzyy-Ping Jung, Terrence J. Sejnowski
发表于: 1996年 Advances in Neural Information Processing Systems (NIPS)
Google scholar引用数: 2.4k+.

论文链接

独立成分分析(ICA)算是当今脑电数据处理的标准方法之一了。这篇96年NIPS的论文则是这方面的开山之作。所谓独立成分,就是从数据中分解出的子成分是相互统计独立的(statistically independent). 这是一个比平常所说的“不相关“(uncorrelated)更强的概念,因为如果随机变量 $X, Y$不相关,则只需要随机变量的二阶矩(2nd moment)的函数为零即可。更具体讲, $X, Y$不相关,意味着相关系数 $\rho_{X, Y} = \frac{Cov(X, Y)}{\sqrt{Var(X) Var(Y) }} = 0$. 也就是 $Cov(X, Y) = E[XY] - E[X]E[Y] = 0$. 而如果两随机变量统计独立,则需要满足概率密度函数 (pdf) $f_{X, Y} (x, y) = f_X(x) f_Y(y)$. 想找到满足这一条件的分解的方法之一是使交互信息(mutual information) 为零,而交互信息是由所有高阶矩共同决定的。因此“统计独立”是比“不相关”要强很多的概念。

ICA所做的事叫做盲源分离(blind source separation):假设房间里有N个话筒,N个人在同时说话,并且每个人距离话筒的位置是随机的,那么话筒收到的声音会是这N个人混合的声音。如果用 $\boldsymbol{u} = [u_1 \;u_2 \cdots \; u_N]^T$ 表示某一时刻N个话筒各自接收到的信号, $\boldsymbol{x} = [x_1 \;x_2 \cdots \; x_N]^T$表示同一时刻这N个人各自说话的声音,ICA要做的就是找到矩阵 $\boldsymbol{W}$ 使得 $\boldsymbol{u = Wx}$ 成立,这里的$\boldsymbol{W}$即对应着N人说话声到N话筒收到的混合声音的线性混合关系。 算出了$\boldsymbol{W}$, 就可以用 $\boldsymbol{W^{-1}u}$ 求出原信号(原文公式写的是 $\boldsymbol{u = Wx + w}$ 而没有提 $\boldsymbol{w}$ 的含义,应该是指噪声)

实际使用中,只有$\boldsymbol{u}$ (混合信号) 是已知的. ICA基于以下几个对$\boldsymbol{x}$的假设/条件从$\boldsymbol{u}$计算出$\boldsymbol{W}$

(1) $x_1, \; x_2 \; \cdots x_N$ 统计独立

(2) 混合介质 (比如声音从发出,在空气中传递,然后被话筒采集)的延迟必须要小到可以忽略

(3) 源信号应该是模拟信号,并且它们的概率密度函数不能和sigmoid函数的梯度相差过大

(4) 源信号和接受端信号的个数应该是相同的(比如上面的例子,人数和话筒数相同)

在这篇论文中,$\boldsymbol{u}$ 对应着采集的N个通道的脑电数据 (EEG / ERP), $\boldsymbol{x}$ 对应着大脑中的源信号。在这种情景下,文章指出假设 (1) 比较合理,因为或许大脑确实有数个"独立信号源",它们的信号混合后得到EEG/ERP信号 ;条件(2)满足,因为电信号在脑组织中的传递速度极快;(3)的模拟信号要求猜测是因为ICA的模型都是用概率密度函数,所以应该是连续信号而非离散信号;后半部分则是因为ICA通常使用sigmoid函数作为假设的源信号的概率密度函数;假设(4)存疑,因为我们并不能预先知道大脑中有多少个独立源信号共同产生了EEG信号。因此在做ICA的时候,首先要确定一个合适的信号源个数,以及确定ICA分解出的这些成分的生理学意义。信号源个数的问题在后续很多其他ICA相关的论文中也有提及。人们通常会用一些指标来猜测比较合理的个数,不过到目前这应该仍旧是一个开放问题。

文章随后展示了ICA用在警觉性测试任务(听到特定声音就按按钮)中记录的14通道EEG和ERP分解出的子成分。这些成分可以有比较合理的神经生物学解释,比如EEG信号分解出了theta波、 alpha波。