再读经典:《用于脑电数据的独立成分分析》
2022-01-15
论文原文标题: Independent Component Analysis of Electroencephalographic Data
作者: Scott Makeig, Anthony J. Bell, Tzyy-Ping Jung, Terrence J. Sejnowski
发表于: 1996年 Advances in Neural Information Processing Systems (NIPS)
Google scholar引用数: 2.4k+.
独立成分分析(ICA)算是当今脑电数据处理的标准方法之一了。这篇96年NIPS的论文则是这方面的开山之作。所谓独立成分,就是从数据中分解出的子成分是相互统计独立的(statistically independent). 这是一个比平常所说的“不相关“(uncorrelated)更强的概念,因为如果随机变量 $X, Y$
不相关,则只需要随机变量的二阶矩(2nd moment)的函数为零即可。更具体讲, $X, Y$
不相关,意味着相关系数 $\rho_{X, Y} = \frac{Cov(X, Y)}{\sqrt{Var(X) Var(Y) }} = 0$
. 也就是 $Cov(X, Y) = E[XY] - E[X]E[Y] = 0$
. 而如果两随机变量统计独立,则需要满足概率密度函数 (pdf) $f_{X, Y} (x, y) = f_X(x) f_Y(y)$
. 想找到满足这一条件的分解的方法之一是使交互信息(mutual information) 为零,而交互信息是由所有高阶矩共同决定的。因此“统计独立”是比“不相关”要强很多的概念。
ICA所做的事叫做盲源分离(blind source separation):假设房间里有N个话筒,N个人在同时说话,并且每个人距离话筒的位置是随机的,那么话筒收到的声音会是这N个人混合的声音。如果用 $\boldsymbol{u} = [u_1 \;u_2 \cdots \; u_N]^T$
表示某一时刻N个话筒各自接收到的信号, $\boldsymbol{x} = [x_1 \;x_2 \cdots \; x_N]^T$
表示同一时刻这N个人各自说话的声音,ICA要做的就是找到矩阵 $\boldsymbol{W}$
使得 $\boldsymbol{u = Wx}$
成立,这里的$\boldsymbol{W}$
即对应着N人说话声到N话筒收到的混合声音的线性混合关系。 算出了$\boldsymbol{W}$
, 就可以用 $\boldsymbol{W^{-1}u}$
求出原信号(原文公式写的是 $\boldsymbol{u = Wx + w}$
而没有提 $\boldsymbol{w}$
的含义,应该是指噪声)
实际使用中,只有$\boldsymbol{u}$
(混合信号) 是已知的. ICA基于以下几个对$\boldsymbol{x}$
的假设/条件从$\boldsymbol{u}$
计算出$\boldsymbol{W}$
(1) $x_1, \; x_2 \; \cdots x_N$
统计独立
(2) 混合介质 (比如声音从发出,在空气中传递,然后被话筒采集)的延迟必须要小到可以忽略
(3) 源信号应该是模拟信号,并且它们的概率密度函数不能和sigmoid函数的梯度相差过大
(4) 源信号和接受端信号的个数应该是相同的(比如上面的例子,人数和话筒数相同)
在这篇论文中,$\boldsymbol{u}$
对应着采集的N个通道的脑电数据 (EEG / ERP), $\boldsymbol{x}$
对应着大脑中的源信号。在这种情景下,文章指出假设 (1) 比较合理,因为或许大脑确实有数个"独立信号源",它们的信号混合后得到EEG/ERP信号 ;条件(2)满足,因为电信号在脑组织中的传递速度极快;(3)的模拟信号要求猜测是因为ICA的模型都是用概率密度函数,所以应该是连续信号而非离散信号;后半部分则是因为ICA通常使用sigmoid函数作为假设的源信号的概率密度函数;假设(4)存疑,因为我们并不能预先知道大脑中有多少个独立源信号共同产生了EEG信号。因此在做ICA的时候,首先要确定一个合适的信号源个数,以及确定ICA分解出的这些成分的生理学意义。信号源个数的问题在后续很多其他ICA相关的论文中也有提及。人们通常会用一些指标来猜测比较合理的个数,不过到目前这应该仍旧是一个开放问题。
文章随后展示了ICA用在警觉性测试任务(听到特定声音就按按钮)中记录的14通道EEG和ERP分解出的子成分。这些成分可以有比较合理的神经生物学解释,比如EEG信号分解出了theta波、 alpha波。