introduction to neuroimage原创-灌水-无图
神经影像(neuroimage)说句老实话我一直觉得这不能算是一个领域,为何这么说呢,因为这个领域所包含的方法论涉及各个大家熟知,或者是已经有很长时间的学科基础。为啥会用neuroimage来叫这个学科呢?我自己可能入世未深解释不明,只是比较关注于neuroimage这个期刊而已。简单的说也就是神经科学的方法论。当然也有人觉得这归于computational neuroscience……当然还有可能属于影像学…….
首先谈谈我对这个学科的一些理解吧,说句老实话,这个学科不热闹。一个不热闹的学科注定了其人才的有限性,如果具体化的说我现在身在对神经科学的方法论研究上,很多人都是来自理工科,math,phy,CS,EE比比皆是,这些人据我观察….基本上是因为做原来的学科做不下去了,至少没办法跻身于一流研究才考虑转到现在这个方向,他们带着原有的数学功底,建模功底,计算机功底,信号处理功底来这一个新的领域,并在这个领域里面作出一些相当不错的成绩。不过我也不能太吹毛求疵,可能这个领域还在一个发展阶段,这种外来人才的引入也是一个必然性把。可能就是因为这个问题,每次我看到那些所谓的方法论(一般都是用计算机算法)都是让人觉得寒酸至极,这种层度的算法充其量也就只能在CS里面发个主流国际会议(ICPR和ICIP之流)。但是往往在neuroimage期刊上出现(影响因子高过PAMI),不过不得不说的是,领域内的科学风气确实比CS高,大部分CS写论文的充其量只能算是engineer的水平,引用不清不楚,背景也介绍的不清不楚。不过neuroimage领域的introduction部分实在太长了,论文也普遍偏长,实在是搞不懂,明明就那么点事,不能简单点写,非得长篇大论搞那么多。搞得我每次看都是非常吐血,写了一堆子屁话让我不得要领其motivation到底是什么,还得慢慢酝酿。
其次我想从数据的类型来说说这个领域所分析的数据和我们一般意义上image的比较。首先我们在image的定义大家可能都只有像素的概念,也就是画多少个方格子(pixel),然后这些方格子里面放下一个scalar值,再把这些方格子在一个二维平面上按照指定的顺序排好就构成了我们心中的图像。这个过程非常类似于活字印刷,大家自己想象。大家应该注意到一个scalar是一个变量,但是如果我们要表现彩色图像的话就可能需要一个多维的向量空间比如RGB颜色空间来描述这一个pixel的值,不知道大家有没有想过一个pixel的物理意义是什么?之所以深究这个问题是为了想让大家知道,我们意义上的成像实际上只是一个物理意义的表现形式,但是可能大家都没有过度关注到这一点。我拿X像来做比较,X像上面的每一个pixel其实记录出来的是一个物理意义的量,这个量代表X放射线的接受量,但是我们把这一物理意义值以一种色彩的mapping方式表达到一个合适的色彩空间就是我们所谓真正意义上的成像。这就是医学图像与我们常规图像最不一致的地方,物理意义首先就不一样。比如说CT(computered tomography)和MRI(核磁共振)扫描我们组织会得到不一样的像?为什么?就是因为他的原理以及最后记录下来的这个scalar意义不一样,CT像对于脑灰质和白质几乎是不能予以区分的,但是MRI就不同,相对而言就容易得多。还有一个与CV最大的不同就是MRI和CT这一类东西都是三维的,由pixel是在一个picture里面的最小单元做一个对应,voxel是一个volume里面的最小单位,也就是认为是一个9格魔方的一个小格(是三维的概念,而不是二维的格)。以上就是我介绍的第一种数据类型,对于这些问题而言,我们会有一些问题需求。
比如说是:图像分割(segmentation),为什么需要呢?很简单,脑子里面有skull,CSF(脑脊液),grey matter(灰质), white matter(白质),我们可能需要区分它们。把他们分别分开,便于数据分析。这个大家一看来就觉得狠simple,计算机视觉里面的segmentation不就解决了么?小case,事实上脑的分割仍然是个没有完全解决的问题,至少我们现在还在用所谓的概率分割,也就是说对于一个voxel我们并不能说是什么,只能说是什么的概率是多少,这也是所谓的软分割方法,你设个阈值强制性划分就成硬分割。这一块仍然还有人在做,但是已经不太热了……
另外就是,配准问题(registration),我就一句话来说明配准对于neuroscience领域的重要。没有配准就没有现在脑科学的发展,为什么呢?所谓的科学无非是在杂乱无章似乎毫无关系的现象事物之间找到所谓的共同点。因为有了配准不同的人脑之间才能通过配准才具有可比性,所以配准这个问题很早一起就开始起步了,从最早的affine变换配准到现在的用微分同胚,这个领域的配准问题比计算机视觉领域要复杂得多。为什么呢?因为我们的cost function不同,CV里面我们可以用一个简单的cost function来度量我们的配准做得是否足够,但是在脑配准里面能够在cost function玩出花来,我举个例子,我们用仿射变换做脑配准的话,往往cost function参数可以采用最简单的平方和就可以,如果我把这个function换成人脑沟回的配准的话,这个问题反正我是没看懂怎么做到的。人脑沟回的褶皱是完全不同的,人与人之间要做到配准反正我是想象不出来。请非数学大牛千万不要去碰脑配准,一般会郁闷的。
上面所说的volume概念只是一个静态的概念,核磁共振作为一个物理现象发现人已经拿到Nobel prize了,这个东西已经发明了好几十年了,但是在90年代基于MRI的一种生理现象被日本人ogawa(这位爷是Nobel prize的新热门)发现,这种信号叫做BOLD信号,原理到现在都没办法完全解释清楚。大家只需要记住可以用核磁技术可以记录脑内的血供信号。这种突然的血供信号和神经活动是有密切关系的。比如说你动左手或者是想象自己动了左手,你的感觉运动区(SMA)就会为你的这一决策忙活,忙活的结果就是会有活动啊,那么活动了之后就会消耗啊,对于脑而言,消耗就是从血液里面获取更多的氧气以及能量,同样的新陈代谢一样会比平时更高。而BOLD信号就是观测到了新陈代谢变化血液信息(这个地方可能会比较难理解,大家感兴趣可以继续问)。
通过上面的BOLD信号,我们可以观测人类在从事某些认知活动中的脑活动,从而分析人脑的一些活动特征。这意味着,我们有可能从此可以得到人脑在一个比较粗尺度上的计算模型。当然这个就是比较大的目标。然后我来告诉大家BOLD信号的数据是什么样的,基本上每2S能得到一个Volume每一个Volume就是当前所观测到的BOLD信号的值。如果我观察很多秒的话就能得到很多个volume,这就像CV里面的video一样,对于video来说一帧是一个单位,这是一个二维的平面,但是对于BOLD信号而言,volume是一次时间点的观测就像一帧一样,但是一个三维的体结构。这个volume里面记录了你脑中每一个voxel中的BOLD信号。
以上的数据叫做functional MRI,着是一种特别的成像,根据这些脑子里的‘video’,我们的应用可以有,疾病判别(主要是与ML和PR相关),brain computer interface(脑机接口)。我这么介绍起来是不是感觉和CV很像?一样都是image process+pattern recognition,只不过这个image process可能比较特殊一些。
tom mitchell 就是CMU的那位机器学习大牛,不知大家有没有印象,他已经带领他的团队靠向neuroscience这个方向了,现在已经有了一篇一作的science,大家应该知道所谓的计算机方向发science这么多年用手指头数也就那么几篇(顺便说一句ISOMAP的作者是搞计算神经科学的不算CS的人)。他的很多学生都做过脑机接口类似(事实上应该称作mind reading但是不知道怎么表达)的工作,用一个经典的论文题目就是Learning to Decode Cognitive States from Brain Images,听起来很玄乎是吧,大家可以去wiki上去搜搜BCI就知道现在BCI的发展确实很有趣。FeiFei li,各位CV的牛不用问也知道这个大名,你们可以去关注她到了Stanford后立马也是介入了这个领域,主要做的是场景的脑识别,貌似已经有一篇nature了,只不过不是一作而已。现在越来越多在EE领域的大牛可能开始关注computational neuroscience,这些牛们确实有得天独厚的优势,不过在neuroscience领域上也只是刚刚起步而已,但是相对于原领域更容易发高影响因子的期刊。neuroimage已经接近6了,neuron,PNAS等都是发的很正常的期刊,在10左右或更高。其次也是因为现在AI领域也陷入一个新的funding问题?!(这个只是据闻,不敢说),相对于做神经科学,NIH是非常有钱的单位啊,连国外的研究者也可以申,我旁边的一个老板就申到NIH的经费。所以未来将会有一些大牛投入neuroscience的怀抱应该是个必然的趋势。
fMRI的数据是个大问题…清华的张钹等人最近搞了个心理学与认知科学研究中心,大家都有往这个方向转的趋势…
@happyharry
清华那边信号处理实力很强,没办法EE传统强,至于心理学与认知就算了…..我在北师大的认知神经科学与学习国家重点实验室…..经常听到的有北大心理和中科院心理所,生理物理所,清华那边这块还是比较薄弱…….不过如果他们专攻方法的话相信应该无人能及,除了中科院自动化所,那边蒋天仔是非常红火啊…..心理方向那个是BNU的强项啊…..心理No.1不是白喊的…..
干嘛不贴图啊。看的多累。
@danceyoung
原来和北师大的李武聊过,正巧。呵呵,我估计过个十来天就云游到北师大了…
@cvchina
重装系统以前的资料没了…….没图了…….
@happyharry
楼上的大神到底做啥的啊………..惊了…….李武老师是做视觉的,养猴子做微电极的…………….云游来此搞讲座么:)
@danceyoung
慢慢游….
@danceyoung
呵呵,李武老师得意之作是给猴子做开颅…咱这不是做computer vision么,有时候得从生理角度找点支撑…
@happyharry
这涉猎太广了…..上次我们开年会,交大有位爷做的是视觉网络的模拟,模拟了百万神经元以上,我觉得那个离CV相对而言还静点,只是它的计算模型实在太难了,没那个数学功底和服务器去玩……
@danceyoung
那位爷好象就是搞数学的…
太可怜了。
我看了半天,还是没搞明白neuroimage是要干啥的?为什么叫neuroimage,跟一般的医疗图像有啥区别,为什么要单独拿出来?
其实跟AI最沾边的是fMRI,但搞笑的是fMRI测的是什么东西谁都说不清楚。时不时的还有fMRI得到的数据和single unit electrophysiology相左的情况。目前普遍认为fMRI得到的数据是feedback signal(比如attention control)但是谁也拿不出确切证据。甚至还有些研究说fMRI扫描的时候,相位也包含了某种functional signal.(因为扫描是靠傅里叶重构——这又和伟大的Candes有关系了,不过再扯就远了。。。)
fMRI水很深,于是有的研究人员就有意无意地按照实验目标来强奸数据。关于这方面的探讨,最早Ed Val给了一个”red list”,说近年来在nature science上发表的文章中,以下列表都存在统计谬误:blah blah。再往后来,有人拿死三文鱼扫描,得到了emotional signal。
至于脑机接口,上文有点不太贴切,因为成像一般是用MRI,但MRI无论是设备尺寸还是成像速度,都不足以作为“接口”来使用。据我所知,目前只有一例实验是通过fMRI信号来作为接口,判断植物人患者是否有意识。
通常谈到接口,要么是EEG(在头皮上贴电极),或者intracranial EEG (打开头盖骨在脑膜上贴电极),或者直接intracranial single unit recording(直接拿一个带探头的针在脑子里记录信号)。只有在极端特殊的情况下,我们才会用fMRI来作为脑机接口。对于健康的正常人,大概只有第一种方法能够采用吧。。。但是这样采到的信号信噪比太低——可能我妄自菲薄了,但是我主观上对它的应用前景觉得有点像超导。理论很美,同时实际问题也多得让你觉得你自己有生之年用不上。
另外最后一个捏他:就grad students而言,neuroscience的毕业前景远不如computer science。前者平均毕业年限就是6~7年,之后99%的人还都要做至少三年的博士后,搞不好一做做五年十年的tenure postdoc也不是没有……
@filestorm
大牛啊…………太赞了…………..你为我指引了明灯…………..这个领域就是建立在不靠谱的东西上做不靠谱的事………..其实BCI,neuroscience的人不是很感冒,真正感冒的是神经反馈,也就是说比如帮助ADHD(小儿多动症患者)训练性的让他们意识到自己注意力不集中问题然后自我不断调节。这基本上要靠fMRI这种空间分辨率高的设备,近些年来NIRS的发展基本上也可以来做同样的事,只不过基础研究仍然很缺乏,NIRS成本相对低,而且心情好的话DIY都是可以的。不过也是缺点多多啊,不过这个领域确实没有就业前景……悲剧中….