全國(guó)統(tǒng)一服務(wù)熱線:15221858802
瑞典科學(xué)家下載了大量腦科學(xué)的功能性磁共振成像數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn):fMRI軟件在判斷腦活動(dòng)時(shí)會(huì)出現(xiàn)*概率的假陽(yáng)性。
毫不夸張地說(shuō),功能性磁共振成像(fMRI)給神經(jīng)科學(xué)領(lǐng)域帶來(lái)了翻天覆地的變化。當(dāng)不同腦區(qū)的活躍程度發(fā)生變化,血流量也會(huì)相應(yīng)改變,神經(jīng)科學(xué)家用核磁共振儀搜集各個(gè)腦區(qū)血流量變化情況。利用這個(gè)技術(shù)他們可以非侵入性地找出負(fù)責(zé)處理不同任務(wù)(比如玩經(jīng)濟(jì)學(xué)博弈游戲,或是閱讀文字)的腦區(qū)。
不過(guò)這種研究方法和使用者都受到了不少批評(píng)。有人擔(dān)心,這個(gè)技術(shù)夸大了我們閱讀人類(lèi)心智的能力。有一些人則指出,對(duì)于 fMRI 數(shù)據(jù)的不當(dāng)分析可能會(huì)產(chǎn)生誤導(dǎo)的結(jié)論,比如一項(xiàng)研究關(guān)于死亡鮭魚(yú)的研究。
雖然上述問(wèn)題常由拙劣的統(tǒng)計(jì)方法造成,但是一項(xiàng)發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》(PNAS)上的研究(Eklund, Anders, Thomas E. Nichols, and Hans Knutsson. “Cluster failure: Why fMRI inferences for spatial extent have inflated false-positive rates.”Proceedings of the National Academy of Sciences(2016): 201602413. 論文基本信息見(jiàn)文章末尾)指出,問(wèn)題要嚴(yán)重得多。fMRI 分析中涉及到的一些基本算法會(huì)產(chǎn)生假陽(yáng)性“信號(hào)”,并且頻率高到令人擔(dān)憂。
fMRI 背后的原理很簡(jiǎn)單:神經(jīng)活動(dòng)需要消耗能量,消耗掉的能量需要補(bǔ)充。這意味著新近活躍的腦區(qū)的血流量會(huì)增加。高分辨率的 MRI 可以得到這種血流量數(shù)據(jù),研究人員借此識(shí)別執(zhí)行某項(xiàng)任務(wù)時(shí)被激活的腦結(jié)構(gòu)。
然而,這種理論在實(shí)際中的應(yīng)用相當(dāng)復(fù)雜。成像過(guò)程將大腦分割成被稱(chēng)為體素的細(xì)小三維單位,然后分別記錄在每個(gè)體素中的活躍度。
由于體素非常之小,軟件必須對(duì)整體進(jìn)行檢查,找尋“聚群”(clustering)——一群行為相似的相鄰體素。死鮭魚(yú)研究的顯著性結(jié)果是因?yàn)樵撥浖J(rèn)配置成目前 MRI 儀掃描輸出的巨量體素值。也就是說(shuō)即使在 95% 的置信水平上,假陽(yáng)性也不可避免。
這項(xiàng)新研究的作者是一隊(duì)瑞典研究者。他們提出該軟件還存在其他問(wèn)題。他們利用了zui近興起的公開(kāi)數(shù)據(jù)的潮流,下載了幾百個(gè)其他研究中的 fMRI 掃描數(shù)據(jù),然后自己進(jìn)行的分析。
他們主要關(guān)注靜息態(tài)的大腦,這在對(duì)特定腦活動(dòng)進(jìn)行的研究中常作為比照的控制組。靜息態(tài)數(shù)據(jù)中,一些受試者可能顯示出特定腦活動(dòng),比如移動(dòng)腿部或是思考晚餐;但是總體而言,接受掃描的人腦中不應(yīng)出現(xiàn)一致性的、系統(tǒng)性的信號(hào)。
研究作者一開(kāi)始收集了大量原本作為控制組的數(shù)據(jù),然后從中隨機(jī)選取了一些作為控制組,另一些作為“實(shí)驗(yàn)”樣本。然后他們將這個(gè)過(guò)程重復(fù)了幾千次,把數(shù)據(jù)輸入 3 個(gè)軟件包中的一個(gè)進(jìn)行分析。他們微調(diào)了參數(shù),來(lái)看參數(shù)如何對(duì)結(jié)果產(chǎn)生的影響。
研究結(jié)果對(duì)于使用 fMRI 的人來(lái)說(shuō)并不是什么好消息。“簡(jiǎn)而言之,”作者們總結(jié)道,“我們發(fā)現(xiàn)所有 3 個(gè)軟件包用體素得出的推論都很保守,而用聚群分析卻得出了無(wú)效的推斷。”
換句話說(shuō),軟件在判斷某個(gè)體素是否顯示出腦活動(dòng)時(shí)非常謹(jǐn)慎,而聚群識(shí)別的算法卻常常把一個(gè)沒(méi)有進(jìn)行腦活動(dòng)的區(qū)域識(shí)別為表現(xiàn)出了腦活動(dòng)。這有多頻繁呢?根據(jù)算法和使用的參數(shù)的不同,可得到高達(dá) 70%的假陽(yáng)性。
雪上加霜的是,測(cè)試過(guò)程顯示了一個(gè)潛伏了15年的編碼漏洞。填補(bǔ)這個(gè)漏洞后假陽(yáng)性減少了超過(guò)10%。雖然這個(gè)漏洞被修復(fù)了,但是卻有那么多發(fā)表出來(lái)的論文是用出錯(cuò)的版本分析的,真是太悲劇了。
研究人員還發(fā)現(xiàn),一些腦區(qū)更可能出現(xiàn)假陽(yáng)性的問(wèn)題是因?yàn)樗惴▽?duì)大腦的形態(tài)存在一定假設(shè)。
事實(shí)真的這么糟糕嗎?作者們認(rèn)為的確如此。“我們的研究質(zhì)疑了無(wú)數(shù)基于參數(shù)智能聚群推斷的已發(fā)表的 fMRI 研究的有效性。”雖然不清楚到底有多少論文涉及這個(gè)問(wèn)題,但是用 fMRI 做的研究中可能有很一大部分牽涉其中,估計(jì)涉及4萬(wàn)名作者。
作者們還注意到,目前的公開(kāi)數(shù)據(jù)行動(dòng)讓任何人都可以容易地追溯研究,并以新的思路更小心地重新分析原始研究的數(shù)據(jù)。但是大多數(shù)已發(fā)表論文的數(shù)據(jù)還未公開(kāi),所以現(xiàn)在并沒(méi)有很多的事情可做,除了在以后的研究中更加小心。