【欲閱讀更豐富內容,請參閱科學人2019 年第 205 期 03 月號】
科學家發現,大腦中有專司臉孔辨識的區域,探索這些腦區的運作方式,能讓我們更深入了解視覺認知的神經機制。
撰文/曹穎(Doris Y. Tsao)
翻譯/鄧子衿
我讀高中的時候,某天在微積分課程學到,以一對微分方程式描述掠食者和獵物交互作用的模型,其結果便能畫成無數個封閉曲線,畫出來的圖由許多同心圓構成,類似箭靶。除此之外,這些曲線的密度會依座標位置而改變。
我覺得最後這個敘述非常奇怪。我可以輕易想像一組數量有限的曲線靠得非常近或是距離非常遠,但是數量無窮的曲線怎麼能在某個區域密度變高而在其他區域變低呢?後來我很快就學到「無窮」也有不同類型,有些類型的無窮具有矛盾性質,例如「希爾伯特旅館悖論」(Hilbert’s Hotel,旅館中的房間總是訂滿,但是一直能夠讓新客人住進來),以及巴拿赫—塔斯基蘋果悖論(Banach-Tarski apple,把一顆蘋果切成五份,然後重新組合成體積和原來蘋果相同的兩顆蘋果)。我花了很多時間鑽研這方面的數學證明,最後我驚訝地了解到,那只是運用數學符號得到的魔術,並不是現實世界會發生的結果,但我在那時便對這種數學方法產生了興趣。後來我就讀美國加州理工學院大學部時,研讀了哈佛大學神經生物學家休伯爾(David Hubel)和瑞典神經科學家維瑟爾(Torsten Wiesel)所進行的實驗以及重大發現:腦中主要視覺皮質(primary visual cortex)從眼睛傳來的影像中提取出圖形邊緣的方式。這讓我想到在高中時期讓我深深著迷的事:想像不同類型的無窮大。但這和我高中時期所學的數學技巧不同。休伯爾和維瑟爾所描述的圖形邊緣是由神經元的活動產生,確實存在於腦中。我領悟到,視覺神經科學能讓我們了解到感知一條曲線時的神經活動。
這種體悟引發的興奮之情難以言喻。我相信生命中每個階段都有其任務,念大學時的任務就是做夢,找尋令人心動不已、值得終生投入的目標。事實上,這在科學研究中也是最重要的步驟:找到正確的問題。探索視覺認知這個難題讓我深深著迷,我開始研究腦中電生理活動的模式如何才能夠編碼成視覺中感知到的物體;不只是直線和曲線,而是如同臉孔那種難以嚴格定義的形體。要達成這個目標,需要找出腦中專門負責臉孔辨識的區域,並解析臉孔辨識功能的神經編碼:這種神經電衝動的模式讓我們能夠辨認出周遭的人。
這趟發現之旅始於哈佛大學,我到那裡念研究所,專攻立體視覺(stereopsis)。視覺中的景深來自於兩眼影像間的差異。某天我讀到目前任職於麻省理工學院的神經科學家坎維西爾(Nancy Kanwisher)和同事發表的一篇論文,他們使用功能性磁共振造影(fMRI)掃描人腦時發現,有一個腦區對人臉影像的反應比對其他物體的影像反應更激烈。我覺得這篇論文很奇怪,我總認為大腦是由類似基底核(basal ganglia)、額葉眼眶面皮質(orbitofrontal cortex)等功能不明確的結構所組成,我們仍處於探索功能的階段。大腦裡有某個腦區專司臉孔辨識,這樣簡單的答案看起來不可能是真的。任何人都可以合理猜想臉孔辨識腦區的功能,它應該能描繪出我們認識的各個臉孔,以及表情與性別。
研究生時期,我應用fMRI找出猴子受到立體影像刺激時,腦中神經元活化的區域。我決定讓猴子觀看臉孔和其他物體的照片,比較猴子觀看臉孔和其他物體時的神經元活動時,我發現顳葉中有幾個區域在猴子觀看臉孔時才活化,特別是下顳葉(inferotemporal, IT)皮質區。1970年代初期,物體視覺認知領域的先驅、心理學家葛羅斯(Charles Gross)就已發現獼猴的下顳葉皮質有專門負責臉孔辨識的神經元。只不過當時他認為這些神經元是隨機分散在整個下顳葉皮質中,但我們的fMRI結果首度顯示,辨識臉孔的神經元可能只在下顳葉皮質中的某些位置。
臉孔辨識區塊
研究結果發表後,我受邀到加州理工學院演講,說明這項fMRI研究,並應徵該校教員,但我沒有得到這份工作。許多人質疑fMRI的價值,因為fMRI測量的是腦中局部區域的血流量,那些人認為受試者觀看臉孔影像時,雖然腦部某些區域的血流量增加了,但還無法證實那些區域的神經元真的和臉孔辨識功能有關,因為血流量和神經電生理活動的關聯還不明確。那些辨識臉孔時活化的腦區,可能只是剛好有比較多會對臉孔起反應的神經元而已,就像海洋上隨機聚集在一起的冰山。
由於我是以猴子進行fMRI實驗,我可以把電極插入fMRI找到的臉孔辨識區域,找出哪些圖片會讓這些區域中的哪些神經元反應最活躍。我那時是哈佛大學利文斯敦(Margaret Livingstone)教授的研究生,和他實驗室裡的博士後研究員弗瑞瓦德(Winrich Freiwald)一起進行這項實驗。我們把電極連接到猴子腦中個別神經元上,記錄神經元的電生理活動,同時讓猴子觀看臉孔和其他物體的影像。為了要即時得知神經元活動的強弱,我們把電極傳過來的訊號放大,轉換成聲音訊號並連接到實驗室的擴音器上。
實驗結果令我們驚訝不已:fMRI找出的那個區域,幾乎每顆神經元都負責處理臉孔影像刺激。我記得第一次記錄時,那些神經元對於臉孔影像的反應發出了巨大的「嗶」聲,但對於其他物體的影像發出的聲音就很小,這個現象令我們興奮不已。我們覺得找到了重要的東西,從一小片皮質便能揭露腦部高階視覺認知的神經編碼。利文斯敦對於我們發現臉孔辨識區塊的看法是:「你們找到了金雞蛋。」
我還記得這次實驗帶來的驚訝。之前我預期臉孔辨識區塊中的神經元對個別臉孔有反應的現象,類似腦中主要視覺皮質中那些對特定角度與方向的臉孔有反應的神經元。事實上,許多廣受報導的研究指出,有單一神經元對某個熟悉的臉孔反應特別強,例如珍妮佛安妮斯頓(Jennifer Aniston)的臉。但這些神經元的反應與我的預期相反,它們幾乎對任何臉孔的反應都同樣強烈。
在進行fMRI與電生理記錄的初步實驗時,我一直使用Photoshop軟體修改給猴子觀看的刺激圖片,後來發現那些神經元不只對人臉或猴子臉孔有反應,就算是線條極度簡化的卡通人物臉孔也有反應。
發現這個現象之後,我決定用19種與辨識臉孔相關的臉孔特徵,創造出各種卡通化人臉,這些臉孔特徵包括兩眼間的距離、臉孔長寬比、嘴唇高度等。然後調整這些特徵的數值,例如把兩眼距離拉近到像是獨眼巨人,或是拉開到接近臉孔邊緣。我們發現,個別神經元都會對這些卡通化臉孔產生反應,但有趣的是,它們對所有臉孔產生的反應強度並不同,而是有系統的變化:我們把神經元的活化程度和卡通化臉孔特徵的變化繪製成圖表,發現神經元對於某項特徵的某種極端情況(例如眼睛間距最小)反應最小,而對於另一種極端情況(例如眼睛間距最大)反應最大。如果臉孔特徵的變化位於中間值,神經元的反應強度也在中間。這種神經元的反應強度就像可用來計算每種特徵數值的方程式,會先升高然後下降。
後來我又受邀到加州理工學院演講。這次我的研究除了使用了更多fMRI影像,也加入了記錄單顆神經元電生理活動的結果。每個人都很清楚腦中的確有一些區域負責臉孔辨識,而且對於臉孔辨識功能很重要。除此之外,了解臉孔辨識功能背後的神經機制,也可進一步了解一個範圍更廣的議題:腦部如何辨識其他類型的物體。這回我得到教職工作了。......