想象一下,如果人工智能(AI)能讀出人腦中正在想的事,你敢信嗎?
向研究對(duì)象展示的豹子圖像(左)以及通過生成式AI利用大腦活動(dòng)重建的圖像(右)。
圖片來源:日本量子科學(xué)技術(shù)研究所
本月在線發(fā)表在國(guó)際科學(xué)雜志《神經(jīng)網(wǎng)絡(luò)》上的一項(xiàng)研究顯示,日本科學(xué)家利用AI技術(shù),成功地根據(jù)人腦活動(dòng)創(chuàng)建了世界上第一幅物體和風(fēng)景的心理圖像。這項(xiàng)被稱為“大腦解碼”的技術(shù)可以根據(jù)大腦活動(dòng)將感知內(nèi)容可視化,有望應(yīng)用于醫(yī)療和福利領(lǐng)域。
在腦機(jī)接口和神經(jīng)工程快速發(fā)展的今天,通過分析大腦活動(dòng),用機(jī)器讀出志愿者大腦中所想的內(nèi)容或者畫面已經(jīng)不再是科幻故事。解碼思想的技術(shù)日趨成熟,AI“讀心術(shù)”的設(shè)想越來越接近現(xiàn)實(shí)。與此同時(shí),這也引發(fā)了人們對(duì)隱私的憂慮。
復(fù)制心理意象
先前的研究表明,根據(jù)功能磁共振成像(fMRI)測(cè)量的大腦活動(dòng)可重建人類看到的圖像。但這僅限于特定內(nèi)容,例如字母、人臉等。
基于之前的方法,日本量子科學(xué)技術(shù)研究所(QST)和大阪大學(xué)科學(xué)家團(tuán)隊(duì)開發(fā)了一種技術(shù),可量化大腦活動(dòng),并將生成式AI和預(yù)測(cè)技術(shù)結(jié)合來繪制圖像,以重建復(fù)雜的物體。
研究人員向參與者展示了大約1200張物體和風(fēng)景圖像,并使用fMRI分析和量化了他們的大腦信號(hào)和視覺刺激之間的關(guān)系,然后將這些圖像用于訓(xùn)練生成式AI,以破譯和復(fù)制來自大腦活動(dòng)的心理意象。結(jié)果,研究人員利用這種方法產(chǎn)生了生動(dòng)的圖像,例如具有耳朵、嘴巴和斑點(diǎn)等可辨別特征的豹子,以及帶有紅色翼燈的飛機(jī)等物體。
研究人員表示,將心理圖像可視化為任意的自然圖像是一個(gè)重要的里程碑。
QST研究人員稱,人類已使用顯微鏡和其他設(shè)備來觀察肉眼看不見的世界,但還無法看到一個(gè)人的內(nèi)心世界,這是人類第一次窺視另一個(gè)人頭腦中的思想。從本質(zhì)上講,它可用來幫助創(chuàng)建新的通信設(shè)備,同時(shí)還可讓科學(xué)家探索和理解幻覺與夢(mèng)境如何在大腦中發(fā)揮作用。
解碼語言數(shù)據(jù)
《自然·神經(jīng)科學(xué)》雜志今年稍早時(shí)間發(fā)表了一項(xiàng)新研究。美國(guó)得克薩斯大學(xué)奧斯汀分校研究團(tuán)隊(duì)在大型語言模型的助力下,開發(fā)出一款現(xiàn)代“讀心機(jī)”。他們利用fMRI收集了3名參與者的大腦活動(dòng)信息,并將思維轉(zhuǎn)化為了語言文字,準(zhǔn)確率達(dá)到82%。
fMRI掃描的血氧水平依賴性信號(hào)顯示了大腦不同部位的血流量和氧合水平的變化。通過關(guān)注處理語言的大腦區(qū)域和網(wǎng)絡(luò)的活動(dòng)模式,研究人員發(fā)現(xiàn)他們的解碼器可被訓(xùn)練來重建連續(xù)語言,包括一些特定的單詞和句子的一般含義。
具體而言,解碼器獲取了3名參與者聽故事時(shí)的大腦反應(yīng),并生成了可能產(chǎn)生這些大腦反應(yīng)的單詞序列。這些單詞序列很好地捕捉了故事的大意,甚至還包括準(zhǔn)確的單詞和短語。研究人員還讓參與者觀看無聲電影并在掃描大腦時(shí)想象電影情節(jié)。在這兩種情況下,解碼器通常都能成功預(yù)測(cè)故事和情節(jié)的要點(diǎn)。例如,一位用戶認(rèn)為“我還沒有駕照”,解碼器預(yù)測(cè)“她還沒開始學(xué)開車”。此外,當(dāng)參與者主動(dòng)聆聽一個(gè)故事而忽略同時(shí)播放的另一個(gè)故事時(shí),解碼器可識(shí)別正在主動(dòng)聆聽的故事的含義。
讀腦技術(shù)引擔(dān)憂
能夠“讀心”的技術(shù)理念引發(fā)了人們對(duì)心理隱私的擔(dān)憂。西班牙格拉納達(dá)大學(xué)生物倫理學(xué)教授戴維·羅德里格斯·阿里亞斯·韋爾恩警告,這更接近機(jī)器“能夠讀懂思想并轉(zhuǎn)錄思想”的未來,但其可能會(huì)違背人們的意愿。
美國(guó)醫(yī)療新聞網(wǎng)站statnews針對(duì)得克薩斯大學(xué)奧斯汀分校的研究發(fā)表評(píng)論稱,人們通常將這類大腦解碼器描述為“讀心機(jī)”,但這是一個(gè)模糊的術(shù)語,夸大了它們的能力。雖然人們的大腦產(chǎn)生了心理過程,但人們對(duì)大多數(shù)心理過程在大腦活動(dòng)中究竟是如何編碼的了解有限。
文章認(rèn)為,大腦解碼器不能簡(jiǎn)單地讀出一個(gè)人的思想內(nèi)容。相反,它們學(xué)會(huì)的是對(duì)心理內(nèi)容作出預(yù)測(cè)。大腦解碼器就像是解釋大腦活動(dòng)模式和精神內(nèi)容描述之間的一本詞典。然而,大腦活動(dòng)會(huì)受到直接刺激以外的因素的影響,因此“詞典”只能預(yù)測(cè)一個(gè)人的大腦將如何對(duì)刺激作出反應(yīng)。此外,衡量一個(gè)人的大腦對(duì)每一種可能的刺激的反應(yīng)是不可行的。預(yù)測(cè)過程天生就不完美,所以解碼器對(duì)一個(gè)人的想法的預(yù)測(cè),可能與這個(gè)人的實(shí)際想法有很大出入。
此外,文章強(qiáng)調(diào),大腦解碼器只能“復(fù)制”活躍的精神內(nèi)容。所有的大腦記錄方法都會(huì)測(cè)量與人正在積極處理信息時(shí)相對(duì)應(yīng)的信號(hào)。相比之下,不活躍的信息,如長(zhǎng)期記憶,是在神經(jīng)元之間的連接中編碼的,人們距離能夠測(cè)量和解碼這些信息還很遠(yuǎn)。
相關(guān)稿件