版權歸原作者所有,如有侵權,請聯(lián)系我們
前言
想象一下,在緊張刺激的賽車游戲中,人類需要迅速而精準地判斷何時踩下油門、何時巧妙地轉(zhuǎn)彎。在根據(jù)路況不斷改變行駛路徑的過程中,人類大腦可以展現(xiàn)出敏捷的決策能力和反應速度。
然而,在人類應對自如的賽車游戲中,傳統(tǒng)的神經(jīng)網(wǎng)絡模型只能做出確定性的決策,尚不具備人類的感知行為能力。模擬人類大腦的決策過程,始終是人工智能(AI)領域的一大挑戰(zhàn)。
如今,一種新型神經(jīng)網(wǎng)絡模型,有望讓 AI 系統(tǒng)像人類賽車手一樣,權衡各種選擇,做出迅速、精準的決策。
近日,來自佐治亞理工學院的研究團隊便提出了一種神經(jīng)網(wǎng)絡模型 RTNet,這一模型不僅能夠生成隨機決策,還能達到類似人類決策的響應時間分布。
研究團隊通過全面的測試發(fā)現(xiàn),RTNet 能夠再現(xiàn)人類在準確性、響應時間和置信度上的所有特征,而且表現(xiàn)優(yōu)于多個當前先進的神經(jīng)網(wǎng)絡模型。
相關研究論文以“The neural network RTNet exhibits the signatures of human perceptual decision-making”為題,發(fā)表在科學期刊 Nature Human Behaviour 上。
研究團隊表示,即使是功能強大的大語言模型(LLM)也會因為幻覺編造一些不切實際的回答,因此開發(fā)一種更接近真實人腦的神經(jīng)網(wǎng)絡可能會使 AI 系統(tǒng)更加可靠。
像人類一樣感知決策
近年來,卷積神經(jīng)網(wǎng)絡(CNN)在 AI 圖像處理方面取得了很大進展,甚至在醫(yī)學圖像處理等領域超過了人類的水平,但在感知決策的認知模型中與人類的表現(xiàn)仍相較甚遠。
傳統(tǒng)的 CNN 面對相同的輸入信號時,輸出的結(jié)果總是確定的,而且在處理復雜度不同的圖像時,花費的計算時間總是不變的。這也決定了 CNN 模型很難實現(xiàn)人類大腦的感知決策水平,無法根據(jù)任務的復雜程度調(diào)整反應時間和準確度。
此前,為了解決這些問題,一些研究團隊曾嘗試為神經(jīng)網(wǎng)絡引入隨機性和動態(tài)性,開發(fā)能夠生成動態(tài)響應時間的神經(jīng)網(wǎng)絡,但這些模型無法處理復雜的圖像輸入,結(jié)果也是確定性的,還是沒有達到人類的感知決策能力。
Google Research 和科羅拉多大學的研究團隊曾通過在深度神經(jīng)網(wǎng)絡的前饋網(wǎng)絡中引入傳播延遲來構建級聯(lián)網(wǎng)絡,產(chǎn)生了圖像可計算的動態(tài)網(wǎng)絡,其通過決策計算資源隨時間增加的機制生成響應時間,從而允許響應通過每個處理步驟進行不斷地演變。雖然模型可以模擬人類感知決策的速度和準確度,但輸出結(jié)果還是確定性的,距離人類的感知決策水平還有相當大的距離。
在這項研究中,F(xiàn)arshad Rafiei 等人將現(xiàn)代 CNN 與傳統(tǒng)認知模型相結(jié)合,創(chuàng)建了一個可進行圖像計算、隨機且動態(tài)的模型。因為該模型能夠模擬人類的行為決策響應時間,故將它命名為 RTNet。
圖 | 模型的架構(來源:該論文)
他們通過對貝葉斯神經(jīng)網(wǎng)絡進行采樣,獲得深度神經(jīng)網(wǎng)絡噪聲權重,然后在每個處理步驟,從這些有噪聲的權重分布中進行采樣,來模擬神經(jīng)響應的隨機性。RTNet 也會積累每個選擇對應的輸出,直到其中一個選擇達到預定義的閾值。
為了驗證 RTNet 能夠適用于各種感知任務,并做出類似人類感知決策的一些基本特征,他們對 RTNet 進行了全面的評估測試。
他們設計了 “二選一” 的決策任務,通過人為改變?nèi)蝿针y度,來對比 RTNet 模型與 60名 參與者進行決策判斷的響應時間和準確度,從而驗證 RTNet 在模擬人類行為方面的出色表現(xiàn)。
人類行為的一個核心特征就是決策具有隨機性,面對同樣的情況可能做出不同的決策,研究人員將人類行為與 RTNet、CNet、BLNet 和 MSDNet 的行為進行了比較。
實驗充分考慮了人類決策的隨機性、增加響應時間帶來的準確性下降、復雜度高的決策導致的準確性降低等干擾因素,來驗證 RTNet 在決策上的隨機性是魯棒、可靠的。
圖 | 實驗參與者和四個神經(jīng)網(wǎng)絡模型在決策隨機性的表現(xiàn)(來源:該論文)
研究發(fā)現(xiàn),模型表現(xiàn)出的決策隨機性隨著任務難度的增加而增加,在 20% 的試驗中,RTNet 對兩個圖像表現(xiàn)出了不同的響應。雖低于人類的反應水平,隨著任務難度和速度要求的提高,RTNet 決策的隨機性也在提高。
與之相反,對于固定的任務,CNet、BLNet 和 MSDNet 的決策是完全確定性的,并且沒有表現(xiàn)出任何隨機性。RTNet 在捕獲感知決策特征方面表現(xiàn)出優(yōu)于 CNet、BLNet 和 MSDNet 的特征,RTNet 也是唯一一個能夠模擬時間響應分布形狀和偏度,以響應任務難度進行不同操作的模型。
不足與展望
總的來說,RTNet 表現(xiàn)出了類人感知決策的關鍵特征,具有廣泛的應用前景。此外,RTNet 也為開發(fā)更加逼真的 AI 模型提供了新的思路,未來在醫(yī)療診斷、自動駕駛和人機交互等領域?qū)l(fā)揮重要作用。
研究人員推測,RTNet 能夠匹配觀察到的人類行為模式,主要是因為其內(nèi)部機制更接近人類產(chǎn)生響應時間的真實機制。RTNet 通過模仿重復呈現(xiàn)相同刺激的神經(jīng)元反應,在證據(jù)積累的過程中,自然地產(chǎn)生持久的神經(jīng)元激活,所以模型的輸出本質(zhì)上是隨機的。
但 RTNet 也存在一定的局限性,它在每次從選擇中進行證據(jù)采樣的機制不是最佳的,且前饋路徑的每次掃描都獨立于先前的狀態(tài),但人腦一般當前的狀態(tài)會受到其先前狀態(tài)的影響。
研究人員表示,未來的研究可以進一步優(yōu)化 RTNet 的生物學合理性,例如引入遞歸處理機制,并使用其他方法來設置每個連接的噪聲級別,來更好地模擬人類大腦的處理方式。
歡迎掃碼關注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動和科普好物!