親社會(huì)性如何調(diào)節(jié)為他人決策中的模型化認(rèn)知參與:基于強(qiáng)化學(xué)習(xí)漂移擴(kuò)散模型的證據(jù)
《npj Science of Learning》:Deciding for others diminishes model-based decision-making but depends on individual prosociality
編輯推薦:
本研究針對人們在為自身vs.他人決策時(shí)認(rèn)知策略的差異這一核心問題,通過結(jié)合兩階段任務(wù)與強(qiáng)化學(xué)習(xí)漂移擴(kuò)散模型(RLDDM),揭示了為他人決策會(huì)削弱依賴心智模型的模型化(model-based)決策,但減緩的是模型無關(guān)(model-free)學(xué)習(xí)速率;個(gè)體社會(huì)價(jià)值取向(SVO)調(diào)節(jié)此差異,親社會(huì)者差異更小。這為理解親社會(huì)目標(biāo)導(dǎo)向行為的計(jì)算機(jī)制提供了新視角。
在日常生活中,人們不僅為自己做決定,也頻繁地為他人做選擇,例如父母為孩子規(guī)劃未來、理財(cái)師為客戶投資、政府制定影響廣泛的公共政策。這些決策往往需要在復(fù)雜多變的環(huán)境中深思熟慮、靈活調(diào)整。成功的決策依賴于學(xué)習(xí),而學(xué)習(xí)過程通常由兩種系統(tǒng)支持:一種是快速、省力但相對僵化的模型無關(guān)(model-free)系統(tǒng),它基于過往行動(dòng)的直接獎(jiǎng)賞進(jìn)行學(xué)習(xí),類似于“試錯(cuò)”;另一種則是更耗費(fèi)認(rèn)知資源、但更靈活的目標(biāo)導(dǎo)向的模型化(model-based)系統(tǒng),它需要構(gòu)建并利用對任務(wù)結(jié)構(gòu)的心智模型來進(jìn)行前瞻性規(guī)劃,如同下棋時(shí)需要思考棋局和對手的潛在反應(yīng)。一個(gè)關(guān)鍵而尚未解決的問題是:當(dāng)人們?yōu)樽约鹤鰶Q定與為他人做決定時(shí),是否會(huì)以相同的程度調(diào)用這種需要付出更多心智努力的模型化策略?驅(qū)動(dòng)這種“為己”與“為人”決策差異背后的具體計(jì)算機(jī)制是什么?此外,個(gè)體的親社會(huì)傾向(即關(guān)心他人福祉的程度)是否會(huì)影響這種決策模式的切換?
為了回答這些問題,香港城市大學(xué)社會(huì)科學(xué)及行為學(xué)系的研究團(tuán)隊(duì)在《npj Science of Learning》上發(fā)表了一項(xiàng)研究,題為“Deciding for others diminishes model-based decision-making but depends on individual prosociality”。該研究通過一項(xiàng)精巧的兩階段決策任務(wù),結(jié)合計(jì)算建模方法,深入剖析了為他人決策時(shí)的認(rèn)知過程。
研究人員招募了92名成年參與者,讓他們在一個(gè)游戲化的場景中完成一項(xiàng)兩階段決策任務(wù)。參與者需要選擇不同的宇宙飛船(第一階段)以訪問特定的星球(第二階段),從而為自己或一位匿名的未來參與者獲取獎(jiǎng)勵(lì)分?jǐn)?shù)。任務(wù)的核心設(shè)計(jì)在于,它能有效區(qū)分模型化與模型無關(guān)決策策略的行為特征。模型化決策者能夠利用對任務(wù)轉(zhuǎn)換結(jié)構(gòu)的心理表征(即知道每個(gè)飛船會(huì)飛往哪個(gè)星球),即使最近沒有經(jīng)歷過某個(gè)轉(zhuǎn)換,也能推斷并選擇通往更高獎(jiǎng)勵(lì)星球的飛船。而模型無關(guān)決策者則主要依賴特定情境下的行動(dòng)-獎(jiǎng)賞關(guān)聯(lián)歷史來做選擇,無法進(jìn)行有效的跨情境概括。
研究的關(guān)鍵創(chuàng)新在于采用了強(qiáng)化學(xué)習(xí)漂移擴(kuò)散模型(RLDDM)來同時(shí)分析參與者的選擇行為和反應(yīng)時(shí)間。該模型將決策視為一個(gè)證據(jù)積累的過程:個(gè)體不斷收集信息,直到累積的證據(jù)達(dá)到某個(gè)決策閾值。通過此模型,研究者能夠分解出影響決策的各種計(jì)算參數(shù),例如模型化權(quán)重(反映模型化價(jià)值估計(jì)對決策的影響程度)、模型無關(guān)學(xué)習(xí)速率(反映根據(jù)新結(jié)果更新價(jià)值估計(jì)的速度)、非決策時(shí)間(反映刺激編碼、記憶檢索等非決策過程所需時(shí)間)以及決策閾值等,從而更精確地揭示“為己”與“為人”決策差異的認(rèn)知根源。
本研究主要采用了以下幾種關(guān)鍵技術(shù)方法:1. 行為實(shí)驗(yàn)范-兩階段任務(wù),用于有效區(qū)分模型化與模型無關(guān)決策策略的行為特征。2. 計(jì)算建模-強(qiáng)化學(xué)習(xí)漂移擴(kuò)散模型(RLDDM),用于從選擇行為和反應(yīng)時(shí)間數(shù)據(jù)中擬合和分離出多個(gè)關(guān)鍵的認(rèn)知計(jì)算參數(shù)(如模型化權(quán)重、模型無關(guān)學(xué)習(xí)速率、非決策時(shí)間等)。3. 心理測量-社會(huì)價(jià)值取向(SVO)滑塊測量,用于評(píng)估參與者穩(wěn)定的親社會(huì)性個(gè)體差異。4. 分層貝葉斯邏輯回歸分析,用于進(jìn)行模型無關(guān)的行為特征分析。5. 參數(shù)恢復(fù)分析和后驗(yàn)預(yù)測檢驗(yàn),用于驗(yàn)證計(jì)算模型的有效性和可靠性。研究樣本為從香港城市大學(xué)周邊社區(qū)招募的92名有效成年參與者。
模型無關(guān)分析結(jié)果
初步的行為分析發(fā)現(xiàn),參與者為自己做決定時(shí)獲得的總獎(jiǎng)勵(lì)分?jǐn)?shù)顯著高于為他人決策時(shí),但兩者的決策反應(yīng)時(shí)間沒有顯著差異。通過分層貝葉斯邏輯回歸模型對行為特征的分析表明,參與者為自己決策時(shí),對模型化策略和模型無關(guān)策略的依賴程度都更高。更重要的是,個(gè)體的社會(huì)價(jià)值取向(SVO)調(diào)節(jié)了“為己”與“為人”在模型化策略依賴上的差異:親社會(huì)取向(SVO得分高)的個(gè)體,其模型化決策在為自己和為他人時(shí)的差異較小;而親自我取向(SVO得分低)的個(gè)體,則表現(xiàn)出更大的差異。SVO對模型無關(guān)策略的自我-他人差異則沒有顯著的調(diào)節(jié)作用。
計(jì)算建模結(jié)果
RLDDM的分析結(jié)果進(jìn)一步細(xì)化了上述發(fā)現(xiàn)。在模型化系統(tǒng)方面,為他人決策時(shí)的模型化權(quán)重顯著低于為自己決策時(shí),表明確實(shí)減少了對心智模型的運(yùn)用。在模型無關(guān)系統(tǒng)方面,雖然模型無關(guān)權(quán)重本身沒有自我-他人差異,但為他人決策時(shí)的模型無關(guān)學(xué)習(xí)速率顯著降低,意味著根據(jù)新結(jié)果更新價(jià)值估計(jì)的速度變慢了。此外,為他人決策時(shí)的非決策時(shí)間也更短。相關(guān)性分析顯示,模型無關(guān)分析中觀察到的“為己”與“為人”在模型化行為特征上的差異,與計(jì)算模型中發(fā)現(xiàn)的兩個(gè)參數(shù)差異有關(guān):模型化權(quán)重的降低和模型無關(guān)學(xué)習(xí)速率的減慢。中介分析進(jìn)一步揭示,非決策時(shí)間的縮短部分中介了模型化權(quán)重的降低,這提示為他人決策時(shí),個(gè)體可能減少了對任務(wù)結(jié)構(gòu)心智模型的檢索和運(yùn)用。個(gè)體差異分析也支持這一點(diǎn):那些為他人決策時(shí)花費(fèi)更多非決策時(shí)間的個(gè)體,也表現(xiàn)出更高的親社會(huì)模型化權(quán)重。
社會(huì)價(jià)值取向(SVO)與模型化權(quán)重的關(guān)聯(lián)
相關(guān)分析重復(fù)并支持了模型無關(guān)分析的結(jié)果:個(gè)體的SVO得分與“為己”和“為人”決策間的模型化權(quán)重差異呈負(fù)相關(guān)。即越是親社會(huì)的個(gè)體,他們在為自己和為他人進(jìn)行模型化決策時(shí)的投入差距越小。后續(xù)分析表明,SVO與模型化權(quán)重差異的關(guān)聯(lián)是特異性的,與其他模型參數(shù)(如模型無關(guān)權(quán)重、學(xué)習(xí)速率、非決策時(shí)間等)的自我-他人差異無關(guān)。
該研究通過計(jì)算建模方法,清晰地揭示了為他人決策時(shí)認(rèn)知努力投入減少的計(jì)算機(jī)制。具體表現(xiàn)為模型化決策的減弱(模型化權(quán)重降低)和模型無關(guān)學(xué)習(xí)的放緩(學(xué)習(xí)速率降低)。非決策時(shí)間的中介作用揭示了與記憶檢索相關(guān)的認(rèn)知過程在親社會(huì)模型化決策中的重要性。更重要的是,個(gè)體的社會(huì)價(jià)值取向塑造了這種決策模式,親社會(huì)者更愿意將認(rèn)知資源投入到為他人謀利的規(guī)劃性決策中。這些發(fā)現(xiàn)不僅深化了我們對社會(huì)決策,特別是親社會(huì)目標(biāo)導(dǎo)向行為背后計(jì)算機(jī)制的理解,也暗示了在資源(包括認(rèn)知資源)分配上可能存在一種跨領(lǐng)域(從物質(zhì)資源到心智資源)的共享原則。研究結(jié)果對于理解人們在合作、利他、領(lǐng)導(dǎo)力等社會(huì)互動(dòng)中的認(rèn)知基礎(chǔ)具有啟示意義,并展示了計(jì)算精神病學(xué)等方法在社會(huì)認(rèn)知研究中的強(qiáng)大潛力。未來的研究可以進(jìn)一步探討社會(huì)距離、接收者特征等因素對親社會(huì)模型化決策的影響,以及其背后的神經(jīng)機(jī)制。