理性的尺:當「偏誤」其實是聰明的——推理、貝氏心智與雙歷程的重寫
從「人類為何犯錯」走向「我們用來判定對錯的那把尺是否選錯」:生態理性論戰、心智模型、結構對映、貝氏計算層次與邏輯直覺的最新樣貌
如果「偏誤」其實是聰明的,我們對理性的理解錯在哪裡?
你在入門篇學過,人類在球棒問題上會脫口說出「10 美分」,在四卡任務上會去翻錯的卡片,在水罐實驗裡會被舊公式困住。這些現象被收編進一個強而有力的敘事:人類是「可預測地不理性」的,認知系統佈滿了系統性的捷思(heuristics)與偏誤(biases)。這個敘事如此成功,以至於它幾乎成了通識教育對「人類思考」的標準結論。
但這裡有一個值得研究生認真對待的反問:如果一個「偏誤」在現實環境中其實平均而言會帶來更好的決策,它還算是「錯誤」嗎? 一個始終假設草叢裡的沙沙聲是掠食者的大腦,在貝氏(Bayesian)意義上「過度反應」了,但牠的後代活了下來。當代認知科學最重要的轉折,正是從「人類為什麼會犯錯」這個問題,轉向一個更深的問題:我們用來判定「對錯」的那把尺,本身是不是選錯了? 本篇就從這場「理性論戰」(the rationality debate)切入,帶你看入門篇沒有展開的三條前沿主線:推理的心智模型機制、貝氏取向的計算層次理論,以及雙歷程理論被改寫的最新樣貌。
兩種「理性」之爭:捷思偏誤 vs. 生態理性

入門篇介紹的「捷思與偏誤」(heuristics-and-biases)傳統,源自 Amos Tversky 與 Daniel Kahneman 在 1970 年代的開創性研究。他們的策略是:找一個規範性標準(normative standard,通常是機率論或邏輯),讓人去做題,然後紀錄人偏離標準的系統性方式。代表性捷思(representativeness)、可得性捷思(availability)、錨定(anchoring)都是這樣被發現的。這個取向把人類描繪成「帶有可預測缺陷的近似理性者」。
但從 1990 年代起,以 Gerd Gigerenzer 為首的一派提出強烈異議,這就是生態理性(ecological rationality)與「快而簡約」(fast-and-frugal heuristics)綱領。他們的核心論點有三層:
第一,規範標準本身可疑。許多「偏誤」之所以出現,是因為實驗者用了一個窄化的機率論定義。最著名的爭論是「連言謬誤」(conjunction fallacy)——著名的「琳達問題」(Linda problem):受試者判斷「琳達是銀行行員且是女性主義者」比「琳達是銀行行員」更可能。這違反機率公理(A∧B 不可能比 A 更可能)。但 Gigerenzer 指出,若把問題從單一機率改成自然頻率(natural frequencies)——「100 個像琳達的人裡,有幾個是銀行行員?有幾個是女性主義銀行行員?」——謬誤率大幅下降。問題不全在腦袋,也在題目的呈現格式。
第二,簡單捷思常常打敗複雜模型。Gigerenzer 團隊提出「取一個好理由就決定」(Take-the-Best)捷思:在多屬性判斷中,只用最具區辨力的單一線索做決定,忽略其餘。直覺上這應該很糟,但在許多真實資料集上,它的預測準確度竟然能匹敵甚至超越多元迴歸。原因在於:複雜模型容易「過度配適」(overfitting)樣本中的雜訊,而簡約捷思因為參數少、變異低,反而更能類推到新情境。這是統計學「偏誤—變異權衡」(bias-variance tradeoff)在認知上的體現。
第三,理性必須相對於環境結構來評價。「少即是多效應」(less-is-more effect)是個漂亮的例子:對德國城市人口大小做判斷時,認得較少城市的美國學生,靠「再認捷思」(recognition heuristic,認得的城市較大)的表現,有時竟優於認得所有城市的德國學生——因為「認得與否」本身就攜帶了與目標相關的環境訊息。一旦你全都認得,這個線索就失效了。
這場論戰至今未有定論,但它的成熟結論不是「誰對誰錯」,而是:「理性」是心智與環境的配適問題,脫離環境去問捷思「好不好」是沒有意義的。 Kahneman 與 Gigerenzer 的分歧,某種程度上是「相對於邏輯/機率」與「相對於真實世界生態」這兩把尺的分歧。
推理的引擎:心智模型理論
入門篇告訴你人在四卡任務上會犯錯,但沒回答一個更基本的問題:人到底是「怎麼」推理的? 腦中跑的是形式邏輯規則,還是別的東西?
對此最有影響力的回答是 Philip Johnson-Laird 的心智模型理論(mental models theory)。它主張:人不是靠操弄抽象的邏輯符號來推理,而是建構出情境的心智模型——一種對「事物可能如何排列」的內在表徵——然後檢視這些模型,讀出結論。
舉個例子。給定前提:「盤子在杯子的右邊;叉子在盤子的右邊。」你會在腦中排出一個空間佈局〔杯子—盤子—叉子〕,然後直接「看出」叉子在杯子右邊。你不需要任何「遞移律」(transitivity)的形式公理,你只是建了個模型並讀取它。
這個理論的解釋力,在於它能預測推理的難度與系統性錯誤:
- 模型數量決定難度。如果一組前提只相容於單一心智模型,人推得又快又準;如果相容於多個模型(例如前提含「或」),人必須在工作記憶(working memory)裡同時持有數個模型,負荷暴增、錯誤率上升。這把推理表現與工作記憶容量直接掛鉤。
- 「真值化」原則造成可預測的謬誤。心智模型理論的關鍵假設是:人傾向只表徵「為真」的可能性,而忽略「為假」的可能性(principle of truth)。這會導致一類驚人的「幻覺推論」(illusory inferences):對某些邏輯形式,幾乎所有人都會給出一個自信卻錯誤的結論,因為他們沒去表徵那些被略過的「假」模型。這是少數能事先理論預測出「人人都會錯,且錯在哪」的框架,遠比「人有偏誤」這種事後描述更有力。
心智模型理論的對手是「心智邏輯」(mental logic)學派(如 Lance Rips、Martin Braine),後者主張腦中確有一套類似自然演繹的推論規則。兩派數十年的交鋒,本身就是認知科學如何用「可證偽預測」來裁決理論的範例——你可以設計題目,讓兩個理論預測相反的難度排序,再用實驗分勝負。
看一個例子:類比不是「相似」,而是「結構對齊」
人類最強大的思考能力之一是類比推理(analogical reasoning)——把一個熟悉領域(來源,source)的結構搬到陌生領域(標的,target)。Dedre Gentner 的結構對映理論(structure-mapping theory)精準刻畫了它的機制,而它的核心洞見常被誤解。
考慮經典類比:「原子像太陽系。」一個天真的看法以為類比靠的是「物件相似」——電子像行星、核像太陽。但 Gentner 證明,好的類比靠的不是物件屬性的相似,而是關係結構的對齊:
- 太陽系裡,「太陽『質量大於』行星」「行星『繞著』太陽轉」「『吸引力』導致旋轉」。
- 原子裡,對應的是「核『質量大於』電子」「電子『繞著』核轉」「『靜電力』導致旋轉」。
被搬過去的是關係系統(繞行、吸引、因果),而不是物件的表面屬性(太陽是熱的、黃的——這些不該被映射,事實上人也不會把「太陽很燙」推論到原子核)。Gentner 進一步提出「系統性原則」(systematicity principle):人偏好映射那些彼此由高階關係(如因果、蘊涵)連結成系統的關係,而非孤立的單一關係。這解釋了為什麼有些類比「深刻」、有些只是「巧合的相似」。
動手試試:想一個你正在學的抽象概念(例如「電壓像水壓」)。把它拆成「來源領域有哪些關係」與「標的領域有哪些對應關係」兩欄,並刻意找出「哪些表面屬性不該被映射」(水會濕、會流動成河——但電壓不會)。你會發現,能不能指認出「不該映射的部分」,正是你是否真正理解這個類比、而非被表面相似牽著走的試金石。這也是教學設計上類比為何會「誤導」的根源:當學生對齊了錯誤的關係,類比反而製造迷思。
計算層次:把認知當成貝氏推論
要真正超越入門篇,你需要 David Marr 的一個方法論工具:分析的三個層次(three levels of analysis)。Marr 主張理解任何資訊處理系統,都要分開問三個問題:
- 計算層次(computational):這個系統要解決什麼問題?什麼是「最佳解」?
- 演算法層次(algorithmic):它用什麼表徵與步驟去逼近這個解?
- 實作層次(implementational):這些步驟如何在硬體(神經元)上實現?
入門篇談的捷思、心向、雙歷程,大多在「演算法層次」。而過去二十年認知科學最大的綱領之一——貝氏認知科學(Bayesian cognitive science),則是在「計算層次」重新發問:如果大腦面對的根本問題是「在不確定與雜訊中,從有限證據推論世界的真相」,那麼最佳的解法就是貝氏推論。
這帶來一個範式翻轉。在這個視角下,許多「偏誤」不再是缺陷,而是最佳推論在特定先驗(prior)下的合理結果:
- 知覺中的錯覺(如明暗恆常性)可以重新理解為大腦結合「感官證據」與「對自然光源的先驗假設」所得的最佳估計。
- Tom Griffiths 與 Josh Tenenbaum 的研究顯示,人們對日常事件的「預測判斷」——例如「一部電影已經上映 30 天,總共會放映多久?」——其分布形狀竟與真實世界統計的貝氏最佳預測高度吻合。人腦彷彿內建了對各類量的合理先驗。
- 連入門篇提到的「基率忽略」(base-rate neglect),在自然頻率呈現下也部分恢復為近乎貝氏的更新——呼應了前面 Gigerenzer 的論點。
但這裡有一個深刻的張力,也是研究生最該掌握的:計算層次的「最佳」不等於演算法層次「真的這樣算」。 完整的貝氏推論在計算上往往是不可解的(intractable)——要對所有假設積分。於是出現「資源理性」(resource rationality, Griffiths)與「取樣假說」(sampling hypothesis):大腦不是精算後驗分布,而是從中抽幾個樣本來近似。這一刀漂亮地接回了捷思傳統——許多「偏誤」(如錨定、機率配對、判斷的隨機波動)都可重新詮釋為「用少量樣本近似貝氏推論」時必然產生的系統性偏移。Kahneman 的捷思與 Tenenbaum 的貝氏,在「資源受限的近似推論」這個更高的綜合下握手言和。
雙歷程理論的重寫:直覺其實懂邏輯
最後,回到入門篇的主角——雙歷程理論。標準版本說:系統一(快、直覺)拋出答案,系統二(慢、邏輯)有時介入糾正;犯錯是因為系統二太懶、沒被叫醒。這個「糾正派」(corrective view)圖像簡潔,但近十五年被一連串實驗嚴重挑戰。
Wim De Neys 的「邏輯直覺」(logical intuitions)研究是關鍵。核心發現是:即使人最終給出直覺性的錯誤答案,他們在過程中往往已經偵測到衝突。證據包括——做球棒類問題時答錯的人,信心評分比答對控制題時更低;他們在錯誤答案上停留更久、生理喚起(如膚電)上升;要求他們快速作答(剝奪系統二)時,仍能在「有衝突」與「無衝突」題目間表現出差異。
這意味著什麼?意味著衝突偵測(conflict detection)發生得又快又自動,可能是系統一本身就平行地激發了一個「直覺的邏輯感」與一個「直覺的捷思感」。錯誤往往不是「沒偵測到衝突」,而是偵測到了卻無法成功抑制或修正強勢的直覺反應。換句話說,問題的瓶頸從「監督者沒被叫醒」移到了「監督者叫醒了,但煞不住車」。
這催生了 De Neys 的「混合模型」(hybrid model)甚至「單一歷程連續體」的提議:與其說有兩個離散的系統打架,不如說有多個直覺平行競爭、各帶不同強度,而所謂的「審慎思考」更多是在做事後的合理化與選擇性抑制。這與你在入門篇尾段讀到的提醒一致,但機制更精細——它把「人為何明知故犯」這個道德直覺常見的困惑,放進了認知架構裡來理解。
重點回顧
- 理性論戰是本領域的主軸:捷思偏誤傳統(Kahneman/Tversky)以邏輯機率為尺,生態理性傳統(Gigerenzer)以環境配適為尺;許多「偏誤」在自然頻率格式或真實生態下會減弱或反轉。
- 簡約未必劣於複雜:「取一個好理由」「再認捷思」等快而簡約捷思因參數少、變異低,能避開過度配適,在類推到新情境時可勝過多元迴歸——這是偏誤—變異權衡在認知上的展現。
- 推理靠建構與檢視心智模型:Johnson-Laird 的理論用「模型數量」預測難度、用「只表徵為真」的原則預測出人人都會犯的「幻覺推論」,比事後貼「偏誤」標籤更具預測力。
- 類比靠結構對齊而非表面相似:Gentner 的結構對映理論說明,被搬移的是關係系統,能指認「不該映射的屬性」才代表真正理解。
- 貝氏綱領在計算層次重新定義問題:把認知當成不確定下的最佳推論;而「資源理性/取樣假說」把計算上不可解的貝氏,接回有限資源的近似捷思,與雙歷程的最新「邏輯直覺」研究共同指向「資源受限的近似推論」這個統一圖像。
深入探討(研究所視角)
若要把本篇推進到研究前沿,有三條值得深掘的線索。
第一,預測處理(predictive processing)作為統一框架。 貝氏認知科學在計算層次的成功,正被 Karl Friston 的「自由能原則」(free-energy principle)與 Andy Clark 的預測處理理論推向一個更激進的主張:知覺、行動、推理可能都是同一個過程——大腦持續產生對感官輸入的階層式預測,並以「預測誤差」(prediction error)為訊號去更新內部模型。在這個視角下,「注意力」是對精確度(precision)的加權、「思考」是離線地操弄生成模型。值得批判地追問:自由能原則究竟是一個可證偽的經驗理論,還是一個無所不包、因而難以否證的數學框架?這正是當前理論神經科學的活躍爭論。
第二,雙歷程理論的存有論地位。 De Neys 的「邏輯直覺」若成立,「系統一 vs. 系統二」這組區分還剩下多少實質內容?研究生應追蹤的關鍵實驗策略,是設計能讓「糾正派」與「混合模型」做出相反預測的範式(例如操弄作答時限、認知負荷、利用雙任務剝奪審慎資源),看衝突偵測是否在系統二被佔滿時仍存在。這也牽涉測量學難題:信心、反應時間、後悔感各自捕捉了「衝突偵測」的哪個面向?
第三,分布語意與大型語言模型對「人類推理是否需要符號」這個老問題的衝擊。 心智模型與心智邏輯之爭,預設了推理需要某種結構化表徵。如今以分布式向量為基礎、未顯式內建邏輯規則的大型語言模型,在許多推理與類比作業上展現出可觀(雖不穩定)的表現。這逼我們重新發問:結構對映、模型建構這些能力,是否可能從足夠豐富的統計學習中湧現,而非預先安置?同時也提供了一個前所未有的對照組——人類在哪些推理上系統性地優於、或劣於這些模型,反過來能照亮人類認知架構的獨特約束。對有志於認知科學的學生,這三條線索(預測處理、雙歷程重寫、符號與湧現之爭)正是未來十年最值得投入的戰場。