理性的尺：當「偏誤」其實是聰明的——推理、貝氏心智與雙歷程的重寫

從「人類為何犯錯」走向「我們用來判定對錯的那把尺是否選錯」：生態理性論戰、心智模型、結構對映、貝氏計算層次與邏輯直覺的最新樣貌

進階 · 約 16 分鐘 ·#認知心理學#推理與理性#貝氏認知科學#雙歷程理論#心智模型

如果「偏誤」其實是聰明的，我們對理性的理解錯在哪裡？

你在入門篇學過，人類在球棒問題上會脫口說出「10 美分」，在四卡任務上會去翻錯的卡片，在水罐實驗裡會被舊公式困住。這些現象被收編進一個強而有力的敘事：人類是「可預測地不理性」的，認知系統佈滿了系統性的捷思（heuristics）與偏誤（biases）。這個敘事如此成功，以至於它幾乎成了通識教育對「人類思考」的標準結論。

但這裡有一個值得研究生認真對待的反問：如果一個「偏誤」在現實環境中其實平均而言會帶來更好的決策，它還算是「錯誤」嗎？ 一個始終假設草叢裡的沙沙聲是掠食者的大腦，在貝氏（Bayesian）意義上「過度反應」了，但牠的後代活了下來。當代認知科學最重要的轉折，正是從「人類為什麼會犯錯」這個問題，轉向一個更深的問題：我們用來判定「對錯」的那把尺，本身是不是選錯了？ 本篇就從這場「理性論戰」（the rationality debate）切入，帶你看入門篇沒有展開的三條前沿主線：推理的心智模型機制、貝氏取向的計算層次理論，以及雙歷程理論被改寫的最新樣貌。

兩種「理性」之爭：捷思偏誤 vs. 生態理性

認知與思考進階概念示意圖

入門篇介紹的「捷思與偏誤」（heuristics-and-biases）傳統，源自 Amos Tversky 與 Daniel Kahneman 在 1970 年代的開創性研究。他們的策略是：找一個規範性標準（normative standard，通常是機率論或邏輯），讓人去做題，然後紀錄人偏離標準的系統性方式。代表性捷思（representativeness）、可得性捷思（availability）、錨定（anchoring）都是這樣被發現的。這個取向把人類描繪成「帶有可預測缺陷的近似理性者」。

但從 1990 年代起，以 Gerd Gigerenzer 為首的一派提出強烈異議，這就是生態理性（ecological rationality）與「快而簡約」（fast-and-frugal heuristics）綱領。他們的核心論點有三層：

第一，規範標準本身可疑。許多「偏誤」之所以出現，是因為實驗者用了一個窄化的機率論定義。最著名的爭論是「連言謬誤」（conjunction fallacy）——著名的「琳達問題」（Linda problem）：受試者判斷「琳達是銀行行員且是女性主義者」比「琳達是銀行行員」更可能。這違反機率公理（A∧B 不可能比 A 更可能）。但 Gigerenzer 指出，若把問題從單一機率改成自然頻率（natural frequencies）——「100 個像琳達的人裡，有幾個是銀行行員？有幾個是女性主義銀行行員？」——謬誤率大幅下降。問題不全在腦袋，也在題目的呈現格式。

第二，簡單捷思常常打敗複雜模型。Gigerenzer 團隊提出「取一個好理由就決定」（Take-the-Best）捷思：在多屬性判斷中，只用最具區辨力的單一線索做決定，忽略其餘。直覺上這應該很糟，但在許多真實資料集上，它的預測準確度竟然能匹敵甚至超越多元迴歸。原因在於：複雜模型容易「過度配適」（overfitting）樣本中的雜訊，而簡約捷思因為參數少、變異低，反而更能類推到新情境。這是統計學「偏誤—變異權衡」（bias-variance tradeoff）在認知上的體現。

第三，理性必須相對於環境結構來評價。「少即是多效應」（less-is-more effect）是個漂亮的例子：對德國城市人口大小做判斷時，認得較少城市的美國學生，靠「再認捷思」（recognition heuristic，認得的城市較大）的表現，有時竟優於認得所有城市的德國學生——因為「認得與否」本身就攜帶了與目標相關的環境訊息。一旦你全都認得，這個線索就失效了。

這場論戰至今未有定論，但它的成熟結論不是「誰對誰錯」，而是：「理性」是心智與環境的配適問題，脫離環境去問捷思「好不好」是沒有意義的。 Kahneman 與 Gigerenzer 的分歧，某種程度上是「相對於邏輯／機率」與「相對於真實世界生態」這兩把尺的分歧。

推理的引擎：心智模型理論

入門篇告訴你人在四卡任務上會犯錯，但沒回答一個更基本的問題：人到底是「怎麼」推理的？ 腦中跑的是形式邏輯規則，還是別的東西？

對此最有影響力的回答是 Philip Johnson-Laird 的心智模型理論（mental models theory）。它主張：人不是靠操弄抽象的邏輯符號來推理，而是建構出情境的心智模型——一種對「事物可能如何排列」的內在表徵——然後檢視這些模型，讀出結論。

舉個例子。給定前提：「盤子在杯子的右邊；叉子在盤子的右邊。」你會在腦中排出一個空間佈局〔杯子—盤子—叉子〕，然後直接「看出」叉子在杯子右邊。你不需要任何「遞移律」（transitivity）的形式公理，你只是建了個模型並讀取它。

這個理論的解釋力，在於它能預測推理的難度與系統性錯誤：

模型數量決定難度。如果一組前提只相容於單一心智模型，人推得又快又準；如果相容於多個模型（例如前提含「或」），人必須在工作記憶（working memory）裡同時持有數個模型，負荷暴增、錯誤率上升。這把推理表現與工作記憶容量直接掛鉤。
「真值化」原則造成可預測的謬誤。心智模型理論的關鍵假設是：人傾向只表徵「為真」的可能性，而忽略「為假」的可能性（principle of truth）。這會導致一類驚人的「幻覺推論」（illusory inferences）：對某些邏輯形式，幾乎所有人都會給出一個自信卻錯誤的結論，因為他們沒去表徵那些被略過的「假」模型。這是少數能事先理論預測出「人人都會錯，且錯在哪」的框架，遠比「人有偏誤」這種事後描述更有力。

心智模型理論的對手是「心智邏輯」（mental logic）學派（如 Lance Rips、Martin Braine），後者主張腦中確有一套類似自然演繹的推論規則。兩派數十年的交鋒，本身就是認知科學如何用「可證偽預測」來裁決理論的範例——你可以設計題目，讓兩個理論預測相反的難度排序，再用實驗分勝負。

看一個例子：類比不是「相似」，而是「結構對齊」

人類最強大的思考能力之一是類比推理（analogical reasoning）——把一個熟悉領域（來源，source）的結構搬到陌生領域（標的，target）。Dedre Gentner 的結構對映理論（structure-mapping theory）精準刻畫了它的機制，而它的核心洞見常被誤解。

考慮經典類比：「原子像太陽系。」一個天真的看法以為類比靠的是「物件相似」——電子像行星、核像太陽。但 Gentner 證明，好的類比靠的不是物件屬性的相似，而是關係結構的對齊：

太陽系裡，「太陽『質量大於』行星」「行星『繞著』太陽轉」「『吸引力』導致旋轉」。
原子裡，對應的是「核『質量大於』電子」「電子『繞著』核轉」「『靜電力』導致旋轉」。

被搬過去的是關係系統（繞行、吸引、因果），而不是物件的表面屬性（太陽是熱的、黃的——這些不該被映射，事實上人也不會把「太陽很燙」推論到原子核）。Gentner 進一步提出「系統性原則」（systematicity principle）：人偏好映射那些彼此由高階關係（如因果、蘊涵）連結成系統的關係，而非孤立的單一關係。這解釋了為什麼有些類比「深刻」、有些只是「巧合的相似」。

動手試試：想一個你正在學的抽象概念（例如「電壓像水壓」）。把它拆成「來源領域有哪些關係」與「標的領域有哪些對應關係」兩欄，並刻意找出「哪些表面屬性不該被映射」（水會濕、會流動成河——但電壓不會）。你會發現，能不能指認出「不該映射的部分」，正是你是否真正理解這個類比、而非被表面相似牽著走的試金石。這也是教學設計上類比為何會「誤導」的根源：當學生對齊了錯誤的關係，類比反而製造迷思。

計算層次：把認知當成貝氏推論

要真正超越入門篇，你需要 David Marr 的一個方法論工具：分析的三個層次（three levels of analysis）。Marr 主張理解任何資訊處理系統，都要分開問三個問題：

計算層次（computational）：這個系統要解決什麼問題？什麼是「最佳解」？
演算法層次（algorithmic）：它用什麼表徵與步驟去逼近這個解？
實作層次（implementational）：這些步驟如何在硬體（神經元）上實現？

入門篇談的捷思、心向、雙歷程，大多在「演算法層次」。而過去二十年認知科學最大的綱領之一——貝氏認知科學（Bayesian cognitive science），則是在「計算層次」重新發問：如果大腦面對的根本問題是「在不確定與雜訊中，從有限證據推論世界的真相」，那麼最佳的解法就是貝氏推論。

這帶來一個範式翻轉。在這個視角下，許多「偏誤」不再是缺陷，而是最佳推論在特定先驗（prior）下的合理結果：

知覺中的錯覺（如明暗恆常性）可以重新理解為大腦結合「感官證據」與「對自然光源的先驗假設」所得的最佳估計。
Tom Griffiths 與 Josh Tenenbaum 的研究顯示，人們對日常事件的「預測判斷」——例如「一部電影已經上映 30 天，總共會放映多久？」——其分布形狀竟與真實世界統計的貝氏最佳預測高度吻合。人腦彷彿內建了對各類量的合理先驗。
連入門篇提到的「基率忽略」（base-rate neglect），在自然頻率呈現下也部分恢復為近乎貝氏的更新——呼應了前面 Gigerenzer 的論點。

但這裡有一個深刻的張力，也是研究生最該掌握的：計算層次的「最佳」不等於演算法層次「真的這樣算」。 完整的貝氏推論在計算上往往是不可解的（intractable）——要對所有假設積分。於是出現「資源理性」（resource rationality, Griffiths）與「取樣假說」（sampling hypothesis）：大腦不是精算後驗分布，而是從中抽幾個樣本來近似。這一刀漂亮地接回了捷思傳統——許多「偏誤」（如錨定、機率配對、判斷的隨機波動）都可重新詮釋為「用少量樣本近似貝氏推論」時必然產生的系統性偏移。Kahneman 的捷思與 Tenenbaum 的貝氏，在「資源受限的近似推論」這個更高的綜合下握手言和。

雙歷程理論的重寫：直覺其實懂邏輯

最後，回到入門篇的主角——雙歷程理論。標準版本說：系統一（快、直覺）拋出答案，系統二（慢、邏輯）有時介入糾正；犯錯是因為系統二太懶、沒被叫醒。這個「糾正派」（corrective view）圖像簡潔，但近十五年被一連串實驗嚴重挑戰。

Wim De Neys 的「邏輯直覺」（logical intuitions）研究是關鍵。核心發現是：即使人最終給出直覺性的錯誤答案，他們在過程中往往已經偵測到衝突。證據包括——做球棒類問題時答錯的人，信心評分比答對控制題時更低；他們在錯誤答案上停留更久、生理喚起（如膚電）上升；要求他們快速作答（剝奪系統二）時，仍能在「有衝突」與「無衝突」題目間表現出差異。

這意味著什麼？意味著衝突偵測（conflict detection）發生得又快又自動，可能是系統一本身就平行地激發了一個「直覺的邏輯感」與一個「直覺的捷思感」。錯誤往往不是「沒偵測到衝突」，而是偵測到了卻無法成功抑制或修正強勢的直覺反應。換句話說，問題的瓶頸從「監督者沒被叫醒」移到了「監督者叫醒了，但煞不住車」。

這催生了 De Neys 的「混合模型」（hybrid model）甚至「單一歷程連續體」的提議：與其說有兩個離散的系統打架，不如說有多個直覺平行競爭、各帶不同強度，而所謂的「審慎思考」更多是在做事後的合理化與選擇性抑制。這與你在入門篇尾段讀到的提醒一致，但機制更精細——它把「人為何明知故犯」這個道德直覺常見的困惑，放進了認知架構裡來理解。

重點回顧

理性論戰是本領域的主軸：捷思偏誤傳統（Kahneman/Tversky）以邏輯機率為尺，生態理性傳統（Gigerenzer）以環境配適為尺；許多「偏誤」在自然頻率格式或真實生態下會減弱或反轉。
簡約未必劣於複雜：「取一個好理由」「再認捷思」等快而簡約捷思因參數少、變異低，能避開過度配適，在類推到新情境時可勝過多元迴歸——這是偏誤—變異權衡在認知上的展現。
推理靠建構與檢視心智模型：Johnson-Laird 的理論用「模型數量」預測難度、用「只表徵為真」的原則預測出人人都會犯的「幻覺推論」，比事後貼「偏誤」標籤更具預測力。
類比靠結構對齊而非表面相似：Gentner 的結構對映理論說明，被搬移的是關係系統，能指認「不該映射的屬性」才代表真正理解。
貝氏綱領在計算層次重新定義問題：把認知當成不確定下的最佳推論；而「資源理性／取樣假說」把計算上不可解的貝氏，接回有限資源的近似捷思，與雙歷程的最新「邏輯直覺」研究共同指向「資源受限的近似推論」這個統一圖像。

深入探討（研究所視角）

若要把本篇推進到研究前沿，有三條值得深掘的線索。

第一，預測處理（predictive processing）作為統一框架。 貝氏認知科學在計算層次的成功，正被 Karl Friston 的「自由能原則」（free-energy principle）與 Andy Clark 的預測處理理論推向一個更激進的主張：知覺、行動、推理可能都是同一個過程——大腦持續產生對感官輸入的階層式預測，並以「預測誤差」（prediction error）為訊號去更新內部模型。在這個視角下，「注意力」是對精確度（precision）的加權、「思考」是離線地操弄生成模型。值得批判地追問：自由能原則究竟是一個可證偽的經驗理論，還是一個無所不包、因而難以否證的數學框架？這正是當前理論神經科學的活躍爭論。

第二，雙歷程理論的存有論地位。 De Neys 的「邏輯直覺」若成立，「系統一 vs. 系統二」這組區分還剩下多少實質內容？研究生應追蹤的關鍵實驗策略，是設計能讓「糾正派」與「混合模型」做出相反預測的範式（例如操弄作答時限、認知負荷、利用雙任務剝奪審慎資源），看衝突偵測是否在系統二被佔滿時仍存在。這也牽涉測量學難題：信心、反應時間、後悔感各自捕捉了「衝突偵測」的哪個面向？

第三，分布語意與大型語言模型對「人類推理是否需要符號」這個老問題的衝擊。 心智模型與心智邏輯之爭，預設了推理需要某種結構化表徵。如今以分布式向量為基礎、未顯式內建邏輯規則的大型語言模型，在許多推理與類比作業上展現出可觀（雖不穩定）的表現。這逼我們重新發問：結構對映、模型建構這些能力，是否可能從足夠豐富的統計學習中湧現，而非預先安置？同時也提供了一個前所未有的對照組——人類在哪些推理上系統性地優於、或劣於這些模型，反過來能照亮人類認知架構的獨特約束。對有志於認知科學的學生，這三條線索（預測處理、雙歷程重寫、符號與湧現之爭）正是未來十年最值得投入的戰場。

← 上一篇

快思與慢想：人類如何解決問題、推理，又為何系統性地犯錯

--

5

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定