療效都差不多？心理治療的機制、歷程與證據前線

越過「學派比拼」，從中介與調節、同盟的因果之謎、第三波的哲學斷裂，到 EST 與 EBPP 的關鍵分野

進階 · 約 15 分鐘 ·#心理治療#改變機制#治療同盟#歷程取向治療#實證為本實務

如果各學派療效真的「都差不多」，臨床科學還剩下什麼可研究？

你在入門篇學過一個令人不安的結論：渡渡鳥裁決（Dodo bird verdict）——許多比較研究發現，不同學派的整體療效差異，往往小於人們的預期。如果認知行為治療（cognitive-behavioral therapy, CBT）、心理動力治療（psychodynamic therapy）、人本治療最後的「平均成績」都落在差不多的區間，那麼一個尖銳的問題浮現了：臨床心理學還剩下什麼值得研究？我們是不是該放棄「哪種療法比較好」，乾脆只訓練治療師「跟個案處好關係」就行？

這個問題的答案，恰恰是過去三十年臨床科學最有生產力的轉向。研究者沒有停在「療效相當」的表面結論，而是往下追問三件事：改變到底是透過什麼歷程發生的（機制）？同一份「平均療效」底下，是否藏著「對某些人極有效、對另一些人無效」的異質性（調節）？以及，我們宣稱的「治療關係」究竟是改變的原因，還是改變的結果？這篇進階篇，要帶你離開「學派比拼」的舊戰場，進入當代心理治療科學真正的前線——歷程（process）、機制（mechanism）與證據如何被嚴謹建立。

從「治療套裝」到「改變歷程」：研究單位的根本轉移

心理治療進階概念示意圖

傳統的療效研究（efficacy research）把「一整套命名好的療法」當成研究單位：招募一群憂鬱症患者，隨機分派到「CBT 組」與「對照組」，比較結束後的症狀分數。這種隨機對照試驗（randomized controlled trials, RCTs）回答了「這個套裝有沒有效」，卻幾乎沒告訴我們「套裝裡哪個零件在起作用」。

當代研究的核心轉移，是把研究單位從療法（therapy package）換成改變歷程（process of change）。這背後有一個方法學工具叫拆解式研究（dismantling study）：把一個完整療法拆成數個成分，分別給不同組別，看少了某個零件後療效是否下降。入門篇提過 Jacobson 等人（1996）的成分分析——單獨的行為活化（behavioral activation）對憂鬱症的效果，未必遜於含認知重構的完整 CBT。這類發現之所以重要，不只是「行為活化很有用」，而是它逼我們承認：一個療法「有效」，不等於它「按照理論宣稱的機制」起效。

這裡要釐清三組常被混淆的概念，它們是讀懂所有現代療效論文的鑰匙：

中介變項（mediator）：改變「透過什麼」發生。它必須在症狀改善「之前」變動，且能在統計上解釋療效的傳遞路徑。例如：CBT → 降低災難化思考 → 焦慮下降，其中「災難化思考」是候選中介。
調節變項（moderator）：療法「對誰、在什麼條件下」最有效。它在治療「之前」就已存在（如基線嚴重度、共病、依附風格）。
改變機制（mechanism of change）：比中介更嚴格——不只統計上相關，還要滿足時序先後與（理想上）實驗操弄的因果條件。

Kazdin 在多篇影響深遠的回顧中尖銳指出：儘管心理治療「有效」已被反覆證實，但對於「改變如何發生」，我們所知少得驚人。要把「中介」升級為「機制」，研究必須同時滿足數個條件：強而一致的關聯、實驗操弄能改變該變項、時序上中介先於結果、劑量—反應關係、以及合理的理論基礎。多數現有研究只做到第一項。這正是臨床科學尚未完成的功課。

治療關係：原因，還是結果？一場因果方向的攻防

入門篇把「治療關係」（therapeutic alliance）列為共同因素（common factors）的代表。但進階的問題是：這份關係到底是療效的「原因」，還是個案「正在好轉」的副產品？

這個質疑不是吹毛求疵。想像一位個案在第三週開始好轉，他自然會更喜歡治療師、更信任療程——於是「同盟分數」上升。如果我們只看「同盟分數高的人結果比較好」，就宣稱「同盟造成療效」，很可能把因果方向搞反了：是早期的症狀改善同時推高了同盟與後續結果，同盟只是搭了便車。

研究者用兩種策略迎戰這個內生性（endogeneity）問題：

第一，控制先前的症狀變化。DeRubeis 與同事的研究指出，必須先把「上一次評估到本次之間的症狀改善」納入統計控制，才能檢驗同盟是否「額外」預測後續改善。當這麼做之後，同盟對結果的「獨立」貢獻往往縮小，但在許多研究中仍然存在。

第二，區分個體間與個體內變異（between-person vs. within-person）。這是近年方法學的關鍵進展：用多層次模型（multilevel modeling）把「某人平均同盟比別人高」（個體間）和「某人在某一週同盟比自己平時高」（個體內）拆開。Falkenström 等人的研究顯示，個體內的同盟波動能預測下一次的症狀變化——某週同盟特別好，往往伴隨之後症狀更明顯下降——這比單純的橫斷相關更接近因果證據。

Flückiger 等人歷年更新的大型統合分析（meta-analysis）一致發現，同盟與療效呈中等且穩定的關聯，且這個關聯跨療法、跨診斷都成立。但「中等且穩定」不等於「已證實為因果引擎」。當代共識是：同盟很可能既是改變的促成條件，也部分反映了改變本身——兩者交織成一個正向迴圈，而非單向箭頭。 能接受「因果是雙向交織」而非「非此即彼」，正是研究所程度的思考成熟度。

第三波：當「改變想法的內容」讓位給「改變與想法的關係」

入門篇提到「第三波」CBT（接納與承諾治療 ACT、辯證行為治療 DBT）融合了正念（mindfulness）。但它們真正的理論斷裂，值得更深入的拆解——這不只是「多加了冥想」，而是對「改變的標的」做了哲學層次的重新定義。

傳統 CBT 的策略是第一序改變（first-order change）：直接修正想法的「內容」——「我是個失敗者」這個念頭被當成錯誤假設，要用證據去反駁、用更貼近現實的版本取代。

ACT 走的卻是第二序改變（second-order change）：它不太在乎念頭內容真不真，而在乎你與念頭的關係。核心技術叫認知解離（cognitive defusion）——不是把「我是個失敗者」改成「我其實還不錯」，而是學會看見「我『正在有』一個『我是失敗者』的念頭」，讓念頭從「我必須相信並服從的事實」退回成「腦中飄過的一串字」。ACT 的目標模型 Hexaflex 圍繞心理彈性（psychological flexibility）：接納（acceptance）、解離、當下接觸、以己為脈絡（self-as-context）、價值（values）、承諾行動（committed action）。它不問「你的念頭對不對」，而問「朝你真正在乎的價值前進，你願不願意帶著這些念頭一起走」。

DBT 則把這套思維放進另一組張力裡：它源於辯證哲學，核心是接納與改變的辯證——治療師一手徹底接納（radical acceptance）個案此刻的痛苦是「在他的歷史下合理的」，另一手堅定要求行為改變。對情緒調節困難、自傷風險高的個案，純粹的「改變導向」會讓他們覺得不被理解，純粹的「接納」又無助於止住危險行為；DBT 的技術正是在這兩極間動態平衡。

這引出一個更宏觀的趨勢——歷程取向治療（process-based therapy, PBT）。Hayes 與 Hofmann 等人主張：與其爭論「哪個學派的命名套裝最好」，不如直接鎖定跨診斷、實證上可改變的核心歷程（如經驗逃避、反芻思考、情緒調節失能），針對個案此刻最關鍵的歷程量身組裝介入。這在某種意義上是對「學派戰爭」的釜底抽薪：研究單位不再是「CBT vs. 精神分析」，而是「對這個人、此刻、這個歷程，哪個機制最該被撬動」。

看一個例子：同一句話，三種治療怎麼處理

回到入門篇那位社交焦慮的學生。他發言時看到兩位同學交談，腦中閃過：「他們一定在嘲笑我。」三種取向的處理，正好暴露它們對「改變」的不同假設：

取向	核心問句	對「他們一定在嘲笑我」的處理
傳統 CBT	這個念頭符合證據嗎？	檢驗證據、找替代解釋（也許在借筆）、安排行為實驗驗證預測——改內容
ACT	你願意帶著這念頭去做你在乎的事嗎？	練習解離（「我注意到我有『被嘲笑』的念頭」），把焦點轉回「對我而言，參與討論的價值是什麼」——改關係
心理動力取向	這份「被輕視」的感受，讓你想起什麼？	探索這個情境如何重演了更早年的關係模式，以及它如何在「與治療師的此時此刻」（移情 transference）中再現——改理解與關係經驗

值得注意的是：這三種路徑未必互斥。一位受過整合訓練的治療師，可能先用解離幫個案從念頭中鬆脫，再用行為實驗累積反證，最後在某次同盟夠穩固時，碰觸這份焦慮更深的關係根源。「該用哪一條」往往取決於個案此刻卡在哪個歷程，而非治療師效忠哪個學派。

證據的層級：實證支持的治療，不等於「實證為本的實務」

學到這裡，你可能想問：那臨床上到底「該信什麼」？這裡有一個極易混淆、卻攸關專業判斷的區分。

實證支持的治療（empirically supported treatments, ESTs）是一份「清單」：哪些命名療法、針對哪些診斷，在 RCT 中達到了預設的證據門檻。它的優點是把鬆散的臨床傳統釘上科學標準；缺點是容易僵化成「照手冊操作」（manualized），且 RCT 的高度篩選樣本（排除共病、排除自殺風險）未必對得上診間裡複雜的真實個案——這就是效力（efficacy，理想條件下有沒有效）與成效（effectiveness，真實情境下有沒有效）的落差。

美國心理學會（APA）因此採用更寬的框架——實證為本的實務（evidence-based practice in psychology, EBPP），它由三根支柱構成：

最佳可得研究證據（best available research evidence）
臨床專業判斷（clinical expertise）：包含個案概念化、與個案協作、辨識何時偏離手冊
個案特徵、文化與偏好（patient characteristics, culture, and preferences）

換句話說，EBPP 不是「把清單上的療法套上去」，而是「在科學證據的約束下，為這個獨特的人做出最佳臨床決策」。這也呼應前面的歷程取向：證據告訴你哪些機制值得撬動，臨床判斷告訴你眼前這個人此刻卡在哪裡，而個案的價值與文化決定了什麼樣的改變對他才有意義。

動手試試：為一份療效宣稱做「機制盡職調查」

下次你讀到（或聽到）「研究證明 X 療法能改善 Y」時，別停在「有效嗎」，用這份清單做進階審視：

比較對象是誰？ 對照組是「等候名單」、「一般照護」，還是「劑量相當的安慰劑治療」？對等候名單贏，可能只贏了「自然緩解＋期待效應」。
療效的中介被檢驗了嗎？ 論文有沒有顯示「理論宣稱的機制變項」確實隨治療變動，且先於症狀改善？還是只報告了最終分數？
時序對了嗎？ 中介的變化是否真的在結果改善「之前」？橫斷面的相關無法回答這題。
對誰有效（調節）？ 平均療效底下，是否分析了基線嚴重度、共病、文化背景等調節變項？「平均有效」可能掩蓋「對重症無效」。
效果量多大、能維持多久？ 統計顯著（statistically significant）不等於臨床上有意義；追蹤期多長、復發率如何，往往比「結束當下的分數」更重要。

能熟練地問完這五題，你對任何一份心理治療研究的解讀，就已經站在研究所的起跑線上了。

重點回顧

研究單位的轉移：當代臨床科學已從「比較命名療法」轉向「鎖定可改變的歷程與機制」；拆解式研究揭示「療法有效」不等於「按其理論機制起效」。
三把鑰匙：中介（透過什麼）、調節（對誰有效）、機制（更嚴格的因果條件）是讀懂現代療效論文的核心；Kazdin 指出我們對「改變如何發生」所知仍少。
同盟的因果之謎：治療關係很可能既促成改變、也反映改變；個體內變異分析與控制先前症狀，是逼近因果的方法學進展。
第三波的哲學斷裂：ACT 與 DBT 把標的從「念頭內容」（第一序改變）移到「與念頭的關係」（第二序改變），並催生跨診斷的歷程取向治療（PBT）。
EST ≠ EBPP：實證支持的治療是清單，實證為本的實務是「研究證據 × 臨床判斷 × 個案價值」三足鼎立的決策框架。

深入探討（研究所視角）

渡渡鳥裁決的方法學再審視。 「各療法療效相當」這個結論本身，藏著統計上的陷阱，值得用研究所的眼光重新拆解。其一是統合分析的異質性掩蓋效應：當我們把大量 RCT 平均起來，組間的小差異可能被組內的高變異稀釋，「平均無差異」未必代表「對每個亞群都無差異」——這正是調節分析存在的理由。其二是研究者忠誠度偏誤（researcher allegiance effect）：許多比較研究由其中一個學派的支持者主導，統合分析發現「主導者偏好的療法」傾向勝出，這個偏誤的效果量甚至可與「療法本身」的效果相提並論，提醒我們把研究團隊的立場也視為一個調節變項。其三是統計檢力（statistical power）不足：要偵測兩個「都有效」的療法之間的「小差異」，所需樣本遠大於偵測「有效 vs. 無效」，多數比較研究根本沒有足夠檢力下「無差異」的結論——這是典型的「沒有證據證明有差異」被誤讀為「有證據證明沒差異」。

從變異成分到時間動態：歷程研究的測量挑戰。 把研究焦點從「結束時的分數」移到「治療期間的歷程」，帶來一整套新的測量與模型需求。研究者需要密集縱貫資料（intensive longitudinal data）——每次療程、甚至每日的多次測量——才能捕捉同盟、情緒、症狀如何在時間軸上彼此牽動。對應的工具包括用以拆分個體間／個體內效果的多層次模型，以及處理「A 影響 B、B 又回頭影響 A」這類雙向滯後關係的交叉滯後面板模型（cross-lagged panel models）與動態系統取向。這也是近年網絡取向精神病理學（network approach to psychopathology）的切入點：它不把「憂鬱症」視為一個導致諸多症狀的潛在實體，而是把失眠、反芻、低動機等症狀視為彼此因果激發的網絡節點，治療因此可被重新理解為「打斷症狀之間相互強化的迴路」。

測量、倫理與跨領域的共通底層。 心理治療歷程研究與教育科技的多模態學習分析，在方法學底層驚人地相似：兩者都試圖把「看不見的內在歷程」——前者是改變機制，後者是認知與學習歷程——透過密集、縱貫、多模態的資料化為可檢驗的知識；兩者都依賴信效度俱佳的工具、需要妥善的控制條件來排除自然變化與期待效應，也都觸及對脆弱個體的研究倫理。更關鍵的是知情同意與資料治理的共同難題：當測量變得越密集、越貼近個體的內在狀態，「為理解而蒐集」與「尊重個體自主、可隨時撤回」之間的張力就越需要被審慎制度化。無論是臨床的改變機制，還是學習的認知軌跡，科學的任務始終是同一件事——把難以直接觀察的內在，化為可被嚴謹檢驗、且被謹慎對待的知識。

← 上一篇

從精神分析到認知行為治療：心理治療的百年演進

--

5

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定