療效都差不多?心理治療的機制、歷程與證據前線
越過「學派比拼」,從中介與調節、同盟的因果之謎、第三波的哲學斷裂,到 EST 與 EBPP 的關鍵分野
如果各學派療效真的「都差不多」,臨床科學還剩下什麼可研究?
你在入門篇學過一個令人不安的結論:渡渡鳥裁決(Dodo bird verdict)——許多比較研究發現,不同學派的整體療效差異,往往小於人們的預期。如果認知行為治療(cognitive-behavioral therapy, CBT)、心理動力治療(psychodynamic therapy)、人本治療最後的「平均成績」都落在差不多的區間,那麼一個尖銳的問題浮現了:臨床心理學還剩下什麼值得研究?我們是不是該放棄「哪種療法比較好」,乾脆只訓練治療師「跟個案處好關係」就行?
這個問題的答案,恰恰是過去三十年臨床科學最有生產力的轉向。研究者沒有停在「療效相當」的表面結論,而是往下追問三件事:改變到底是透過什麼歷程發生的(機制)?同一份「平均療效」底下,是否藏著「對某些人極有效、對另一些人無效」的異質性(調節)?以及,我們宣稱的「治療關係」究竟是改變的原因,還是改變的結果? 這篇進階篇,要帶你離開「學派比拼」的舊戰場,進入當代心理治療科學真正的前線——歷程(process)、機制(mechanism)與證據如何被嚴謹建立。
從「治療套裝」到「改變歷程」:研究單位的根本轉移

傳統的療效研究(efficacy research)把「一整套命名好的療法」當成研究單位:招募一群憂鬱症患者,隨機分派到「CBT 組」與「對照組」,比較結束後的症狀分數。這種隨機對照試驗(randomized controlled trials, RCTs)回答了「這個套裝有沒有效」,卻幾乎沒告訴我們「套裝裡哪個零件在起作用」。
當代研究的核心轉移,是把研究單位從療法(therapy package)換成改變歷程(process of change)。這背後有一個方法學工具叫拆解式研究(dismantling study):把一個完整療法拆成數個成分,分別給不同組別,看少了某個零件後療效是否下降。入門篇提過 Jacobson 等人(1996)的成分分析——單獨的行為活化(behavioral activation)對憂鬱症的效果,未必遜於含認知重構的完整 CBT。這類發現之所以重要,不只是「行為活化很有用」,而是它逼我們承認:一個療法「有效」,不等於它「按照理論宣稱的機制」起效。
這裡要釐清三組常被混淆的概念,它們是讀懂所有現代療效論文的鑰匙:
- 中介變項(mediator):改變「透過什麼」發生。它必須在症狀改善「之前」變動,且能在統計上解釋療效的傳遞路徑。例如:CBT → 降低災難化思考 → 焦慮下降,其中「災難化思考」是候選中介。
- 調節變項(moderator):療法「對誰、在什麼條件下」最有效。它在治療「之前」就已存在(如基線嚴重度、共病、依附風格)。
- 改變機制(mechanism of change):比中介更嚴格——不只統計上相關,還要滿足時序先後與(理想上)實驗操弄的因果條件。
Kazdin 在多篇影響深遠的回顧中尖銳指出:儘管心理治療「有效」已被反覆證實,但對於「改變如何發生」,我們所知少得驚人。要把「中介」升級為「機制」,研究必須同時滿足數個條件:強而一致的關聯、實驗操弄能改變該變項、時序上中介先於結果、劑量—反應關係、以及合理的理論基礎。多數現有研究只做到第一項。這正是臨床科學尚未完成的功課。
治療關係:原因,還是結果?一場因果方向的攻防
入門篇把「治療關係」(therapeutic alliance)列為共同因素(common factors)的代表。但進階的問題是:這份關係到底是療效的「原因」,還是個案「正在好轉」的副產品?
這個質疑不是吹毛求疵。想像一位個案在第三週開始好轉,他自然會更喜歡治療師、更信任療程——於是「同盟分數」上升。如果我們只看「同盟分數高的人結果比較好」,就宣稱「同盟造成療效」,很可能把因果方向搞反了:是早期的症狀改善同時推高了同盟與後續結果,同盟只是搭了便車。
研究者用兩種策略迎戰這個內生性(endogeneity)問題:
第一,控制先前的症狀變化。DeRubeis 與同事的研究指出,必須先把「上一次評估到本次之間的症狀改善」納入統計控制,才能檢驗同盟是否「額外」預測後續改善。當這麼做之後,同盟對結果的「獨立」貢獻往往縮小,但在許多研究中仍然存在。
第二,區分個體間與個體內變異(between-person vs. within-person)。這是近年方法學的關鍵進展:用多層次模型(multilevel modeling)把「某人平均同盟比別人高」(個體間)和「某人在某一週同盟比自己平時高」(個體內)拆開。Falkenström 等人的研究顯示,個體內的同盟波動能預測下一次的症狀變化——某週同盟特別好,往往伴隨之後症狀更明顯下降——這比單純的橫斷相關更接近因果證據。
Flückiger 等人歷年更新的大型統合分析(meta-analysis)一致發現,同盟與療效呈中等且穩定的關聯,且這個關聯跨療法、跨診斷都成立。但「中等且穩定」不等於「已證實為因果引擎」。當代共識是:同盟很可能既是改變的促成條件,也部分反映了改變本身——兩者交織成一個正向迴圈,而非單向箭頭。 能接受「因果是雙向交織」而非「非此即彼」,正是研究所程度的思考成熟度。
第三波:當「改變想法的內容」讓位給「改變與想法的關係」
入門篇提到「第三波」CBT(接納與承諾治療 ACT、辯證行為治療 DBT)融合了正念(mindfulness)。但它們真正的理論斷裂,值得更深入的拆解——這不只是「多加了冥想」,而是對「改變的標的」做了哲學層次的重新定義。
傳統 CBT 的策略是第一序改變(first-order change):直接修正想法的「內容」——「我是個失敗者」這個念頭被當成錯誤假設,要用證據去反駁、用更貼近現實的版本取代。
ACT 走的卻是第二序改變(second-order change):它不太在乎念頭內容真不真,而在乎你與念頭的關係。核心技術叫認知解離(cognitive defusion)——不是把「我是個失敗者」改成「我其實還不錯」,而是學會看見「我『正在有』一個『我是失敗者』的念頭」,讓念頭從「我必須相信並服從的事實」退回成「腦中飄過的一串字」。ACT 的目標模型 Hexaflex 圍繞心理彈性(psychological flexibility):接納(acceptance)、解離、當下接觸、以己為脈絡(self-as-context)、價值(values)、承諾行動(committed action)。它不問「你的念頭對不對」,而問「朝你真正在乎的價值前進,你願不願意帶著這些念頭一起走」。
DBT 則把這套思維放進另一組張力裡:它源於辯證哲學,核心是接納與改變的辯證——治療師一手徹底接納(radical acceptance)個案此刻的痛苦是「在他的歷史下合理的」,另一手堅定要求行為改變。對情緒調節困難、自傷風險高的個案,純粹的「改變導向」會讓他們覺得不被理解,純粹的「接納」又無助於止住危險行為;DBT 的技術正是在這兩極間動態平衡。
這引出一個更宏觀的趨勢——歷程取向治療(process-based therapy, PBT)。Hayes 與 Hofmann 等人主張:與其爭論「哪個學派的命名套裝最好」,不如直接鎖定跨診斷、實證上可改變的核心歷程(如經驗逃避、反芻思考、情緒調節失能),針對個案此刻最關鍵的歷程量身組裝介入。這在某種意義上是對「學派戰爭」的釜底抽薪:研究單位不再是「CBT vs. 精神分析」,而是「對這個人、此刻、這個歷程,哪個機制最該被撬動」。
看一個例子:同一句話,三種治療怎麼處理
回到入門篇那位社交焦慮的學生。他發言時看到兩位同學交談,腦中閃過:「他們一定在嘲笑我。」三種取向的處理,正好暴露它們對「改變」的不同假設:
| 取向 | 核心問句 | 對「他們一定在嘲笑我」的處理 |
|---|---|---|
| 傳統 CBT | 這個念頭符合證據嗎? | 檢驗證據、找替代解釋(也許在借筆)、安排行為實驗驗證預測——改內容 |
| ACT | 你願意帶著這念頭去做你在乎的事嗎? | 練習解離(「我注意到我有『被嘲笑』的念頭」),把焦點轉回「對我而言,參與討論的價值是什麼」——改關係 |
| 心理動力取向 | 這份「被輕視」的感受,讓你想起什麼? | 探索這個情境如何重演了更早年的關係模式,以及它如何在「與治療師的此時此刻」(移情 transference)中再現——改理解與關係經驗 |
值得注意的是:這三種路徑未必互斥。一位受過整合訓練的治療師,可能先用解離幫個案從念頭中鬆脫,再用行為實驗累積反證,最後在某次同盟夠穩固時,碰觸這份焦慮更深的關係根源。「該用哪一條」往往取決於個案此刻卡在哪個歷程,而非治療師效忠哪個學派。
證據的層級:實證支持的治療,不等於「實證為本的實務」
學到這裡,你可能想問:那臨床上到底「該信什麼」?這裡有一個極易混淆、卻攸關專業判斷的區分。
實證支持的治療(empirically supported treatments, ESTs)是一份「清單」:哪些命名療法、針對哪些診斷,在 RCT 中達到了預設的證據門檻。它的優點是把鬆散的臨床傳統釘上科學標準;缺點是容易僵化成「照手冊操作」(manualized),且 RCT 的高度篩選樣本(排除共病、排除自殺風險)未必對得上診間裡複雜的真實個案——這就是效力(efficacy,理想條件下有沒有效)與成效(effectiveness,真實情境下有沒有效)的落差。
美國心理學會(APA)因此採用更寬的框架——實證為本的實務(evidence-based practice in psychology, EBPP),它由三根支柱構成:
- 最佳可得研究證據(best available research evidence)
- 臨床專業判斷(clinical expertise):包含個案概念化、與個案協作、辨識何時偏離手冊
- 個案特徵、文化與偏好(patient characteristics, culture, and preferences)
換句話說,EBPP 不是「把清單上的療法套上去」,而是「在科學證據的約束下,為這個獨特的人做出最佳臨床決策」。這也呼應前面的歷程取向:證據告訴你哪些機制值得撬動,臨床判斷告訴你眼前這個人此刻卡在哪裡,而個案的價值與文化決定了什麼樣的改變對他才有意義。
動手試試:為一份療效宣稱做「機制盡職調查」
下次你讀到(或聽到)「研究證明 X 療法能改善 Y」時,別停在「有效嗎」,用這份清單做進階審視:
- 比較對象是誰? 對照組是「等候名單」、「一般照護」,還是「劑量相當的安慰劑治療」?對等候名單贏,可能只贏了「自然緩解+期待效應」。
- 療效的中介被檢驗了嗎? 論文有沒有顯示「理論宣稱的機制變項」確實隨治療變動,且先於症狀改善?還是只報告了最終分數?
- 時序對了嗎? 中介的變化是否真的在結果改善「之前」?橫斷面的相關無法回答這題。
- 對誰有效(調節)? 平均療效底下,是否分析了基線嚴重度、共病、文化背景等調節變項?「平均有效」可能掩蓋「對重症無效」。
- 效果量多大、能維持多久? 統計顯著(statistically significant)不等於臨床上有意義;追蹤期多長、復發率如何,往往比「結束當下的分數」更重要。
能熟練地問完這五題,你對任何一份心理治療研究的解讀,就已經站在研究所的起跑線上了。
重點回顧
- 研究單位的轉移:當代臨床科學已從「比較命名療法」轉向「鎖定可改變的歷程與機制」;拆解式研究揭示「療法有效」不等於「按其理論機制起效」。
- 三把鑰匙:中介(透過什麼)、調節(對誰有效)、機制(更嚴格的因果條件)是讀懂現代療效論文的核心;Kazdin 指出我們對「改變如何發生」所知仍少。
- 同盟的因果之謎:治療關係很可能既促成改變、也反映改變;個體內變異分析與控制先前症狀,是逼近因果的方法學進展。
- 第三波的哲學斷裂:ACT 與 DBT 把標的從「念頭內容」(第一序改變)移到「與念頭的關係」(第二序改變),並催生跨診斷的歷程取向治療(PBT)。
- EST ≠ EBPP:實證支持的治療是清單,實證為本的實務是「研究證據 × 臨床判斷 × 個案價值」三足鼎立的決策框架。
深入探討(研究所視角)
渡渡鳥裁決的方法學再審視。 「各療法療效相當」這個結論本身,藏著統計上的陷阱,值得用研究所的眼光重新拆解。其一是統合分析的異質性掩蓋效應:當我們把大量 RCT 平均起來,組間的小差異可能被組內的高變異稀釋,「平均無差異」未必代表「對每個亞群都無差異」——這正是調節分析存在的理由。其二是研究者忠誠度偏誤(researcher allegiance effect):許多比較研究由其中一個學派的支持者主導,統合分析發現「主導者偏好的療法」傾向勝出,這個偏誤的效果量甚至可與「療法本身」的效果相提並論,提醒我們把研究團隊的立場也視為一個調節變項。其三是統計檢力(statistical power)不足:要偵測兩個「都有效」的療法之間的「小差異」,所需樣本遠大於偵測「有效 vs. 無效」,多數比較研究根本沒有足夠檢力下「無差異」的結論——這是典型的「沒有證據證明有差異」被誤讀為「有證據證明沒差異」。
從變異成分到時間動態:歷程研究的測量挑戰。 把研究焦點從「結束時的分數」移到「治療期間的歷程」,帶來一整套新的測量與模型需求。研究者需要密集縱貫資料(intensive longitudinal data)——每次療程、甚至每日的多次測量——才能捕捉同盟、情緒、症狀如何在時間軸上彼此牽動。對應的工具包括用以拆分個體間/個體內效果的多層次模型,以及處理「A 影響 B、B 又回頭影響 A」這類雙向滯後關係的交叉滯後面板模型(cross-lagged panel models)與動態系統取向。這也是近年網絡取向精神病理學(network approach to psychopathology)的切入點:它不把「憂鬱症」視為一個導致諸多症狀的潛在實體,而是把失眠、反芻、低動機等症狀視為彼此因果激發的網絡節點,治療因此可被重新理解為「打斷症狀之間相互強化的迴路」。
測量、倫理與跨領域的共通底層。 心理治療歷程研究與教育科技的多模態學習分析,在方法學底層驚人地相似:兩者都試圖把「看不見的內在歷程」——前者是改變機制,後者是認知與學習歷程——透過密集、縱貫、多模態的資料化為可檢驗的知識;兩者都依賴信效度俱佳的工具、需要妥善的控制條件來排除自然變化與期待效應,也都觸及對脆弱個體的研究倫理。更關鍵的是知情同意與資料治理的共同難題:當測量變得越密集、越貼近個體的內在狀態,「為理解而蒐集」與「尊重個體自主、可隨時撤回」之間的張力就越需要被審慎制度化。無論是臨床的改變機制,還是學習的認知軌跡,科學的任務始終是同一件事——把難以直接觀察的內在,化為可被嚴謹檢驗、且被謹慎對待的知識。