如果憂鬱和焦慮總是一起出現,它們真的是兩種病嗎?變態心理學的分類危機與前沿
從共病難題出發,深入類別與維度之爭、RDoC、HiTOP、p 因子與網絡取向,重新追問「精神疾病」究竟是不是一個東西
如果「憂鬱症」和「焦慮症」常常一起出現,它們真的是兩種病嗎?
你在入門篇已經學過:變態心理學(Abnormal Psychology)會依《精神疾病診斷與統計手冊》(DSM-5-TR)把困擾分門別類,也會用「生物—心理—社會」模型解釋成因。但只要你開始細看臨床資料,一個尷尬的事實就會浮現:被診斷為重鬱症(Major Depressive Disorder)的人,有將近一半同時符合某種焦慮症的標準;創傷後壓力症(PTSD)患者常常也有物質使用問題;而「邊緣型人格障礙症」(Borderline Personality Disorder)幾乎是個情緒、衝動、人際、認知症狀的大雜燴。
如果這些「疾病」總是手牽手出現,邊界又彼此重疊,那我們究竟是發現了自然界真實存在的「疾病種類」(natural kinds),還是只是替一團連續變化的人類痛苦,硬畫了一些方便溝通的線?
這正是進階變態心理學最核心、也最有張力的問題。這篇文章不再重述「有哪些類別、成因是什麼」,而是要帶你進入分類學背後的方法論戰場:共病(comorbidity)為什麼是個理論危機、類別模型如何被維度模型挑戰、RDoC 與 HiTOP 想取代什麼、以及「網絡取向」如何徹底改寫我們對「疾病是什麼」的想像。

共病不是巧合,而是分類系統的裂縫
「共病」(comorbidity)這個詞原本來自身體醫學,指一個人同時罹患兩種獨立的疾病,例如糖尿病加上高血壓。把它搬到精神醫學時,我們其實偷渡了一個假設:憂鬱症和焦慮症是兩個各自獨立、各有成因的「實體」,只是剛好發生在同一個人身上。
但流行病學資料讓這個假設站不住腳。美國的全國共病調查(National Comorbidity Survey, Kessler 等人,1994、2005)反覆顯示:精神疾病之間的共病率高得異常,而且不是隨機的。憂鬱症與廣泛性焦慮症(GAD)之間的關聯,遠高於兩者各自盛行率相乘所能預測的水準。更關鍵的是,這種共病在「縱貫追蹤」中往往是「先後出現」而非「同時獨立」——一個青少年先有焦慮,幾年後才發展出憂鬱。
當共病率高到這種程度,有三種解釋彼此競爭:
- 它們其實共享同一個底層因子。 也許「憂鬱」和「焦慮」只是同一個內化性(internalizing)傾向,在不同情境下的表現。
- 一種疾病是另一種的風險因子。 長期焦慮帶來的失控感,本身就會誘發憂鬱。
- 我們的診斷準則人為製造了共病。 DSM 把症狀切成一塊塊,同一個底層問題被切到兩個診斷標籤底下,看起來就像「兩種病」。
注意:這三種解釋導向完全不同的研究與治療策略。如果共病是分類系統自己製造出來的假象,那麼把研究經費全砸在「找出憂鬱症專屬的基因」上,可能從一開始方向就錯了。
類別 vs. 維度:精神病理是「種類」還是「程度」?
入門篇談到 DSM 用「符合幾項症狀就達到診斷門檻」的方式運作。這背後是一個類別模型(categorical model):你要嘛有病、要嘛沒病,門檻把人群切成兩群。這個取向的好處很實際——臨床溝通方便、保險給付有依據、研究樣本好定義。
但類別模型有個難以迴避的弱點:門檻往往是武斷的。 DSM-5 規定重鬱症要符合九項症狀中的五項、且持續至少兩週。可是憑什麼是「五項」而不是「四項」?符合四項症狀、痛苦了十三天的人,和符合五項、痛苦了十四天的人,在大腦、預後、對治療的反應上,真的有一條清楚的鴻溝嗎?
大量「分類計量學」(taxometric analysis,由 Paul Meehl 等人發展)研究顯示,多數常見精神病理(憂鬱、焦慮、人格特質)在統計上找不到自然的斷點。它們的分布是連續的,像身高血壓那樣呈現一條光滑的鐘形曲線,而不是兩個分離的山峰。換句話說,「憂鬱」更像是一個維度(每個人都落在某個程度上),而不是一個你「有」或「沒有」的東西。
維度模型(dimensional model)因此主張:與其問「他有沒有憂鬱症」,不如問「他在內化性這個維度上分數多高」。這帶來幾個直接後果:
- 「亞臨床」(subclinical)的痛苦不再被忽視——很多沒達到門檻、卻明顯受苦的人,在類別模型下會被判為「正常」而拿不到協助。
- 同一個診斷標籤下的「異質性」(heterogeneity)被正視。兩個都被診斷為重鬱症的人,症狀組合可以幾乎不重疊。
- 研究的統計檢力提高——把連續變項硬切成二分變項,等於丟掉大量資訊。
不過維度模型也不是萬靈丹。臨床決策(要不要住院、要不要用藥)終究需要某種「是/否」的判斷,純維度的描述難以直接落地。這就是為什麼當代分類學不是「類別 vs. 維度」的零和對決,而是嘗試把兩者整合。
看一個例子:同一個標籤,兩種完全不同的人
假設小琪和阿哲都被診斷為重鬱症。重鬱症的九項準則包括:情緒低落、興趣喪失、體重/食慾改變、失眠或嗜睡、精神運動激動或遲滯、疲倦、無價值感、注意力下降、自殺意念。
- 小琪符合:情緒低落、興趣喪失、失眠、食慾下降、疲倦。
- 阿哲符合:情緒低落、嗜睡、體重增加、精神運動遲滯、無價值感。
兩人都「符合五項」、都拿到同一個診斷碼,但他們重疊的症狀只有一項(情緒低落)。一個失眠消瘦、一個嗜睡發胖。把他們放進同一個臨床試驗,期待同一種抗憂鬱藥對兩人有相同效果,本身就是統計噪音的來源。
研究者算過:重鬱症的準則組合,理論上可以產生超過兩百種症狀剖面(symptom profile)都符合診斷。當一個標籤底下藏著兩百種人,「找出憂鬱症的生物標記」自然屢屢失敗——因為「憂鬱症」可能根本不是一個東西。這就是維度與剖面取向想解決的核心痛點。
RDoC 與 HiTOP:兩條繞過 DSM 的路
面對上述困境,2010 年代出現了兩個重量級的替代框架。
RDoC(Research Domain Criteria,研究領域準則) 由美國國家心理衛生研究院(NIMH)於 2010 年提出。它的立場很激進:研究時乾脆不要從 DSM 診斷出發。 RDoC 主張我們應該圍繞「功能維度」來組織研究,例如「負向效價系統」(negative valence systems,恐懼、焦慮)、「正向效價系統」(reward 相關)、「認知系統」、「社會歷程系統」等。每個維度都要橫跨多個分析層次來研究:基因、分子、神經迴路、生理、行為、自陳報告。
RDoC 的關鍵主張是:恐懼迴路的失調可能同時造成 PTSD、恐慌症、特定畏懼症的某些症狀。與其分別研究這些「疾病」,不如直接研究「恐懼迴路」這個跨診斷的機制。它本質上是一個研究框架,而非臨床診斷工具——RDoC 不會給你一個診斷碼,它是要重建精神病理的科學地基。
HiTOP(Hierarchical Taxonomy of Psychopathology,精神病理階層分類) 則是一個由眾多研究者協作、自下而上以實證資料建構的分類系統。它把症狀按彼此的共變結構組織成階層:
- 最底層是具體症狀。
- 往上聚合成「症候群/障礙」。
- 再往上是幾個「光譜」(spectra),例如內化性(internalizing,涵蓋憂鬱、焦慮)、外化性(externalizing,涵蓋衝動、物質使用、反社會)、思考障礙(thought disorder,涵蓋精神病性症狀)。
- 最頂端是一個有爭議但反覆被資料支持的「p 因子」(general psychopathology factor)——類似智力研究裡的 g 因子,代表一個人整體精神病理的共同傾向。
HiTOP 直接把「共病」這個問題溶解掉了:在階層結構裡,憂鬱和焦慮共病不是「兩種病湊巧同時出現」,而是「它們本來就同屬內化性光譜,共享上游的內化性因子」,所以一起出現是預期之中,不是異常。
這兩個框架不互斥:RDoC 偏神經生物機制、HiTOP 偏症狀結構,但都在表達同一個不滿——DSM 的類別把自然界連續的東西切碎了,而被切碎的碎片不適合拿來做科學。
網絡取向:也許根本沒有「潛在疾病」這個東西
如果說 RDoC 和 HiTOP 還保留「症狀背後有一個共同原因(潛在變項)」的假設,那麼網絡取向(network approach to psychopathology,Borsboom 與 Cramer 等人約 2013 年起發展)則更為基進,它連這個假設都拆掉了。
傳統的「潛在變項模型」(latent variable model)這樣想:你之所以失眠、又疲倦、又難以專注,是因為背後有一個叫「憂鬱症」的潛在實體,像太陽一樣同時射出這些症狀光線。症狀之間的相關,是因為它們共享同一個原因。
網絡取向反問:如果症狀之間根本是直接因果相連的呢? 失眠 → 隔天疲倦 → 注意力下降 → 工作出錯 → 無價值感 → 情緒低落 → 更難入睡。在這個觀點裡,沒有一個藏在背後的「憂鬱症實體」;「憂鬱症」就是這一串症狀彼此激活、互相強化後形成的自我維持狀態。
這個轉換帶來幾個深刻的洞見:
- 共病有了全新解釋。 焦慮和憂鬱共病,是因為某些「橋接症狀」(bridge symptoms,例如睡眠困擾、易疲倦)同時屬於兩個症狀網絡,像橋一樣讓激活從一個網絡蔓延到另一個。
- 「疾病」可以是一種動態系統狀態。 健康與疾病是同一個網絡的兩個穩定態(attractor)。當網絡連結夠強,一個小擾動(一次失眠)就會把整個系統推進並鎖在「疾病態」,即使原始壓力源消失,症狀仍彼此維持——這替「為什麼憂鬱會慢性化」提供了系統層次的解釋。
- 治療有了新標靶。 與其追求一個不存在的「病根」,不如找出網絡中連結最密、最具影響力的「中心症狀」(central symptom),或切斷關鍵的橋接症狀。
當然,網絡取向也面臨批評:從橫斷面資料估出的網絡能不能推論個體內的因果動態,方法學上仍有爭議;不同樣本估出的網絡未必穩定。但它的價值在於——它逼我們重新追問那個最根本的問題:「精神疾病」到底是一個東西,還是一組互相糾纏的歷程?
動手試試:畫出你自己的症狀網絡
你不需要任何軟體就能體會網絡思維。拿一張紙,回想一段你壓力很大的時期,列出五到七個當時的狀態,例如:睡不好、容易煩躁、拖延、自責、社交退縮、注意力差。
把它們寫成節點(圓圈),然後問自己:哪一個會直接引發哪一個? 用箭頭連起來。睡不好會不會讓你更煩躁?煩躁會不會讓你更想退縮?退縮會不會讓你更自責?
畫完後數一數:哪個節點射出的箭頭最多?那很可能就是你個人網絡裡的「中心症狀」。網絡取向會主張:對你而言,最值得優先處理的不一定是「最痛苦」的那個,而是「牽動最多其他症狀」的那個。這正是它和傳統「先確診、再對病給藥」邏輯最不一樣的地方——它把焦點從「你是什麼病」轉向「你的症狀如何彼此維持」。
文化、權力與診斷的邊界:不要忘記分母
到目前為止我們談的都是統計與機制,但進階變態心理學還必須面對一個更不舒服的問題:誰有權決定什麼算「異常」?
歷史提供了刺眼的提醒。同性戀曾被列為 DSM 的正式診斷,直到 1973 年才在大量社會運動與實證辯論後移除。這不是因為發現了新的生物學證據,而是因為「偏離常態」與「功能受損」被重新界定。這提醒我們:入門篇學過的「異常四 D」(偏差 deviance、痛苦 distress、功能失調 dysfunction、危險 danger)裡,「偏差」這條判準高度依賴文化與時代的常模。
文化也形塑症狀如何被「表達」。研究文化精神醫學的學者(如 Arthur Kleinman)指出,在某些文化中,心理痛苦更常以身體症狀(軀體化,somatization)呈現——病人說的是頭痛、胸悶、無力,而不是「我很憂鬱」。DSM-5 因此納入了「文化概念的苦痛」(cultural concepts of distress)與「文化形成性會談」(Cultural Formulation Interview),承認同一套底層困擾在不同文化會穿上不同的外衣。
這對研究設計有具體含意:當我們用一份在北美編製、以英文表達的量表,去測量另一個文化的「憂鬱」,量表的「測量恆等性」(measurement invariance)不能想當然耳。否則我們測到的可能是「文化如何表達痛苦」的差異,卻誤讀成「某族群天生比較憂鬱」。忽略分母(誰被納入常模、用什麼語言、在什麼脈絡)的流行病學,會把社會不平等寫成生物學事實。 這也呼應了負責任研究的核心:收集敏感的心理與生理資料前,要先想清楚常模與脈絡,而不是把工具直接套上去。
重點回顧
- 共病不是巧合,而是分類危機的訊號。 精神疾病之間異常高且非隨機的共病,暗示我們的診斷類別可能切錯了自然界的關節。
- 類別 vs. 維度之爭沒有純粹的贏家。 分類計量學顯示多數精神病理是連續的(適合維度),但臨床決策仍需要某種門檻(需要類別),當代趨勢是整合而非二選一。
- 同一診斷標籤底下高度異質。 重鬱症的準則可組合出數百種症狀剖面,這是生物標記研究屢屢失敗的關鍵原因之一。
- RDoC 與 HiTOP 各自繞過 DSM。 RDoC 從跨診斷的神經功能維度重建研究地基;HiTOP 用實證資料把症狀組織成內化/外化/思考障礙等光譜,並提出 p 因子。
- 網絡取向質疑「潛在疾病」本身。 它把疾病看成症狀彼此因果激活、自我維持的動態系統,重新詮釋了共病、慢性化與治療標靶;同時文化與權力始終決定著「異常」這條線畫在哪裡。
深入探討(研究所視角)
若你想把這些議題推到研究前沿,以下幾條線索值得深究。
第一,p 因子的本體論地位仍未解。 Caspi 與 Moffitt 等人(2014,以 Dunedin 縱貫世代資料)提出 p 因子後,它在多個獨立樣本中可重複。但「可重複」不等於「真實存在的因果實體」。p 因子可能是:(a) 真正共享的生物易感性;(b) 一般性的痛苦/負向情緒回報傾向;(c) 純粹的統計偽影——當你把高度共病的測量丟進因素分析,數學上必然擠出一個共同因子。要區辨這幾種可能,需要的不是更多橫斷面因素分析,而是有外部效標(基因、神經、預後)的縱貫驗證,以及對「測量產生因子」這個方法學陷阱的警覺。
第二,網絡模型的因果推論問題。 多數心理病理網絡是從「組間橫斷面相關」估出的(所謂 cross-sectional Gaussian graphical model)。但 Borsboom 等人也坦承:組間結構未必等於組內(個體內)動態。要真正談「失眠引發疲倦」這種個體內因果,需要的是密集縱貫資料(ecological momentary assessment,每日多次取樣)配合動態網絡或時間序列模型(如 multilevel VAR)。這也連結到「個人化網絡」(idiographic network)——為每位個案估專屬網絡,理論上漂亮,但每人需要的時間點資料量龐大,且估計穩定性是公開難題。
第三,分類與機制如何對話。 RDoC 與 HiTOP 看似互補,但兩者的整合並不自動。HiTOP 的內化性光譜,對不對應到某個 RDoC 的負向效價神經迴路?這是一個需要實證填補的對應問題。近年的「計算精神醫學」(computational psychiatry)嘗試提供橋樑:用強化學習模型估計個體的「獎賞學習率」或「不確定性下的信念更新」等運算參數(computational phenotype),這些參數可能比 DSM 標籤更貼近 RDoC 想要的「跨診斷機制」,也可能比症狀更穩定地對應 HiTOP 的光譜。
第四,分類學的選擇有真實的倫理後果。 採類別還是維度、信 p 因子還是信特定障礙、把痛苦歸因於個體生物學還是社會脈絡——這些不只是學術偏好,它們決定了誰被判為「有病」、研究經費流向何方、保險給不給付、汙名落在誰身上。一個負責任的研究者,會把「我用的分類框架對誰有利、對誰可能造成傷害」當成方法學的一部分來檢視,而不是把分類系統當成價值中立的工具。變態心理學最進階的功課,或許不是記住更多診斷,而是學會質疑診斷本身是怎麼被製造出來的。