5、張曉鳴：在數字中發現曆史：曆史社會學與定量方法

關燈小中大

史書的描述，我們将才能分為六個方面，包括軍事才能、民政治理才能、制度建設才能、文學才能、天資禀賦以及廉潔與否。

    例如，《魏書》中，對崔浩（清河崔氏）的描述是，“少好文學，博覽經史……朝廷禮儀、優文策诏、軍國書記，盡關于浩”。

    從這段描述中可知，崔浩在文學與制度建設方面具有較強的才能。

    <注："讀者也許會擔心，曆史書寫可能會故意擡高世族的聲望，更有可能留下溢美之詞，因此我們捕捉到的并非世族真正的才能，而是虛假的吹捧。

    我們确實無法排除這種可能性，但是這種曆史書寫的“偏差”，并不會影響我們的論證，因為隻要曆史書寫者系統性地誇大了所有世族精英的能力，而非隻誇大塢堡地區的世族，那麼我們的比較就有意義（沒有史學證據說明這種情況存在）。

    因為我們比較的是，同樣身為世族，來自塢堡地區與來自無塢堡地區的世族在才能上是否有區别，這是影響到我們因果論證的核心替代性假說。

    ">在對所有精英的才能特征進行編碼賦值後，我們可以比較改革前塢堡地區與無塢堡地區精英在上述六個方面是否有區别。

    如果有顯著區别，那麼從政差異很可能來自他們的能力區别。

    <注："我們首先比較了世族與非世族之間在才能上是否有區别。

    我們發現，的确，世族在文學與制度建設才能上要明顯優于非世族，而在軍事才能上，要弱于非世族，在其他方面則兩者沒有區别，這與傳統曆史叙事非常契合，說明我們的定量賦值沒有系統性的偏誤。

    ">而我們的研究發現，在改革前，塢堡地區與無塢堡地區世族精英在才能方面沒有顯著區别；更重要的是，在改革後，塢堡地區的世族甚至在民政治理才能、制度建設才能、文學才能與天資禀賦等方面，要弱于無塢堡地區的世族。

    這說明北魏政權吸納這些世族的動機，不是因為其才能卓越，而是出于補償其在改革中所受損的經濟利益。

    <注："我們也排除了其他替代性假說，例如不同地區的地理特征，世族人口增長過快導緻更多人進入中央任職；世族被征召進入政權作為人質；世族人口遷徙與假冒問題；班俸制改革等等，詳見論文。

    "> 定量方法之所以能夠更好地處理某些競争性假說（尤其是能夠進行量化描述的假說），在于其将複雜的社會互動簡化為某類明确的統計檢驗。

    通過檢驗相關性，某些競争性假說就可以被排除。

    即使無法排除，我們也能通過控制變量的方式，剝離競争性假說的影響，從而識别解釋變量與被解釋變量的因果關系。

    而定性的比較方法雖然也可以讨論競争性假說與幹擾因素的影響，但當同時存在若幹個影響因素時，定性的讨論則往往力有不逮，難免顧此失彼。

    再以威默爾的研究為例。

    民族國家起源是曆史社會學的經典議題，大師輩出，學說林立。

    如經濟現代化理論認為，農業社會向工業社會轉型是民族主義起源的關鍵原因(Gellner1983)<注："經濟現代化理論認為工業化需要工人接受通識教育，能夠在不同職業間轉換，并且參與匿名的市場，而教育的普及推動了一種同質化的文化氛圍，為民族主義的起源提供了條件。

    ">，而政治現代化理論認為戰争驅動的國家統治方式轉型是民族國家形成的核心動力(Tilly1994；Mann1995；Hechter2000)；文化現代化理論(culturalmodernization)則提出，印刷技術提高了大衆識字率與閱讀水平，使得一種共同的群體想象成為可能，這是民族主義能夠興起的先決條件(Anderson1991)；世界政體理論(worldpolitytheory)認為民族國家出現後，迅速成為世界文化體系中一種主流模式，民族主義構成一種重要的政治合法性來源，迫使其他社會精英不得不采取同樣的政體形式(Meyeretal.1997)。

    作者威默爾的理論可以總結為一種權力構型理論(powerconfigurationtheory)，即國家形式的轉變是不同社會政治團體競争的結果，受到不同政治團體之間權力均勢的影響，因此民族國家的建立取決于民族主義團體能否充分動員大衆，取得權力優勢，同時也取決于執政團體的壓制能力，以及相鄰地區民族國家建立所帶來的同構壓力。

     面對諸多競争性假說，如何檢驗作者觀點的解釋力？作者首先利用所收集的數據對各種競争性理論的經驗推論進行變量賦值，然後采取多元邏輯回歸模型(MultinomialLogitRegression)，對這些競争性假說進行統計檢驗。

    具體來說，作者以每一千平方公裡的鐵路長度作為經濟現代化理論的代理變量；用政府對某個地區的财政支出作為直接統治（政治現代化）的度量指标，用識字率作為文化現代化的度量指标；用某地區是否是一國内自治區或獨立政區來度量區域認同；同時作者利用某帝國内、世界範圍内或者鄰近地區民族國家的數量以及比例作為區域同構壓力的度量指标；利用區域以及帝國内的戰争頻率來捕捉戰争對當政者的沖擊；此外，作者用距第一個民族國家成立後的年數作為各地區受到民族主義者挑戰強度的度量指标；最後，作者以戰争相關因素數據庫(CorrelatesofWar,COW)中國家能力指标來捕捉該國壓制民族主義運動的能力。

    <注："該指标反映一國在世界經濟與軍事權力格局中的占比。

    關于變量定義與數據來源請見WimmerandFeinstein(2010)。

    ">作者依次将這些指标放入回歸模型，最後發現，與經濟現代化、政治現代化、文化現代化以及世界政體理論相關的變量都不具有統計顯著性，或者與理論預測的方向相反，而作者所提出的權力結構假說得到了經驗的支持。

    作者發現，某帝國内民族國家建立的數量以及臨近地區民族國家建立的數量越多，該地區成為民族國家的概率就越大，并且某國距離第一個民族國家建立的時間越久，意味着其進行民族主義動員越充分，該國成為民族國家的概率也越大。

    因此通過将不同理論的經驗推論放到同一個回歸模型進行檢驗，我們可以排除競争性假說。

     四　定量方法的局限與應對策略盡管定量方法在發現典型事實、識别因果關系方面有其獨特優勢，學者在運用定量方法的時候，也面臨一些挑戰，包括度量誤差、樣本選擇以及因果檢驗的前提假設等等問題。

    定量學者對此有清醒的認識，同時也試圖通過新的方法與估計策略來回應這些挑戰。

    需要注意的是，上述問題是大多數經驗研究都會遇到的挑戰，無論是定量還是定性方法都應嚴肅對待。

    定量方法将事實濃縮為數據，以數據為核心(data-centered)進行經驗研究，更容易忽視上述局限，需要格外警惕。

    <注："更多對定量方法的批評請見BradyandCollier(2004)；MahoneyandRueschemeyer(2013)；MahoneyandThelen(2015)。

    "> 1.度量問題定量研究将複雜的社會互動化約為變量之間的統計關系，極大地降低了學者解釋複雜社會現象的難度。

    然而這種“降維”方式毫無疑問會帶來“失真”問題，即統計變量不一定能夠完美捕捉我們想要研究的理論概念(Kingetal.1994，151)。

    如，國家能力這一概念原指國家執行其政策目标、實現其意志的能力(Mann1984；Skocpol1985，9)，這意味着國家能力是一個結果導向的概念，國家政策目标能否實現是衡量國家能力強弱的重要尺度。

    然而結果導向的概念往往不好度量；不同國家在不同發展階段的政策目标相異，該概念也缺乏跨時空可比性。

    目前，學者（尤其是定量學者）在研究國家能力時，往往使用國家所掌握資源（如财政資源）的多寡，或是否有一套完善且高效的官僚體制來衡量國家能力(e.g.，DinceccoandKatz2016)。

    這背後隐含的假設是，國家所掌握的資源越多，組織能力越強，實現其政策目标的能力也就越強。

    然而，資源投入與目标實現之間不一定存在必然聯系。

    對複雜概念的簡單量化也許會忽視一些重要的理論面向。

    例如，以資源投入為基礎來度量國家能力，也許會忽視國家與社會的互動關系。

    當國家與社會處于良性互動，或者國家統治合法性較高、政府的政策受到民衆的廣泛支持時，即便政府資源不足，國家的政策目标也容易實現；反之，如果國家—社會關系惡化，即使政府資源充足，政策執行也将面臨巨大挑戰(WeissandHobson1995)。

     又如，在上文提到威默爾等人的研究中，作者試圖檢驗諸多競争性假說，因而對不同假說都尋找了代理變量以進行統計檢驗。

    然而作者所找到的代理變量能否度量其他學者所提出的理論概念，本身是值得讨論的。

    如單位平方公裡的鐵路總長是否能夠反映一國的經濟現代化程度，以及更根本的，鐵路總長與民族國家的關系是否能用來檢驗經濟現代化理論的核心命題，即經濟現代化促進了民族國家形成，都有非常多的讨論空間。

    數據質量不佳或數據無法度量理論變量等問題，都會造成度量誤差。

    <注："之所以選擇“鐵路總長”這一指标，一方面是由于經濟現代化理論認為高流動性的勞動力市場促進了一種跨地域的共同體意識的形成，而鐵路系統是該市場發育的重要前提；另一方面則是相對于勞動力流動，鐵路的數據更易得，且度量誤差更小，詳見WimmerandFeinstein(2010，773)。

    ">一般來說，度量誤差越大，得出的定量結論就越不可信。

    尤其是，當度量誤差由某種社會結構内生決定時，我們的因果推斷将面臨嚴重挑戰。

     面對變量度量方面的挑戰，常見的應對策略包括尋找更好的研究設計，識别度量誤差的來源以做出調整，等等。

    同時，我們也可以構造若幹個替代性度量來檢驗研究結果的穩健性。

    例如，在中國中古史研究中，世族是一個存在争議的概念。

    如何定義世族，史無明文，學者對此也有諸多辯論。

    毛漢光對中古中國統治階層的社會成分進行分析時，就将與世族相關的一個概念——士族——定義為三世中有二世居官五品以上家族，或柳芳所認定的“郡姓”、“虜姓”與“吳姓”，以及正史中所提及的大族（毛漢光1988，34）。

    <注："不同于世家大族，士族指進入政權之後世代任官的群體。

    關于中古世族的讨論請見：Johnson(1970)；Tackett(2014，27)；甘懷真(2012)。

    ">我們的研究将世族描述為：某個精英的所屬家族有成員在前朝正史（即《後漢書》《三國志》與《晉書》）中有單獨的傳記。

    我們認為，如果某個家族的成員能夠進入正史列傳，那麼該家族至少在當時是被認為擁有廣泛政治與社會影響力的。

    然而，家族事迹是否進入正史，以及是否擁有單獨傳記，也會受制于正史編纂者的主觀判斷與當時一系列政治考慮，因此我們使用了另外一個更加嚴格的定義來描述世族，那就是：如果某個精英所屬家族在北魏前的朝代中，有家族成員擔任過宰相、上師與三公等高級職位，則該精英被定義為世族。

    由于是否擔任過高級職位這一信息相對客觀，并且在當時的背景下，能夠擔任該職位的政治人物一般為大族顯貴，因此該度量方式更嚴格。

     我們也同時考慮了另外兩種可能的度量誤差問題。

    比如，中古貴族的權力需要在地緣環境之中得到體現，其姓氏與家族起源地，即“郡望”中的“望”與“郡”，是相互結合的，它們共同組成了某家族稱著于世的重要标簽。

    但是由于戰亂，不少世家大族不得不舉家遷徙，而導緻居住地與原籍分離，因此該家族真正的權力來源将無法捕捉。

    我們的一個處理策略是将居住地與原籍分離的精英樣本剔除，以避免将離開原籍地，因此社會權力受到極大沖擊的精英也錯誤地認定為世族。

    另外，由于郡望在标識精英歸屬與社會地位等方面的重要作用，不少精英可能通過假稱其家族來自某郡，以獲得社會認同與政治地位。

    這樣的假冒行為造成了另外一種度量誤差問題。

    為應對這一挑戰，我們把史書中出現“自稱”或者“自雲”郡望為某處的精英剔除出樣本，因為該精英很可能是（或者被懷疑是）謊報了其真實的家族歸屬情況。

    我們使用這種武斷的剔除方式，可能會低估真實的世族人數，從而使得結論成立的概率下降了。

    如果在這種情況下，我們的結論在統計上仍然成立，那麼可以說明我們的結論是相當穩健的。

    總之，當我們做出了不利于我們結論的假設，并且使用多個度量方式，仍能得出一緻結論，這無疑會大大增加我們結論的可信性。

    <注："但是這種方法使得研究結論的精度會下降，比如解釋變量對于被解釋變量作用大小的具體數值就會受到影響。

    度量誤差一般包括系統性與非系統性誤差，不同的誤差形式對因果推斷的影響不同，更多讨論請見Kingetal.(1994，151)。

    "> 2.樣本選擇問題無論是定性還是定量方法都面臨樣本選擇問題。

    盡管定量方法基于大樣本統計，一定程度避免了極端案例或者特殊案例對于研究結論的影響，但是不恰當的樣本選擇仍将影響研究的可信性。

    因此，樣本選擇——尤其是如何處理幸存者偏差問題——是曆史社會學研究中的一大挑戰，這是由其經驗材料的曆史屬性決定的。

    我們無法影響到材料的生成過程，甚至無法獲知哪些因素影響到了材料的生成。

    對于這類問題，我們首先要對材料的可靠性保持警惕與懷疑，尤其需要注意該材料的生成過程與我們所關心的問題之間是否有内在關聯；其次，在研究對象的選擇上，要盡量避免基于幸存案例的比較，以及擴大樣本選擇範圍，從而增加差異性；另外，好的研究設計也能夠一定程度上避免樣本選擇偏誤對因果估計的挑戰。

     樣本選擇的典型偏差是依據被解釋變量選擇樣本。

    比如研究革命時，如果我們選擇所有出現革命的國家作為分析樣本，會導緻所觀察到的經驗現象沒有差異性（所有樣本都發生了革命）。

    因此在進行因果推斷時，會出現相當大的挑戰。

    正如上文所述，因果效應的估計依賴于對反事實案例的構造與比較，因為我們希望能夠觀察到所關心的經驗現象在發生與不發生之間産生的差異。

    依據被解釋變量選擇樣本，無疑會限制這樣的比較。

    不過，曆史社會學的方法論導向，尤其是對“求同法”與“求異法”的運用，使得學者對差異性事件非常敏感，因而這類選擇偏差不容易出現(Moore1966；Skocpol1984，410)。

     樣本選擇偏差的第二種類型是幸存者偏差問題(survivorshipbias)。

    如果某些經驗觀察對象的記錄丢失，或隻有某類事件被刻意記錄與保留下來，那麼基于幸存材料所做的推論就可能存在偏差。

    這種情況在曆史研究中尤為普遍，因為曆史材料的生成往往帶着曆史書寫者的主觀意識，也會受制于當時的社會經濟環境，因此我們能夠觀察到什麼材料是被内生決定的，而非随機事件。

    因此，研究者需要對曆史材料的生成過程做詳細的分析，了解不同曆史材料的屬性與背景。

    我們尤其需要警惕當曆史材料與案例的生成與我們所關心的核心變量直接相關的情況。

    例如，蒂利曾敏銳地指出，學者往往通過一種“回溯式”的研究方法(retrospective)來總結歐洲民族國家的形成規律。

    他們在19世紀末或者20世紀的曆史節點上進行觀察，基于英國、法國以及西班牙等一小部分幸存下來的國家來回溯曆史，從而總結民族國家形成的規律。

    這樣的樣本選擇方式會導緻我們過分強調了一小部分案例的作用，從而認為民族國家形成隻有一種方式。

    但實際上，在1500年的時候，歐洲有超過500個政治實體，其國家演進的道路各不相同。

    因此，蒂利主張“前瞻式”(prospective)的研究方法，即站在事件發生的起點來探索不同的國家發展道路，以及為什麼隻有民族國家最後生存下來了(Tilly1975，15；1992)。

     3.定量研究中的前提假設定量研究中大量運用統計回歸方法檢驗因果效應。

    然而因果推斷依賴于一些關鍵假設，如果在應用之前沒有很好地進行讨