第八章 無序定律

關燈
一段英文,無論是莎士比亞的一首十四行詩,還是華萊士(EdgarWallace)的一部偵探小說,如果數一數不同字母出現的次數,你會發現字母&ldquoe&rdquo出現得最為頻繁,然後依次是: a,o,i,d,h,n,r,s,t,u,y,c,f,g,l,m,w,b,k,p,q,x,z。

     勒格讓先生數了數基德船長密碼中出現的不同符号,發現出現次數最多的是數字8。

    &ldquo啊哈,&rdquo他說,&ldquo這就是說,8最有可能代表字母e。

    &rdquo 他說的不錯。

    但這隻是很有可能,而不是完全确定。

    事實上,如果這段密碼寫的是&ldquoYouwillfindalotofgoldandcoinsinanironboxinwoodstwothousandyardssouthfromanoldhutonBirdisland&rsquosnorthtip&rdquo(在鳥島北端舊棚屋南面兩千碼的樹林中有一個鐵盒子,裡面有許多黃金和硬币),那麼這其中就連一個&ldquoe&rdquo都沒有!不過概率定律幫了勒格讓先生的忙,他真的猜對了。

     第一步走對之後,勒格讓先生自信滿滿,又以同樣方式按照出現的概率次序将各個字母加以排列。

    下表按照使用的相對頻率對基德船長訊息中的各個符号作了排列: 表中第二欄是按照各個字母在英語中出現的相對頻率排列的,因此有理由假設第一欄中的符号就代表同一行第二欄中的字母。

    但根據這種排列,基德船長訊息的開頭就成了ngiiugynddrhaoefr&hellip 這根本沒有意義! 怎麼回事呢?是不是這個詭計多端的老海盜使用了一些特殊的詞,其中包含的字母所遵循的頻率規則不同于英語常用詞中字母出現的頻率規則呢?根本不是。

    原因僅僅在于,這段訊息太短了,統計抽樣檢驗尚不能很好地起作用,最大可能的字母分布尚未出現。

    倘若基德船長用這樣一種複雜的方法把财寶藏起來,以至于密碼指令占了好幾頁紙甚至一整本書,那麼勒格讓先生用概率規則解出這個謎的把握就會大得多。

     如果擲100次硬币,你會比較确信正面朝上的次數有50次左右;但若僅擲4次,正面朝上的次數則可能有3次或1次。

    一般來說,試驗的次數越多,概率定律就越精确。

     由于這段密碼中的字母數量不足,無法運用統計分析方法,勒格讓先生隻好根據不同英語單詞的細微結構進行分析。

    首先,他依然假設出現頻率最多的符号&ldquo8&rdquo代表e,因為他注意到,這段較短的訊息中多次出現&ldquo88&rdquo這個組合(5次)。

    大家知道,字母e在英語詞中常常雙寫,比如在meet,fleet,speed,seen,been,agree等單詞中。

    此外,如果&ldquo8&rdquo真的代表e,那麼它應該會作為&ldquothe&rdquo這個詞的一部分而經常出現。

    檢查這段密碼的文本就會發現,“48&rdquo這個組合在其中出現了7次,倘若真是如此,我們就必須斷言,“&rdquo代表t,&ldquo4&rdquo代表h。

     讀者們可以去閱讀愛倫·坡的這篇小說,尋找破譯基德船長這段訊息的進一步細節。

    它的全文如下:&ldquoAgoodglassinthebishop&rsquoshostelinthedevil&rsquosseat.Forty-onedegreesandthirteenminutesnortheastbynorth.Mainbranchseventhlimbeastside.Shootfromtheeyeofthedeath&rsquoshead,Abeelinefromthetreethroughtheshotfiftyfeetout&rdquo(主教旅店的魔鬼座中有個好玻璃杯。

    北偏東41度13分。

    主幹東側的第七根樹枝。

    從骷髅的眼睛處開一槍。

    沿開槍方向從那棵樹直走50英尺)。

     勒格讓先生最後破譯的不同字母的正确含義列在表中最後一欄。

    可以看到,它們與根據概率定律所推測的字母不甚相符。

    這當然是因為這段文本太短,概率定律沒有什麼機會發揮作用。

    但即使在這個小小的&ldquo統計樣本&rdquo中,我們也能注意到各個字母有按照概率論要求的次序進行排列的趨勢,如果這段文本中的字母數量大得多,這種趨勢就會變成一條幾乎牢不可破的規則。

     用大量試驗來實際檢驗概率論的預測的例子似乎隻有一個,那就是美國國旗與火柴這個著名問題。

     要想處理這個概率問題,你需要一面美國國旗,即它的一個部分由紅白條所組成。

    如果沒有旗子,可以拿一大張紙,在上面畫幾道等距的平行線。

    還需要一盒火柴&mdash&mdash任何火柴都可以,隻要短于紅白條的寬度就可以。

    此外還需要希臘字母&pi,它對應于我們的英文字母&ldquop&rdquo,也被用來表示圓的周長與直徑之比。

    你也許知道,它在數值上等于3.1415926535&hellip(我們還知道更多位數字,但無需繼續寫下去)。

     現在把旗子鋪在桌子上,擲一根火柴到旗子上(圖88)。

    它可能完全落在一條帶子之内,也可能壓在兩條帶子的邊界上。

    這兩種情況各有多大可能性呢? 圖88 根據我們确定其他概率的程序,必須先數出對應于某種可能性的情況有多少。

     但火柴難道不是有無窮多種方式可以落在旗子上嗎?怎麼能數出所有可能性呢? 讓我們更仔細地考察一下這個問題。

    如圖89所示,火柴落在條帶上的位置可由火柴中心與最近的邊界之間的距離以及火柴與條帶方向所成的角度來刻畫。

    圖中給出了火柴落下的三個典型例子。

    為簡單起見,假定火柴長度等于條帶寬度,比如都是2英寸。

    如果火柴中心離邊界很近,成的角又很大(如情況a),那麼火柴将與邊界相交。

    如果情況相反,角度很小(如情況b)或距離很大(如情況c),則火柴将全都落在一條帶子的邊界内。

    說得更精确些,如果半根火柴在豎直方向的投影大于條帶的一半寬度,則火柴将與邊界相交(如a),反之則不相交(如b)。

    這一陳述可以用圖89下半部分的圖形表示出來。

    橫軸給出的是火柴落下後所成的角度(以弧度為單位),縱軸則是半根火柴在豎直方向的投影長度;在三角學中,這個長度被稱為給定角度的正弦。

    顯然,當角度為零時,正弦值也為零,因為這時火柴呈水平方向。

    當角度為&pi/2即直角時,64正弦值等于1,因為此時火柴呈豎直方向,與其投影重合。

    對于介于其間的角度,正弦值由我們所熟悉的正弦曲線給出。

    (圖89隻畫出了完整曲線的四分之一,即從0到&pi/2。

    ) 圖89 構造這張示意圖之後,估算火柴與邊界相交或不相交的概率就很方便了。

    事實上,正如我們所看到的(再看圖89上半部分的三個例子),如果火柴中心與邊界的距離小于相應的投影,即小于這個角度的正弦值,火柴就會與條帶的邊界相交。

    這意味着,圖中表示這個距離和角度的點位于正弦曲線以下。

    相反,當火柴完全落在條帶邊界以内時,将會給出正弦曲線以上的點。

     于是,按照我們計算概率的規則,相交概率與不相交概率之比将等于曲線下的面積與曲線上的面積之比;或者說,要想計算兩個事件的概率,可以用與之相應的兩塊面積分别除以整個矩形的面積。

    可以用數學方法證明(參見第二章),圖中正弦曲線下的面積恰好等于1。

    由于整個矩形的面積是×1=,所以我們發現,火柴(其長度等于條帶的寬度)與邊界相交的概率為。

     在這個最意想不到的場合,&pi出現了,18世紀的科學家布豐(GeorgeLouisLeclercBuffon)最先注意到了這個有趣的事實,因此這個火柴和條帶的問題也被稱為布豐問題。

     勤勉的意大利數學家拉澤裡尼(Lazzerini)實際做了一個實驗。

    他擲了3408根火柴,發現共有2169根與邊界相交。

    用這個實驗的精确記錄去檢驗布豐公式,發現&pi的值可以用來代替,即3.1415929。

    直到小數點後第七位,它才與精确值有所不同! 這當然是對概率定律之有效性的一個極為有趣的證明,但與投擲數千次硬币,用總投擲數除以正面朝上的數目來确定&ldquo2&rdquo相比,卻也并非更有趣。

    在後一種情況下,你得到2.000000&hellip的誤差一定會和拉澤裡尼确定&pi值的誤差一樣小。

     四、&ldquo神秘&rdquo的熵 從以上這些來自日常生活的概率計算的例子可以知道,如果涉及的數目很小,這種預測往往會令人失望;而當數目增多時,預測會變得越來越準。

    這就使概率定律特别适用于描述構成哪怕最小物質片段的幾乎數不清的分子或原子。

    因此,對于六七個醉鬼每人走二十多步的情況,醉鬼走路的統計定律隻能給出近似的結果;但如果運用于每秒鐘經曆數十億次碰撞的數十億個染料分子,統計定律卻能導出最為嚴格的物理擴散定律。

    我們還可以說:在擴散過程中,試管中原先溶解于一半水中的染料會趨向于均勻分布在整個液體中,因為這種均勻分布比原先的分布有更大的可能性。

     同樣道理,在你坐着讀這本書的整個房間裡均勻充滿着空氣。

    你從未想到房間裡的這些空氣會不經意地自行聚攏在某個角落,使你在椅子上感到窒息。

    不過,這件恐怖的事情在物理上并非完全不可能,而隻是可能性極小罷了。

     為了澄清這一點,我們設想房間被一個假想的豎直平面分成兩等分,此時這兩部分中的空氣分子最有可能是什麼分布呢?當然,這個問題等同于前面讨論的投擲硬币的問題。

    任選一個分子,它處于房間左半邊或右半邊的機會是相等的,就像擲出的硬币正面朝上或反面朝上的機會相等一樣。

     如果不考慮其他分子的位置,那麼第二個、第三個以及