封殺這個公式,ChatGPT智商將為零

2022年,ChatGPT問世。

一經出現便掀起滔天巨浪。

如果你跟ChatGPT聊過天,一定會震撼於它所涉獵極廣

既能創造詩歌,也能修改代碼。
可以批改作業,還能撰寫論文。
寫文案易如反掌,給方案不在話下。

......


有人興奮,有人恐慌。

有人說,它會帶來一次新的“工業革命”。

有人說,它會引發21世紀的“新盧德運動”。


這其實不是AI第一次向人類展示它的力量。

自動駕駛、MIT主導的人類寫字系統、SIRI智能語音助手、AlphaGo......
但這一次,ChatGPT確實驚嚇到了人類。


我們能抵擋來勢洶洶的AIGC狂潮嗎?

人類是不是真的會被ChatGPT取代?


要回答這些問題,讓我們先回歸數學。

因為ChatGPT背後的核心本質,是“貝葉斯公式”。



1. 什麼是貝葉斯公式?

歷史有許多天才,生前籍籍無名,死後眾人崇拜

18世紀數學家托馬斯·貝葉斯也是其中一位。

“貝葉斯”定理源於解決“逆向概率”問題時寫的論文。

在此之前,人們只會計算“正向概率”。

什麼是“正向概率”呢:

假設袋子裡面有P隻紅球,Q隻白球,它們除了顏色之外,其它性狀完全一樣。你伸手進去摸一把,摸到紅球的概率是多少是可以推算出來的。

但反過來是否也可以計算,我們可以將它視為“逆向概率”:

如果我們事先並不知道袋子裡面紅球和白球的比例,而是閉著眼睛摸出一些球,然後根據手中紅球和白球的比例,對袋子里紅球和白球的比例作出推測。

這個問題就是逆向概率問題

通俗地講,就像一個迷信星座的HR,如果碰到一個處女座應聘者,HR會推斷那個人多半是一個追求完美的人。

這就是說,當你不能準確知悉某個事物本質時,你可以依靠經驗去判斷其本質屬性

這個研究看起來平淡無奇,名不見經傳的貝葉斯也未引人注意。

他寫的論文直到他死後的第二年,才由他的一位朋友在1763年發表。

明珠蒙塵,就像畫界的梵高,畫稿生前無人問津,死後價值連城。

為什麼貝葉斯定理200多年來一直被雪藏,不受科學家待見?

因為它與當時的經典統計學相悖,甚至是“不科學”的。

經典統計學中,數字規律來源於隨機取樣再行計算。

貝葉斯方法則建立在主觀判斷基礎上,你可以先估計一個值,然後根據客觀事實不斷修正。

從主觀猜測出發,這顯然不符合科學精神,所以貝葉斯定理為人詬病。

1774年,法國的大數學家拉普拉斯也看到貝葉斯定理的價值。

不過他知道人類的普遍毛病,總是用傳統來反對新思想。
他懶得與人爭論,直接給出數學表達


2. 貝葉斯公式是怎麼工作的?

貝葉斯定理簡單優雅深刻雋永

貝葉斯定理並不好懂,每一個因子背後都藏著深意。

它到底是如何“為人民服務”的呢?


對於貝葉斯定理,參照上面的公式,首先要了解各個概率所對應的事件。

P(A|B)是在B發生的情況下A發生的概率;
P(A)是A發生的概率;
P(B|A)是在A發生的情況下B發生的概率;
P(B)是B發生的概率。


舉個例子。

量子妹約定帥哥去爬梧桐山,希望玩到人約黃昏後佔點便宜,然而天公不作美,一大早天空多雲。


這可怎麼辦?60%的雨天的早上是多雲的。帥哥說,不玩了吧。

量子妹當然不甘心,勸說帥哥:

❶多云不見得會下雨,大約30%日子早上是多雲的!
❷深圳天氣平均一個月才3天下雨,10%的概率而已。


帥哥並不是繡花枕頭,非常科學地用“貝葉斯公式”計算:

用“雨”來代表今天下雨,“雲”來代表早上多雲。

當早上多雲時,當天會下雨的可能性是P(雨|雲)



P(雨|雲) = P(雨)·P(雲|雨) /P(雲)
P(雨) 是今天下雨的概率= 10%
P(雲|雨) 是在下雨天早上有云的概率= 60%
P(雲) 早上多雲的概率= 30%
那麼,貝葉斯定理的答案就出來了
P(雨|雲) =0.1×0.6/0.3=0.20


帥哥毫無表情地說:今天下雨的概率是20%,確實可以去爬山。


3. 貝葉斯公式取得人類信任

今天的貝葉斯理論開始遍布一切。從物理學癌症研究,從生態學心理學

貝葉斯定理幾乎像“熱力學第二定律”一樣放之宇宙皆準了。

物理學家提出了量子機器的貝葉斯解釋,以及貝葉斯捍衛了弦和多重宇宙理論。

哲學家主張作為一個整體的科學可以被視為一個貝葉斯過程。

在IT界,AI大腦的思考和決策過程,被更多工程師設計成一個貝葉斯程序

但貝葉斯誕生以來命途多舛,長期以來因為表面的不科學,並沒有得到主流學界認可。

其實在日常生活中,我們也常使用貝葉斯公式進行決策。比如我們到河邊釣魚,根本就看不清楚河裡哪裡有魚或者沒魚,似乎只能隨機選擇,但實際上我們會根據貝葉斯方法,利用以往積累經驗找一個回水灣區開始垂釣。


這就是我們根據先驗知識進行主觀判斷,在釣過以後對這個地方有了更多了解,然後再進行選擇。所以,在我們認識事物不全面的情況下,貝葉斯方法是一種非常理性且科學的方法。

貝葉斯公式得到主流科學界的認可,主要因為兩件事:


❶《聯邦黨人文集》作者揭密

1788年,《聯邦黨人文集》匿名出版,兩位作者寫作風格幾乎一致。其中12篇文章作者存在爭議,而要找出每一篇文章的作者極其困難。

兩位統計學教授採用以貝葉斯公式為核心的分類算法,10多年的時間,他們推斷出12篇文章的作者,而他們的研究方法也在統計學界引發轟動。


❷美國天蠍號核潛艇搜救

1968年5月,美國海軍天蠍號核潛艇在大西洋亞速海海域失踪。軍方通過各種技術手段調查無果,最後不得不求助於數學家John Craven,John Craven提出的方案使用了貝葉斯公式,搜索某個區域後根據搜索結果修正概率圖,再逐個排除小概率的搜索區域,幾個月後,潛艇果然在爆炸點西南方的海底被找到了。


2014年初馬航MH370航班失聯後,科學家想到第一個方法就是利用貝葉斯定理開始區域搜索,這個時候,貝葉斯公式已經名滿天下了。


4. 貝葉斯公式展示“神蹟”

當然,貝葉斯定理名揚天下,主要還是在人工智能領域的應用。
特別是自然語音的技術識別,讓人類見識了AI的“思考力”。

人類語言的多義性,可以說是信息裡最複雜最動態的一部分。

機器怎麼知道你在說什麼?

當看到機器翻譯的準確性,你也會感嘆這簡直就是“神蹟”,它們比大部分現場翻譯要強得多。

語音識別本質上是找到概率最大的文字序列

一旦出現條件概率,貝葉斯定理總能挺身而出。

我們用P(f|e)區別於以上的P(A|B)來解釋語音識別功能。

統計機器翻譯的問題可以描述為:給定一個句子e,它可能的外文翻譯f中哪個是最靠譜的。

即我們需要計算:P(f|e)

P(f|e) ∝ P(f) * P(e|f)

這個式子的右端很容易解釋:

那些先驗概率較高,並且更可能生成句子e的外文句子f將會勝出。

我們只需簡單統計就可以得出任意一個外文句子f的出現概率

隨著大量數據輸入模型進行迭代,隨著計算能力不斷提高,隨著大數據技術的發展,貝葉斯定理威力日益凸顯,貝葉斯公式巨大的實用價值也愈發體現出來。

語音識別僅僅只是貝葉斯公式運用的其中一個例子。

實際上,貝葉斯思想已經滲透到了人工智能方方面面。


5. 貝葉斯網絡,AI智慧的拓展

語音識別,見證了貝葉斯定理的能力。

貝葉斯網絡的拓展,則可以看到更強大的人工智能未來

借助經典統計學,人類已經解決了一些相對簡單的問題。

然而經典統計學方法卻無法解釋複雜參數所導致的現象,例如:

龍捲風的成因,2的50次方種可能的最小參數值比對;
星繫起源,2的350次方種可能的星雲數據處理;
大腦運作機制,2的1000次方種可能的意識量子流;
癌症致病基因,2的20000次方種可能的基因圖譜;

……


面對這樣數量級的運算,經典統計學顯得力不從心。

科學家別無選擇,最終尋找貝葉斯定理給予幫助。

把某種現象的相關參數連接起來,再把數據代入貝葉斯公式得到概率值公式結網形成一個成因網,即貝葉斯網絡,如下圖所示:


這也是貝葉斯網絡被稱為概率網絡因果網絡的原因。

利用先驗知識和样本數據,確立隨機變量之間的關聯,然後得出結論。

一個又一個的節點,一個又一個的概率,都來源於人類的先驗知識,有效知識越多,貝葉斯網絡展示的力量越讓人震撼。

今天一場轟轟烈烈的“貝葉斯革命”正在AI界發生:

貝葉斯公式已經滲入到工程師的骨子裡,貝葉斯分類算法也成為主流算法。

在很多工程師眼中,貝葉斯定理就是AI發展的基石


6. 結

人工智能第一課,都是從貝葉斯定理開始。

大數據人工智能自然語言處理中都大量用到貝葉斯公式。

CHATGPT是如何確定生成的句子是合理的?

背後同樣是貝葉斯公式在主導。


貝葉斯公式有多厲害?

CHATGPT已經向我們演示一遍了。

不過,貝葉斯公式與AI的結合,

到底是一場科學的革命,還是一場理念的革命?

到底是生產方式的革命,還是人類在革自己的命?

我們無法得知。


在與CHATGPT對話的過程中,偶爾發現部分回答有些詭異

甚至開始擔心,CHATGPT再這樣下去,會不會誕生“自我意識”?

到那時候,人類與AI會不會真正成為對立的雙方?

這似乎有點杞人憂天了。

縱觀整個社會,倒不用太擔心AI像人一樣思考,最應該擔心人類已經失去了思考。

貝葉斯公式,是數學大千世界中的一抹光影。

還有許多像徵真理的公式,在推動著人類進步

那些科學史上偉大的探索者,試圖通過一個個公式,洞悉宇宙之秘

我們將這一個個公式,組成了一副撲克。

貝葉斯公式,也收錄其中。

人間虛妄之中,見證數學是唯一真實

在這副撲克里,我們將感知人類榮耀。

聲明一下:它不是用來玩的,應該供奉於書櫥之上。(量子學派)