從爆火至今不到兩年，AI技術爆炸瘋狂發展，推薦大家回顧消費級AI這一年多的歷程

2024/10/25

•

今天是2024年10月下旬，記得2022年的11月份，OpenAI公司的ChatGPT爆火出圈，成為了史上使用者增長最快的消費級應用。

僅僅5天，使用者數量達到100萬，60天活躍使用者過億，吸引無數人的眼球，也得到國內外資本的青睞，紛紛押注AIGC的未來，ChatGPT一路高歌猛進，在科技圈一路狂飆。

博主是國內首批註冊體驗ChatGPT的使用者，懷著十足的好奇心註冊並登錄，即使註冊過程繁雜，也抵擋不了人們對先進科技的熱情。

本人是個十足的科技狂熱分子，各個社交媒體平台瞭解本人的喜好，當ChatGPT爆火出圈的時候，關注到了各個平台推送的科技創新的前沿資訊，自然，全球爆火的應用不可能逃過博主尖銳的眼睛。

2007年，當史蒂夫·賈伯斯在舊金山推出第一代蘋果手機的時候，讓很多人感到震撼。當年，市面上的手機還是使用實體按鍵，系統功能較為單一。而蘋果的這款新產品卻以一種前所未有的創新方式出現，更大的觸控式螢幕、更好的使用體驗、更多的功能、更流暢的系統，讓大家心甘情願地為之買單。

這一瞬間被稱為“iPhone時刻”，從那以後，蘋果不僅徹底改變了手機行業、重新定義了什麼是手機，還持續引領著手機行業，改變了人們的生活。

十幾年來，智慧型手機的出現，推動了移動網際網路的發展，手機和移動網際網路將人們的生命變了個樣，網購、社交、自媒體興起，造就了一批新的富翁。而科技狂人們也在期待什麼時候會是下一個iphone時刻。

直到ChatGPT出現，一些人明白，又一場改變人們生活方式和現今商業結構的科技變革已經到來。

記得當時剛登錄使用之前就已經看了很多介紹說ChatGPT有多麼厲害，GPT使用了一種叫預訓練大語言模型的技術，一種叫Transformer的架構，其中的注意力機制讓模型有了理解能力，能聽懂你說了什麼，能判別你的意圖。

這就很神奇了，專業是電腦應用技術的本人學了幾年程式設計我程式碼都沒寫明白，電腦竟然就已經發展到能聽懂人話的水平了。

終於能夠讓電腦自己幹活了啊，這以後就不是人學習電腦了，反過來了，變成了電腦學習人了，大部人不用再深入學習電腦程式設計，不用再大把大把地掉頭髮了。

不用再因為程序報錯而抓耳撓鰓，不用再因為Bug頻出而頭痛欲裂，也不用再因為搞不懂那些很難的設計模式而痛哭流涕了。

真的有這麼厲害嗎？登錄上去之後，就迫不及待地和AI交流，記得我第一次互動打得竟然是“你好”二字，還挺有禮貌自我感動，然後就開始給AI測智商了，問了一大堆我已經有預期答案的問題，AI的反應還不錯，實事、知識和理論層面基本上都能有比較好的回應，但一些高深一些的東西還理解不了，不過這很正常，大部分人都理解不了一些比較難的東西。

使用下來之後，我就隱約感覺到沒錯了，人工智慧技術這次走上正道了。把“用發展的眼光看世界”這句話刻在腦子裡的本人，當時就知道AI技術將會很快發展，而且發展速度會比移動網際網路普及的時候還快，因為網際網路就是AI發展的基礎設施。

正所謂，判斷正確就有可能，但人們往往在判斷的實踐上會出現錯誤，而可能的機率，取決於判斷錯誤的大小。

許多人還不瞭解AI行業這兩年的發展，寫這篇文章的初心就是想梳理這差不多兩年的時間裡都發生了什麼，當然，AI行業也不止是OpenAI公司一家，應該放眼整個行業，找找看還有那些激動人心的時刻。

現在的全球AI市場情況是一家領先，百家追逐，已經不再是一家獨秀的時候了。現在有ChatGPT、Claude、Mistral、‌LLaMA、Gemini、Qwen、文心一言

參數量是大模型的一個重要指標，同等訓練條件下，參數量越大的模型理解能力越強，智力水平更高。所有的AI大模型的參數量都在提升，而且是以更快的速度提升，這表明了大模型的發展正在持續加速。

更強的理解能力、更智能、更多的常識、更多的知識。很可能現在那些未發佈的模型已經實現AGI（像人一樣的智能水平）。

而且OpenAI這家公司總是把王牌藏起來，在發佈ChatGPT3.5的時候，那時候GPT4已經訓練完成了，也就是說這些AI公司發佈的都不是最新的產品，使用者普遍認為OpenAI手裡會永遠握著王牌。

上個月，OpenAI開始向使用者推送他們在今年5月14日所展示的高級語音模式，本人體驗過後感覺非常震撼，ChatGPT的高級語音模式表現已經很像真人了，AI味基本沒有了，擁有了更多的能力，響應速度就像真人對話一樣快。

近期，OpenAI發佈canvas功能，這個功能顛覆之前的對話模式，可以在canvas頁面指定修改生成內容的某個部分而不用重新生成整個文字內容。這個更新對於將GPT用於寫作的使用者很實用。

Claude3.5發佈，也帶來了一個震撼的功能，能夠操作使用者的電腦，AI正在朝著與這個世界的實際互動方向發展，現在能幫助使用者實用電腦，未來就可能替代使用者上班了，這絕不是幻想，科幻正在慢慢變成現實。

上面是語言模型的發展，總之就是越來越聰明，越來越像人。

除了語言模型外，還有一個領域也發展迅速，那就是圖像和視訊的生成技術。在這是視聽為主的媒體網路時代，視訊和圖像的需求顯然是很大的，AI技術在圖像和視訊生成方面的發展也非常具有商業價值。

現在文生圖技術可以說已經非常成熟了，通過簡單的描述就可以生成精美的圖像，文生圖技術已經給設計平面行業帶來了巨大的衝擊。現在人們感覺AI出圖稀鬆平常，但在幾年前，文字生成圖片功能還只是一種奢望，這技術現在還在迅猛發展，生成的圖像已經達到了可以拿出來當廣告圖的水平了。

直接干翻了設計行業和平面模特還有攝像師，AI是工具，是一種會淘汰人的工具，所以一定要把握AI的動向，跟進AI的發展，不然抓不住時代的機遇不說，甚至有可能被市場淘汰。

在2022年的3月，一款名叫MidJourney的繪圖工具發佈，現在這款工具顛覆了設計行業，是世界上最先進的AI繪圖工具，能夠生成各種風格的圖像，甚至可以生成無法分辨真假的照片級攝影圖像。

還有一款叫stable diffusion 的開源AI繪圖模型也是很不錯，這兩款AI繪圖模型就是行業的標竿，是想學習和實用AI繪圖的人的必學工具。

除了圖像生成模型外，還有視訊生成模型也在發展，中國本土的可靈、即夢、國際上的Runway、Luma AI等等。

自從OpenAI展示了他們的視訊生成技術sora以來，一直未向公眾發佈他們的產品和服務，據說只是和影視工作室合作，在那之後，AI視訊工具如雨後春筍那樣冒出來。

也許，sora就是OpenAI的一步臭棋，不過說來，現在的視訊生成工具還是不太行，不知道OpenAI會不會在未來給使用者驚喜。

不瞭解AI的人搞不懂為什麼AI技術這麼重要，但AI的未來一定足夠激動人心，這是人類社會的重大技術突破，如果說農業革命讓人類產生文明、工業革命讓人類超越體力、資訊革命讓人類超脫地域，人工智慧則能讓人類文明超越自我。

隨著AI技術的發展，一定會出現具有身體的AI，也就是擁有智能的機器人，這是什麼概念，就是人可以創造一個類似於人的機器，聰明、鋼鐵之軀、從不喊累，這就是人類社會新的生產力，而且人工智慧這種生產力的提升會遠遠超過工業帶來的生產力提升。

AI農業讓人類不再需要種糧食也不愁吃穿；AI航天讓人類不需要冒險就能建立地外生存基地；AI出行讓人類不受交通事故風險；AI養老讓每一個老人被用心對待；AI科研讓科技突飛猛進；

AI的能力發展方向是人能做的AI都能做，AI商業的本質是AI的能力就是你的能力，學習AI、使用AI、駕馭AI是一種基本能力。

人類會進入一個正真富足的時代。 (遠遠Faraway)