從爆火至今不到兩年,AI技術爆炸瘋狂發展,推薦大家回顧消費級AI這一年多的歷程

今天是2024年10月下旬,記得2022年的11月份,OpenAI公司的ChatGPT爆火出圈,成為了史上使用者增長最快的消費級應用。

僅僅5天,使用者數量達到100萬,60天活躍使用者過億,吸引無數人的眼球,也得到國內外資本的青睞,紛紛押注AIGC的未來,ChatGPT一路高歌猛進,在科技圈一路狂飆。

博主是國內首批註冊體驗ChatGPT的使用者,懷著十足的好奇心註冊並登錄,即使註冊過程繁雜,也抵擋不了人們對先進科技的熱情。



本人是個十足的科技狂熱分子,各個社交媒體平台瞭解本人的喜好,當ChatGPT爆火出圈的時候,關注到了各個平台推送的科技創新的前沿資訊,自然,全球爆火的應用不可能逃過博主尖銳的眼睛。

2007年,當史蒂夫·賈伯斯在舊金山推出第一代蘋果手機的時候,讓很多人感到震撼。當年,市面上的手機還是使用實體按鍵,系統功能較為單一。而蘋果的這款新產品卻以一種前所未有的創新方式出現,更大的觸控式螢幕、更好的使用體驗、更多的功能、更流暢的系統,讓大家心甘情願地為之買單。

這一瞬間被稱為“iPhone時刻”,從那以後,蘋果不僅徹底改變了手機行業、重新定義了什麼是手機,還持續引領著手機行業,改變了人們的生活。

十幾年來,智慧型手機的出現,推動了移動網際網路的發展,手機和移動網際網路將人們的生命變了個樣,網購、社交、自媒體興起,造就了一批新的富翁。而科技狂人們也在期待什麼時候會是下一個iphone時刻。

直到ChatGPT出現,一些人明白,又一場改變人們生活方式和現今商業結構的科技變革已經到來。


記得當時剛登錄使用之前就已經看了很多介紹說ChatGPT有多麼厲害,GPT使用了一種叫預訓練大語言模型的技術,一種叫Transformer的架構,其中的注意力機制讓模型有了理解能力,能聽懂你說了什麼,能判別你的意圖。

這就很神奇了,專業是電腦應用技術的本人學了幾年程式設計我程式碼都沒寫明白,電腦竟然就已經發展到能聽懂人話的水平了

終於能夠讓電腦自己幹活了啊,這以後就不是人學習電腦了,反過來了,變成了電腦學習人了,大部人不用再深入學習電腦程式設計,不用再大把大把地掉頭髮了。

不用再因為程序報錯而抓耳撓鰓,不用再因為Bug頻出而頭痛欲裂,也不用再因為搞不懂那些很難的設計模式而痛哭流涕了。



真的有這麼厲害嗎?登錄上去之後,就迫不及待地和AI交流,記得我第一次互動打得竟然是“你好”二字,還挺有禮貌自我感動,然後就開始給AI測智商了,問了一大堆我已經有預期答案的問題,AI的反應還不錯,實事、知識和理論層面基本上都能有比較好的回應,但一些高深一些的東西還理解不了,不過這很正常,大部分人都理解不了一些比較難的東西。

使用下來之後,我就隱約感覺到沒錯了,人工智慧技術這次走上正道了。把“用發展的眼光看世界”這句話刻在腦子裡的本人,當時就知道AI技術將會很快發展,而且發展速度會比移動網際網路普及的時候還快,因為網際網路就是AI發展的基礎設施。

正所謂,判斷正確就有可能,但人們往往在判斷的實踐上會出現錯誤,而可能的機率,取決於判斷錯誤的大小。


許多人還不瞭解AI行業這兩年的發展,寫這篇文章的初心就是想梳理這差不多兩年的時間裡都發生了什麼,當然,AI行業也不止是OpenAI公司一家,應該放眼整個行業,找找看還有那些激動人心的時刻。

現在的全球AI市場情況是一家領先,百家追逐,已經不再是一家獨秀的時候了。現在有ChatGPT、Claude、Mistral、‌LLaMA、Gemini、Qwen、文心一言


參數量是大模型的一個重要指標,同等訓練條件下,參數量越大的模型理解能力越強,智力水平更高。所有的AI大模型的參數量都在提升,而且是以更快的速度提升,這表明了大模型的發展正在持續加速。

更強的理解能力、更智能、更多的常識、更多的知識。很可能現在那些未發佈的模型已經實現AGI(像人一樣的智能水平)。

而且OpenAI這家公司總是把王牌藏起來,在發佈ChatGPT3.5的時候,那時候GPT4已經訓練完成了,也就是說這些AI公司發佈的都不是最新的產品,使用者普遍認為OpenAI手裡會永遠握著王牌。



上個月,OpenAI開始向使用者推送他們在今年5月14日所展示的高級語音模式,本人體驗過後感覺非常震撼,ChatGPT的高級語音模式表現已經很像真人了,AI味基本沒有了,擁有了更多的能力,響應速度就像真人對話一樣快。



近期,OpenAI發佈canvas功能,這個功能顛覆之前的對話模式,可以在canvas頁面指定修改生成內容的某個部分而不用重新生成整個文字內容。這個更新對於將GPT用於寫作的使用者很實用。

Claude3.5發佈,也帶來了一個震撼的功能,能夠操作使用者的電腦,AI正在朝著與這個世界的實際互動方向發展,現在能幫助使用者實用電腦,未來就可能替代使用者上班了,這絕不是幻想,科幻正在慢慢變成現實。

上面是語言模型的發展,總之就是越來越聰明,越來越像人。


除了語言模型外,還有一個領域也發展迅速,那就是圖像和視訊的生成技術。在這是視聽為主的媒體網路時代,視訊和圖像的需求顯然是很大的,AI技術在圖像和視訊生成方面的發展也非常具有商業價值。

現在文生圖技術可以說已經非常成熟了,通過簡單的描述就可以生成精美的圖像,文生圖技術已經給設計平面行業帶來了巨大的衝擊。現在人們感覺AI出圖稀鬆平常,但在幾年前,文字生成圖片功能還只是一種奢望,這技術現在還在迅猛發展,生成的圖像已經達到了可以拿出來當廣告圖的水平了。

直接干翻了設計行業和平面模特還有攝像師,AI是工具,是一種會淘汰人的工具,所以一定要把握AI的動向,跟進AI的發展,不然抓不住時代的機遇不說,甚至有可能被市場淘汰。

在2022年的3月,一款名叫MidJourney的繪圖工具發佈,現在這款工具顛覆了設計行業,是世界上最先進的AI繪圖工具,能夠生成各種風格的圖像,甚至可以生成無法分辨真假的照片級攝影圖像。

還有一款叫stable diffusion 的開源AI繪圖模型也是很不錯,這兩款AI繪圖模型就是行業的標竿,是想學習和實用AI繪圖的人的必學工具。



除了圖像生成模型外,還有視訊生成模型也在發展,中國本土的可靈、即夢、國際上的Runway、Luma AI等等。

自從OpenAI展示了他們的視訊生成技術sora以來,一直未向公眾發佈他們的產品和服務,據說只是和影視工作室合作,在那之後,AI視訊工具如雨後春筍那樣冒出來。

也許,sora就是OpenAI的一步臭棋,不過說來,現在的視訊生成工具還是不太行,不知道OpenAI會不會在未來給使用者驚喜。


不瞭解AI的人搞不懂為什麼AI技術這麼重要,但AI的未來一定足夠激動人心,這是人類社會的重大技術突破,如果說農業革命讓人類產生文明、工業革命讓人類超越體力、資訊革命讓人類超脫地域,人工智慧則能讓人類文明超越自我。

隨著AI技術的發展,一定會出現具有身體的AI,也就是擁有智能的機器人,這是什麼概念,就是人可以創造一個類似於人的機器,聰明、鋼鐵之軀、從不喊累,這就是人類社會新的生產力,而且人工智慧這種生產力的提升會遠遠超過工業帶來的生產力提升。

AI農業讓人類不再需要種糧食也不愁吃穿;AI航天讓人類不需要冒險就能建立地外生存基地;AI出行讓人類不受交通事故風險;AI養老讓每一個老人被用心對待;AI科研讓科技突飛猛進;

AI的能力發展方向是人能做的AI都能做,AI商業的本質是AI的能力就是你的能力,學習AI、使用AI、駕馭AI是一種基本能力。

人類會進入一個正真富足的時代。 (遠遠Faraway)