要把GPT-4挑下馬?谷歌發布全新大語言模型PaLM 2,還帶來了首款折疊屏手機

台北時間5月11日凌晨,谷歌2023年的I/O開發者大會舉行,和往年不太一樣的是,在今年I/O大會主題演講中,谷歌將更大的權重交給了人工智能,不但推出了全新一代的超級語言模型,還將其輻射到谷歌旗下各個應用中去。

谷歌展示了人工智能在不久的將來能提供的種種能力,而這些能力也讓我們看到人工智能未來是如何改變現有的網絡搜索、文本處理、編程等模式的。

基礎大語言模型PaLM 2公佈,谷歌挑戰GPT-4的模型來了



在今年I/O大會開幕之前,所有人都知道谷歌要藉助此次開發者大會一雪前恥,公佈在人工智能領域最新的進展,但可能很少有人想到谷歌在此次大會上直接更新了他們在去年4月剛剛發布的超級語言模型PaLM,定名PaLM 2。該模型支持全球100多種語言,可完成編寫軟件代碼、數學考試、創意作文和分析方面的測試。

對於PaLM 2的語言能力,谷歌工程師在一份研究論文中稱,該系統的語言熟練程度“足以(充當老師去)教授這門語言”。與其他大型語言模型一樣,PaLM 2不是單一類型的模型產品,它分為四種規格,從小到大依次為Gecko、Otter、Bison和Unicorn,依據特定領域的數據進行了微調,以執行企業客戶的特定任務。

其中,體積最小的Gecko可以在手機上運行,每秒可處理20個標記,大約相當於16或17個單詞。谷歌沒有說明使用什麼硬件來測試這個模型,只是說它在“最新的手機上”運行。


這種語言模型的小型化意義重大。這樣的系統在雲端運行的成本會很高,同時能夠在本地使用它們還有其他好處,比如改善隱私。

谷歌宣稱PaLM 2已被用於支持自家的25項功能和產品,其中包括AI聊天機器人Bard,以及谷歌文檔、幻燈片和工作表等。其中谷歌Bard聊天機器人在遷移到PaLM 2模型後,整體的能力提昇明顯,谷歌宣稱憑藉改進的數學、邏輯和推理技能,Bard現在支持了超過100種以上的語言,可以幫助生成、解釋和調試20多種編程語言的代碼。

而在這個全新的超級語言模型的幫助下,谷歌幾乎所有的業務都可以快速的引入人工智能,而谷歌在今年的I/O大會上,也正是這樣一項一項為我們展示的。

搜索:AI可能將打破傳統的搜索模式



首先是搜索,儘管它並沒有在第一時間出現在I/O大會的主舞台上,但很顯然搜索的改進對於谷歌未來的發展是舉足輕重的。谷歌將AI引入搜索中來,它勢必會在未來很短的時間內,改變用戶使用互聯網搜索引擎的傳統模式。



Google的搜索業務副總裁Liz Reid在現場展示了嵌入AI之後的Google Search功能,她在搜索框中輸入了“為什麼酵母麵包仍然如此受歡迎?” 並按下回車鍵後,谷歌的正常搜索結果立刻加載出來。而在常規搜索結果的上方,一個長方形的橙色框在閃爍和發光。幾秒鐘後,發光被AI生成的摘要所取代:幾段詳細描述了酵母的味道、其益生元能力的優勢等等。在右側,有三個站點鏈接,這些站點的信息Reid表示他們“證實”了摘要中的內容。

谷歌稱之為“人工智能快照”。所有這些都是通過谷歌的大型語言模型,所有這些都來自開放網絡。而在AI生成答案之後,谷歌傾向於給出佐證,讓人們了解到AI是如何生成這樣的描述的。她說這是谷歌AI主動生成模型與眾不同的關鍵。“我們希望大語言模型在生成內容後,作為必要條件,它要告訴使用者有哪些資源可以閱讀更多相關的信息”。



而這項業務還會和搜索中的其他業務相結合,比如購物。在展示的過程中,Reid描述了下面這樣的關鍵信息:

- 我女兒要過生日了,他喜歡鯨魚,有沒有類似的玩偶?

- 我想要一輛自行車,它可以讓我輕鬆的騎行5公里,它還可以爬山;

最終人工智能都完成了相應產品的搜索推薦工作。而每加入一個條件後,人工智能都會重新對結果進行檢測。很顯然,這已經和目前我們所使用的搜索引擎大相徑庭了,AI的到來,幫助用戶可以更快速準確的搜索相關的信息,而不是再盲目的信息網絡中找到他們想要的內容。


地圖和Gmail同時獲得AI加持

除了搜索之外,谷歌旗下兩個最著名的應用“GMail”和“Google Maps”也獲得了AI的加持。

GMail繼續升級內置的AI工具,從最初的Smart Reply到Smart Compose,而最新版本升級到“Help me write”。


“Help me write”通過引入生成式AI來幫助用戶撰寫郵件,而且還有多種語氣供用戶挑選。例如你向航空公司要求退款,你只需告訴AI你想要什麼,它就會根據你的航班細節寫一份草稿。同時你還可以要求AI調整語氣,讓郵件內容更委婉,這樣會幫助用戶有更大的機會獲得航空公司的退款。


谷歌地圖可以展示你在陌生城市的主動路線規劃,比如你要跑步,谷歌的AI可以幫你規劃兩條跑步路線,其中可能有一條是海邊的跑步路線,同時它還能告訴你未來一段時間的天氣情況和交通信息,幫助你更好的跑步。

這個功能將在包括阿姆斯特丹,柏林,都柏林,佛羅倫薩,拉斯維加斯,倫敦,洛杉磯,邁阿密,紐約市,巴黎,舊金山,聖何塞,西雅圖,東京和威尼斯在內的15個城市上線相應的能力。

Magic Editor:一鍵PS工具

基於人工智能主動生成技術,谷歌在I/O大會上推出了一個名為Magic Editor的圖片編輯功能,它使用生成式AI幫助用戶對照片進行大幅度的編輯和重構。


用戶只需要描述需求,這項功能就可以自動幫助用戶調整照片中需要修改的部分。在演示過程中,谷歌展示了這項功能對照片更換天氣,抹平衣服上的褶皺,甚至是將被拍攝主體從照片的邊緣挪到圖片中心來,AI會自動補齊缺失的圖像。

谷歌表示該功能將於今年晚些時候在Google Photo推出。


AI編程機器人Studio Bot

基於PaLM 2能力的基礎編碼模型Codey,谷歌為Android的開發者們推出了一個全新的AI編程機器人——Studio Bot。它可以同時支持Kotlin和Java編程語言,並直接存在於Android Studio的工具欄中。開發人員可以藉此快速獲得編程相關問題的答案,甚至可以讓機器人調試他們的部分代碼。

谷歌表示,這個機器人的開發完成度仍處於“非常早期的階段”,他們將繼續對其進行培訓以改進其編程和答案生成的能力。它目前也只能通過Canary頻道提供給美國的開發者,還沒有準確的在全球推出的時間表。


Duet AI:對標微軟的Copilot


微軟之前基於GPT-4推出了Microsoft Copilot服務,將AI全面植入office365中,而谷歌為了追趕微軟,在今年3月為其辦公套件Workspace引入了一系列AI功能,而在今年的I/O大會上,谷歌賦予了其一個全新的名字——Duet AI。

它能做什麼?在主題演講中,谷歌展示了Duet AI的一部分能力。人工智能和辦公套件的深度整合,讓AI可以完成包括準備會議、生成式寫作、安排行程、可視化解決方案等等工作。


比如在Gmail和Google Docs中,Duet AI允許通過用戶的幾句話描述,主動生成完整的回复。同時更進一步的,上下文的關聯性也會更嚴謹且更接近人類真實的筆法,另外它還可以幫助用戶修飾詞彙,讓你的郵件讀起來更加的生動或者是溫婉。

谷歌還推出了一項名為“Sidekick”的新功能,該功能能夠閱讀、總結和回答不同谷歌應用程序中的文檔問題。


Project Tailwind:一個用戶文檔培養的AI筆記模型


谷歌在I/O大會上展示了一個名為“Tailwind”的項目,它是一個有趣的個人化人工智能模型。從本質上講,它是一個根據使用者提供的文檔進行訓練的AI筆記本,用戶可以像導師或合作夥伴一樣進行其主動寫作的文檔。谷歌將其定位為學生工具,不過對於那些經常在生活中處理大量文本的人來說,它可能具有更大的潛力。

谷歌產品管理高級總監喬希・伍德沃德(Josh Woodward)在介紹這個項目的時候表示:“它的工作原理是你可以簡單地從谷歌云盤中挑選文件給AI去學習,它能有效地創建個性化和私密的人工智能模型,該模型在你提供的信息方面具有專業知識”。


Universal Translator:AI視頻對口型技術


除了Project Tailwind之外,谷歌還宣布正在開發一項名為Universal Translator的實驗技術。該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調和氛圍。這意味著該技術不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和麵部表情,人物說話視頻會根據目標語言的發音同步改變口型。


Universal Translator通過檢測單詞並進行翻譯,之後它會檢查說話者的語氣以及他們強調的內容。結合這兩個方面後,它會生成目標語言的語音。最後,它會根據AI生成的語音的發音同步視頻中說話者的口型。

不過考慮到此工具可能被濫用來創建虛假視頻,谷歌表示將限制對Universal Translator的訪問範圍。只有谷歌授權合作夥伴才能將其用於建設性項目,而普通用戶無法使用。


Android 14引入人工智能:可實現主動式文本生成+生成式壁紙功能

人工智能作為今年I/O大會絕對的主角,谷歌將這個功能下放給了目前所有的主要業務中,這其中肯定少不了Android。

此次谷歌賦予了Android 14兩個全新的AI功能,一個是主動式的文本生成(Magic Compose),一個是生成式的壁紙。


谷歌在Android的信息服務中引入了這個名為Magic Compose的功能,AI可以根據消息內容生成回复文本,這個功能很接近之前谷歌推出的助理服務(google assistant),只不過這次是通過AI完成文本對話上的主動生成服務。


除了這個功能外,谷歌還通過引入文本轉圖片擴散模型,允許用戶輸入一些語義提示,描述想要獲取的圖片信息,系統將會自動生成相應的壁紙。谷歌還表示,它有一種新的“電影壁紙”(cinematic wallpaper),使用設備上的機器學習網絡將圖片轉換為3D圖像,配合手機的重力感應器,壁紙可以實現3D動態的效果。

另外谷歌在此次主題演講中,帶來了一個重要的生態升級,設備查找應用“Find My Device”將很快可以利用其他Android設備構建的網絡去幫助用戶尋找設備。



谷歌明確表示這些設備的網絡信息都是加密的,他們無權查看相關設備信息,以確保用戶的隱私安全得到保證。另外未知的跟踪設備會被報警顯示,包括蘋果的AirTag,這也是谷歌和蘋果攜手合作的結果。

Pixel折疊屏手機來了:定價1799美元起,下月發售



谷歌已經在今年的I/O大會之前預告將會在主題演講中推出折疊屏手機。而這也是在折疊屏形態的智能手機產品誕生4年後,首個由谷歌這個Android系統母公司設計生產的折疊屏手機,谷歌將其命名為Pixel Fold。

Pixel Fold是一款橫向內折屏幕手機,和目前行業普遍採用的大折疊設計不同,這台手機的整體設計類似於OPPO Find N的小折疊,展開後寬高比更加的接近。這台手機折疊後的機身尺寸139.7x79.5x12.1毫米,展開後尺寸139.7x158.8x5.8 毫米,重量為283g。

Pixel Fold 搭載谷歌自研的Tensor G2處理器,附帶Titan M2協處理器,配有12GB LPDDR5內存+256/512GB UFS 3.1存儲,擁有4821mAh的雙電芯電池,以及USB Type-C 3.2 Gen 2 接口,支持最高30W的有線快充和Qi標準的無線充電,機身支持IPX8的防水等級。



手機擁有一塊5.8英寸的OLED外屏,寬高比為17.4:9,分辨率為2092x1080,支持120Hz刷新率,峰值亮度為1550尼特;內屏為7.6英寸OLED可折疊顯示屏,寬高比為6:5,分辨率為2208x1840,同樣支持120Hz刷新率、1450尼特的峰值亮度,支持無級懸停折疊。



谷歌為這台折疊屏打造了一個獨特的功能,當開啟實時翻譯時,手機的內外屏可以同時開啟,顯示不同的語言,可以讓使用者實現快速實時的翻譯交流。

影像方面,谷歌Pixel Fold外屏配有一顆1000萬像素的鏡頭,內屏配有800萬像素的鏡頭,後置4800萬像素主攝(OIS)+1080萬像素的超廣角+1080萬的等效五倍長焦。



在主題演講中,谷歌宣布這台折疊屏手機會在下月正式開售,共有兩個版本,12+256GB版售價1799美元,12+512GB版售價1919美元,預定Pixel Fold會隨機附贈一塊Pixel Watch智能手錶。


Pixel的新平板:久違了



谷歌確實好多年沒有推出過Pixel系列的平板電腦產品了,谷歌的產品副總裁Rose Yao在演講中表示他們也一直在尋找平板電腦這種產品的差異化使用體驗。不過好在谷歌還是在此次IO大會上帶來了全新的平板電腦產品——Pixel Tablet。



這是一台極具Pixel家族設計風格的平板電腦產品,你不用翻過來看它背面的Google LOGO,看正面和材質你就知道它一定出自谷歌之手。



這是一台在硬件上平平無奇的平板電腦產品,11英寸LCD材質的屏幕,分辨率2560 x 1600,採用Tensor G2處理器,8GB的內存,128GB或256GB的存儲空間,滿電情況下續航12小時。機身擁有四揚聲器模組,前後各有一個800萬像素的鏡頭。

如果一定要在這台平板電腦上找一些差異化的點,那非系統莫屬了。谷歌表示目前他們所有的第一方原生應用,都可以在這台設備上實現分屏的操作。



這台平板的定價為499美元,谷歌同時發布了一個支持磁吸充電的揚聲器底座,如果購買這台平板電腦,這個價值129美元的充電揚聲器底座會隨機附贈。


Pixel 7a:最沒懸念的產品,價格是關鍵



最後一個新的硬件產品,是在發布之前被網上各路大神扒了個底掉的Pixel 7a。依然是谷歌主打性價比的智能手機產品,它的定價為499美元,比去年的Pixel 6a小小漲價50美元。

這台手機同樣搭載了Tensor G2處理器,配有6.1英寸FHD+OLED顯示屏,支持90Hz刷新率,電池容量4385mAh,支持18W有線充電和7.5W的無線充電。

相比上一代Pixel 6a,谷歌這次為Pixel 7a升級了攝像頭,搭載了全新的6400萬像素主攝+1300超廣角雙攝,前置了一顆1300萬像素的自拍鏡頭。



谷歌Pixel 7a支持IP67防塵防水,重量為193g,還支持藍牙5.3和Wi-Fi 6E標準。價格方面,谷歌Pixel 7a已在美國上市,只有8+128GB版本,其中sub 6 5G版本售價499美元,mmWave 5G版本售價549美元。


谷歌全面擁抱人工智能

很顯然,今年的I/O大會,全面擁抱人工智能成為更大的主題,在OpenAI對外展示了GPT-4的能力後,全球的科技公司都在大模型上狂奔。而谷歌此次展示了多種AI和相關業務的結合,也讓我們看到了AI在未來科技領域的潛力。

不過在谷歌展示的多個項目中,很多還處在研發的初級階段,何時能使用到這些人工智能加持的應用服務,還是個未知數。另外谷歌在今年的主題演講中,也多次提到了AI倫理的問題,在同步發展大模型人工智能的同時,嚴肅看待人工智能的倫理問題,將會成為未來谷歌以及所有大模型研究者必須去面對的問題。(騰訊科技)