Gemini 3.5 Pro,看來還得再等等。
一副耳機,70 種語言,即時同聲傳譯。
還免費。
剛剛,Google發佈 Gemini 3.5 Live Translate。Google翻譯 App 裡直接就能用,iOS 和Android都上線了。
你說中文,對面幾秒鐘後聽到英語。對方回一句法語,你耳機裡傳來的是中文。全程不用停下來等翻完再說。
傳統的語音翻譯都是「回合制」。你說一段,停下來,等翻譯完,對方再說。就像兩個人中間夾了個傳話筒,誰也不能搶話。
Gemini 3.5 Live Translate 不用等你說完。它一邊聽一邊翻譯,中間只差幾秒鐘。
而且翻譯出來的聲音保留了你說話的語氣、語速和音調。不是那種一個字一個字蹦出來的機翻腔。
它還能自動識別語言,不用手動設定。你說中文,對方說日語,它會自己判斷,自己翻譯。
劃重點,什麼耳機都行。
有線、藍牙、幾十塊、幾百塊的,全都能用。
蘋果之前也推出過類似的即時翻譯,但只支援特定型號的 AirPods。沒有這幾款耳機,用不了。
現在Google這邊,隨便一副耳機就夠了。沒有硬體門檻。
Android使用者還多了一個「聽筒模式」。不戴耳機也行,直接把手機貼到耳朵上,像打電話一樣,翻譯好的語音從聽筒傳出來。旁邊的人聽不到。
出國旅遊問路、餐廳點菜、酒店入住,手邊沒耳機,直接拿手機貼在耳朵上就行。
支援中文。
還有日語、韓語、泰語、法語、德語、西班牙語,70 多種語言,基本覆蓋了你能去到的所有地方。
Google Meet 迎來了大升級。
之前 Meet 的語音翻譯只支援 5 種語言,而且只能和英語互翻。你想把中文直接翻譯成瑞典語?不行,必須經過一道英語。
現在直接支援 70 多種語言,超過 2000 種語言組合。中文到瑞典語、瑞典語到日語,隨便組合。
一場會議,參會者各說各的母語,每個人耳朵裡聽到的是自己選的語言。系統自動識別誰在說什麼,即時傳給每個人。
這個功能本月在部分Google Workspace 企業客戶中開始小範圍測試,今年晚些時候向更大範圍開放。
東南亞打車平台 Grab 已經用上了。
Grab 使用者每個月通過 App 打出超過 1000 萬通語音電話。司機和乘客經常語言不通,尤其是跨國接單的時候。
Grab 首席產品官說,「我們最看重的就是自動識別語言和低延遲。」
開發者 API 也同步開放了,目前是公開預覽階段,在Google AI Studio 裡就能體驗。跨國客服、線上教育、直播翻譯,都能直接接入。
Google翻譯今年 20 歲了。
2006 年剛上線的時候,它還只是Google內部的一個機器學習實驗。網頁上貼上一段英文,出來一段蹩腳的中文。
20 年後,每個月有超過 10 億人在用Google翻譯。翻譯量超過 1 兆個單詞,覆蓋將近 250 種語言。
但「同聲傳譯」這一步,等了 20 年。
一個合格的同聲傳譯員,日薪幾千到上萬。這基本不是普通人用得起的服務。
Google直接把這個能力裝進了一個免費 App 裡。70 種語言,幾秒延遲,不挑耳機,不挑手機。
幾千塊錢的翻譯機,核心賣點就是即時語音翻譯。Google現在一分錢不收。
以後出國,帶一副耳機就夠了。 (AI資訊Gap)
