零失誤的AI 主播上崗,但主持人被取代還為時過早

「地球不爆炸,我們不放假」,這話出自央視主持人朱廣權。當時接近2017 年農曆新年,談到「你們電視台放假嗎」的問題,他一本正經地講了個段子。

但8 年後,主持人真的可以在春節放假了。負責代班的,是和他們長得差不多的AI 主播。

AI 假期代班,真人過年回家拍短片

誰能想到,傳統的電視節目,以一種很新的方式出圈了——蛇年春節期間,除夕至初七,《杭州新聞聯播》節目讓6 位AI 主播值班。

每天,各有兩位AI 主播出鏡,輪流口播,形式很像日常的新聞節目。

圖片來自:公眾號「杭州綜合頻道」

AI 主播倒也不算新鮮事,2024 年龍年春節,它們就已經登上了《杭州新聞聯播》,但當時只有2 位AI 主播,形式是單播。

動圖製作自:影片號「杭州綜合頻道」

除了地方台,AI 主播也已經出現在了更大的舞台上。央視的《2024 中國·AI 盛典》,主持人尼格買提以數字人的形像出現,恰好他所討論的,就是AI 會不會取代人類的話題。

網上也不乏一些這樣的聲音:AI 上崗,真人主播過完年還有班上嗎?從《杭州新聞聯播》的影片看,AI 主播雖然吐字清晰、不會出錯,但表現還差點意思。

理由包括但不限於:語氣欠缺了感情,特別是祝觀眾朋友新年快樂的時候,有些呆板。雖然會眨眼和輕微搖晃腦袋,但動作幅度很有限,脖子以下基本上不動。淺景深的虛化效果,摳圖感重,背景看起來有些假......

圖片來自:《杭州新聞聯播》

播音主持專業畢業、目前從事產品評測編輯的Obo,以更專業的角度提出了幾點意見:

語流語勢比較平,起伏不夠,所以還是聽得出機器人的機械音。

句末的字尾歸音不到位,有一種戛然而止的感覺,突然停下有些突兀,不自然。

採樣主持人的聲音壓嗓嚴重,胸腔共鳴被嚴重的壓喉影響,聽感一般。

副語言不到位,和新年掛鉤的新聞,表情卻是嚴肅的,播報內容和臉部副語言脫節。

所以他認為,目前AI 還無法取代真人主持,「AI 數字人出現挺好的,不用調休了,而且我已經跳出來了」。

但更廣泛的電視觀眾們,不會這樣認真「找茬」,可能認不出AI。其實,真人主播暫時不會被取代,還有一個原因──AI 主播負責播音,那麼真人就可以有時間做更多的事情了。

部分真人主播的短影片截圖

《杭州新聞聯播》AI 主播的形象、聲音,是以真人主播為藍本的。真人主播回家過年,還不忘拍攝「主播尋年味」影集短片,介紹家鄉的風土人情。以及,和其他打工人一樣,他們初八得回去上班。

Obo 雖然已經不在播音行業,但他在電視台工作的大學同學們,同樣有播報日常新聞之外的任務,平時需要策劃一些整活向的、年輕人愛看的短影片,過年也被要求拍攝Vlog。

傳播管道的更迭是一個原因。比起電視節目,短影片不會那麼官方和正式,更能拉近主持人和觀眾的距離,同時也提供了以小見大的視角,讓資訊更加容易傳播,甚至打造出主持人的個人IP。

但也很難說,其中沒有AI 的影響。在看到杭州AI 主播上崗的新聞後,Obo 和同學們聊起播音主持的未來,他們得出一個結論:「播音員當然會被取代,主持人不會。」

當日常節目可以漸漸由AI 完成,工作效率直接被AI 提高,「採編播」裡的「播」,顯得越來越「不重要」了。但這個「播報」是狹義上的,是指天氣、交通等「功能性」的播音,像朗誦這樣更具藝術性的表達形式,缺乏標準,也更難被取代。

AI 解放了人類主持人的假日,也倒逼著主持人在播節目之外掌握更多技能,空出時間做更多的「雜活」,扛攝影機、做編輯、寫稿子、主持大型線下活動......總之,「主持人的職場空間會被壓縮到跟記者一樣」。

不嫌苦不怕累的數字人,已經到處都是了

AI 主持人,只是數字人上崗的一種形式。最近,香港大學與字節跳動合作研發的、專為廣告視訊設計的豎屏Goku+ 模型,雖然還沒能用上,演示效果也令人瑟瑟發抖。官方甚至表示,「以低100 倍的成本製作廣告影片」。

僅通過文字提示詞,Goku+ 就能產生逼真的數字人視訊,時長可以超過20 秒,面部表情、手部動作、身體移動都很自然。

不僅如此,基於文字提示詞和產品圖片,Goku+ 還能產生數字人和產品互動的影片。

但也不用過度焦慮,AI 數字人的作用,目前來說還是單一的。 2023 年9 月,我們寫過直播間24 小時工作的AI 主播。它們的優點顯而易見,便宜、形象可控、掌握多國語言、不嫌苦不嫌累不情緒崩潰。

當時我以買家身份諮詢了一家數字人公司,依照真人形象定製數字人,基礎版8000 元一年,高級版3 萬一年,訓練素材審計通過後,訓練2 個工作日,平台就能反饋訓練成果。

定製形像是一方面,數字人直播是另外的價錢,5500 元一月。我在今年2 月又諮詢了一次,直播還是這個價,支援三種開播方式:自動播,使用提前準備好的直播語料,語音或文字;阿凡達直播,使用麥克風,真人即時驅動數字人的口型;自動播結合阿凡達直播。

但這家數字人公司,不對效果打包票,「數字人主播僅能替代部分機械化主播的工作,營運崗位相關工作替代不了,所以不承諾任何效果......效果和你的產品、直播內容、拉流量的手段等因素息息相關」。

而且因為數字人的表現仍然和真人有差距,它們也沒必要一直站在台前。就像AI 主持人更適合在假期等非黃金時段代班,直播間的AI 主播也更適合出現在“垃圾時間”,用來沖直播時長,或者時長12 到24 小時的本地生活直播間,拿重複的話術轟炸。

但這不代表,數字人對真人沒有傷害。 Obo 認為,AI 主持人可能會讓一些播音主持新人失去在「垃圾時間」練嘴的機會,然後影響到他們的就業管道。同樣,先被AI 直播波及的,會是那些海量的、不知名的、月薪幾千、投資回報率更低的「小透明」。

AI 越擅長模仿,人類越強調在場

《杭州新聞聯播》AI 主播出圈之後,微博上的一個熱搜字條是這樣的:AI 播報0 失誤,播音專業學生怎麼辦。

這就說明了一部分人的觀點:AI 能取代真人,是因為它不出錯。或者更泛泛而談,AI 能取代真人,是因為它身上「不人性」的一面。

但這個觀點其實恰恰違背了人性,大眾喜歡看到平時端正嚴肅的主持人身上,不那麼日常的、更親民的部分。

主持人出錯合集的花絮,因為滿足了觀眾的惡趣味,很容易在視訊平台走紅。更有代表性的例子是,在一次《新聞聯播》中,主持人康輝口播了20 多分鐘,被推上了熱搜,他的聲音始終保持高度的專業水平,但更讓觀眾記憶深刻的,可能是他播到最後微微泛白的嘴唇,這是一個專業能力頂尖的人類努力的痕跡。

就算AI 可以達到真人的水平,嘴皮子很快,始終不嘴瓢,但那會被認為是理所當然,只有人類肉身完成的,才更容易被記住和在乎。

有時候,這種樸素的、要求人類在場的想法,會逆轉科技的潮流。 2024 年10 月,一個波蘭廣播電台叫停了用AI 取代人類的實驗。

在實驗開始的幾周前,電台辭退了十幾位記者,然後在10 月推出了三個AI 主持人,以吸引年輕聽眾。很快,一位前電台記者和影評人發表了一封公開信以示抗議,「經驗豐富的媒體從業者不應該被機器取代」。

超過2.3 萬人追隨了這位記者並簽署了請願書,還有數百人給記者打電話,其中許多是年輕人,他們不想成為這場實驗的對象。

本來這場實驗要持續3 個月,但一周左右就暫停了,電台對大眾的情緒反應感到「非常意外」。其中可能有些「物傷其類」的意味。 AP 的報導裡寫上了這樣一句話,「在波蘭各地,人們感到憤怒」。

當我和DeepSeek 聊AI 主播的話題,它給了我一個很有意思的觀點——AI 主播模擬人類點頭、眨眼的動作,試圖營造“在場感”,但其本質仍是“去身體化”的技術存在,導致AI 無法實現人類主持人的“具身傳播”,無法表達身體和情感的自然共振。

很難說AI 數字人未來會取代多少崗位,但此時此刻面對AI 主播時湧起的猶豫和遲疑,不管是出於被取代的恐慌,還是因為相信AI 無法模擬人類的情感,本質都在表達,我們希望人類在場,儘管這可能只是我們的願望。

所以,讓真人主持人在不播節目的時候拍短影片,實在是一個太有趣的走向了。 AI 可以取代強調功能性、程式化的部分,但它沒法解答有沒有人願意觀看節目的問題。那些表達煙火氣息的瞬間,那些更容易傳播的片段,仍然需要人類親身的參與。不再強調效率的時刻,人的在場,才是最重要的前提。 (APPSO)