GoogleLyria 3凌晨突發!照片秒變30秒神曲,音樂圈的飯碗要被端了

今天凌晨,Google重磅發佈音樂模型 Lyria 3,並且直接整合在 Gemini 裡,未來幾天全球使用者全員開放,這回是真·人均音樂人了。

Lyria 3這次最狠的地方在於,不只是能理解文字,你甩一張照片或者一段視訊過去,就能給你整出一首 30秒的配樂。音樂的多模態理解力,真的太驚豔了。

用過之前Lyria系列模型的能明顯感覺到,這次的Lyria 3在音訊生成上直接拉滿了,核心就三個大升級,每一個都踩在創作者的需求上。

首先是不用自己絞盡腦汁寫歌詞了,模型會順著你的提示自動編出適配的歌詞,徹底告別詞窮的煩惱。

創作的掌控感變高了,不管是音樂風格還是人聲、節奏這些細節,都能按照自己的想法調,想做溫柔的慢歌還是炸場的快節奏都可以。

最後就是做出來的曲子質感更棒了,不僅聽著更真實,編曲的複雜度也上去了,不再是那種單薄的簡單旋律,整體的音樂性提升特別多。

Lyria 3生成的玩法也更多了:第一種是文字生成音樂,你只要把自己想要的感覺說清楚就行。

比如具體的音樂流派、當下的心情,甚至是一段專屬的小回憶、小玩笑,模型都能接住,做出來的曲子要麼帶歌詞要麼純器樂,完全貼合你想要的心境。

你想給媽媽做首歌,懷念小時候一起的時光,指定做成歡快的非洲節拍曲風,模型都能精準還原這份心意。

第二種玩法更高效,可以用圖片或者視訊直接生成音樂。你把素材傳上去,Gemini 會先讀懂內容的氛圍,再順著這個感覺作曲寫歌詞,相當於給你的畫面量身打造專屬BGM。

比如你傳了狗狗在林間徒步的照片,模型就能圍繞這個場景做出一首溫馨的小曲子,氛圍感直接拉滿。

並且生成的 30 秒音樂片段,還會自動配一張專屬封面圖,這是由 Nano Banana 模型做的,不用自己額外費心設計。

如果你是YT創作者,這個技術其實並不陌生。Dream Track功能裡早就用上了類似的技術,現在Lyria 3進駐YT。

意味著做Shorts 短影片的時候,配樂的質量和定製化程度又上了一個台階,再也不用擔心版權問題或者找不到合適的背景音樂了。

Google這次還考慮到了AI內容的識別問題,給Lyria 3生成的音樂都加了專屬的隱形水印 SynthID,這是Google自己研發的技術,專門用來標記自家AI生成的內容,肉眼聽感都察覺不到,但能精準溯源。

並且Gemini的驗證功能也升級了,之前只能識別圖像和視訊的AI內容,現在音訊也能查了,你只要把音訊檔案傳上去,問一句是不是GoogleAI做的。

模型就會先檢測裡面的SynthID水印,再結合自己的推理給出答案,不管是自己驗證還是分辨別人的內容,都特別方便。

關於版權和原創性,大家肯定很關心。其實從 2023 年第一款 Lyria 模型出來,Google就一直在和音樂行業的各方合作,踏踏實實做技術研發,不是瞎搞的那種。

中間還做了音樂人工智慧沙盒這類實驗項目,攢了不少經驗,這次訓練 Lyria 3,更是把版權規定和合作協議摳得很細,一點都不馬虎。

這個模型的核心是鼓勵原創,不是讓大家去模仿現有的歌手藝人。就算你在提示裡提到了某個特定的藝術家,模型也只會把這個名字當成創作靈感,做出來的曲子只會在風格或者情緒上相近,不會照搬人家的作品。

同時Google還加了過濾機制,會把生成的內容和現有的音樂作品做比對,避免出現雷同的情況。

目前這個功能已經開始向部分使用者開放了,支援的語言不少,英語、德語、法語等。桌面端現在就能用,手機端隨後幾天也會跟上。如果你是付費訂閱使用者,還能享受更高的生成額度。

對於這個重磅新模型,網友表示,這樣一來,創作者就不用再使用素材網站上那些被用濫了的免版稅音樂,而是能為視訊配上專屬定製的背景音樂。背景音樂對視訊的整體氛圍影響太大了!

真的很開心看到AI能這樣突破創意的邊界!那些能把文字、圖片等想法直接轉化成音樂的工具,徹底改變了創作者嘗試和迭代的方式。GoogleAI帶來的這些成果,真的太令人興奮了。

照片轉音樂提示功能太棒了,光是這一點就開啟了許多創意工作流程。

這是生成式音訊技術的一次驚人飛躍。音質已經非常出色,但如果能實現原生3分鐘音訊生成,那將真正徹底改變音訊製作流程。期待擴展上下文窗口。 (經管之家)