GoogleLyria 3凌晨突發！照片秒變30秒神曲，音樂圈的飯碗要被端了

2026/02/19

•

今天凌晨，Google重磅發佈音樂模型 Lyria 3，並且直接整合在 Gemini 裡，未來幾天全球使用者全員開放，這回是真·人均音樂人了。

Lyria 3這次最狠的地方在於，不只是能理解文字，你甩一張照片或者一段視訊過去，就能給你整出一首 30秒的配樂。音樂的多模態理解力，真的太驚豔了。

用過之前Lyria系列模型的能明顯感覺到，這次的Lyria 3在音訊生成上直接拉滿了，核心就三個大升級，每一個都踩在創作者的需求上。

首先是不用自己絞盡腦汁寫歌詞了，模型會順著你的提示自動編出適配的歌詞，徹底告別詞窮的煩惱。

創作的掌控感變高了，不管是音樂風格還是人聲、節奏這些細節，都能按照自己的想法調，想做溫柔的慢歌還是炸場的快節奏都可以。

最後就是做出來的曲子質感更棒了，不僅聽著更真實，編曲的複雜度也上去了，不再是那種單薄的簡單旋律，整體的音樂性提升特別多。

Lyria 3生成的玩法也更多了：第一種是文字生成音樂，你只要把自己想要的感覺說清楚就行。

比如具體的音樂流派、當下的心情，甚至是一段專屬的小回憶、小玩笑，模型都能接住，做出來的曲子要麼帶歌詞要麼純器樂，完全貼合你想要的心境。

你想給媽媽做首歌，懷念小時候一起的時光，指定做成歡快的非洲節拍曲風，模型都能精準還原這份心意。

第二種玩法更高效，可以用圖片或者視訊直接生成音樂。你把素材傳上去，Gemini 會先讀懂內容的氛圍，再順著這個感覺作曲寫歌詞，相當於給你的畫面量身打造專屬BGM。

比如你傳了狗狗在林間徒步的照片，模型就能圍繞這個場景做出一首溫馨的小曲子，氛圍感直接拉滿。

並且生成的 30 秒音樂片段，還會自動配一張專屬封面圖，這是由 Nano Banana 模型做的，不用自己額外費心設計。

如果你是YT創作者，這個技術其實並不陌生。Dream Track功能裡早就用上了類似的技術，現在Lyria 3進駐YT。

意味著做Shorts 短影片的時候，配樂的質量和定製化程度又上了一個台階，再也不用擔心版權問題或者找不到合適的背景音樂了。

Google這次還考慮到了AI內容的識別問題，給Lyria 3生成的音樂都加了專屬的隱形水印 SynthID，這是Google自己研發的技術，專門用來標記自家AI生成的內容，肉眼聽感都察覺不到，但能精準溯源。

並且Gemini的驗證功能也升級了，之前只能識別圖像和視訊的AI內容，現在音訊也能查了，你只要把音訊檔案傳上去，問一句是不是GoogleAI做的。

模型就會先檢測裡面的SynthID水印，再結合自己的推理給出答案，不管是自己驗證還是分辨別人的內容，都特別方便。

關於版權和原創性，大家肯定很關心。其實從 2023 年第一款 Lyria 模型出來，Google就一直在和音樂行業的各方合作，踏踏實實做技術研發，不是瞎搞的那種。

中間還做了音樂人工智慧沙盒這類實驗項目，攢了不少經驗，這次訓練 Lyria 3，更是把版權規定和合作協議摳得很細，一點都不馬虎。

這個模型的核心是鼓勵原創，不是讓大家去模仿現有的歌手藝人。就算你在提示裡提到了某個特定的藝術家，模型也只會把這個名字當成創作靈感，做出來的曲子只會在風格或者情緒上相近，不會照搬人家的作品。

同時Google還加了過濾機制，會把生成的內容和現有的音樂作品做比對，避免出現雷同的情況。

目前這個功能已經開始向部分使用者開放了，支援的語言不少，英語、德語、法語等。桌面端現在就能用，手機端隨後幾天也會跟上。如果你是付費訂閱使用者，還能享受更高的生成額度。

對於這個重磅新模型，網友表示，這樣一來，創作者就不用再使用素材網站上那些被用濫了的免版稅音樂，而是能為視訊配上專屬定製的背景音樂。背景音樂對視訊的整體氛圍影響太大了！

真的很開心看到AI能這樣突破創意的邊界！那些能把文字、圖片等想法直接轉化成音樂的工具，徹底改變了創作者嘗試和迭代的方式。GoogleAI帶來的這些成果，真的太令人興奮了。

照片轉音樂提示功能太棒了，光是這一點就開啟了許多創意工作流程。

這是生成式音訊技術的一次驚人飛躍。音質已經非常出色，但如果能實現原生3分鐘音訊生成，那將真正徹底改變音訊製作流程。期待擴展上下文窗口。 (經管之家)