#音樂圈
拍照就能出歌!GoogleGemini攜Lyria 3殺進AI音樂圈,7.5億使用者免費玩,Suno們慌了?
想給朋友圈的日常片段配一首專屬BGM,卻苦於不會寫詞編曲;想給朋友的生日準備一首定製祝福歌,卻連簡譜都認不全;想給自家貓咪的曬太陽日常配一首慵懶小曲,翻遍版權庫都找不到合心意的旋律——這些普通人的小遺憾,如今被Google一出手就徹底解決了。2026年2月18日,Google正式在Gemini中上線了旗下DeepMind研發的最新AI音樂生成模型Lyria 3,直接把AI音樂創作的門檻踩到了泥土裡。從文字、圖片、視訊到音樂,Gemini終於補齊了多模態創作的最後一塊拼圖,而這一次,Google直接把AI音樂從「小眾發燒友的工具」,變成了7.5億月活使用者人人能玩的「大眾玩具」,也讓此前在AI音樂賽道風頭無兩的Suno、Udio們,瞬間感受到了刺骨的寒意。Lyria 3最動人的地方,不是冰冷的參數升級,而是把「創作一首歌」這件事,變得比發朋友圈還要簡單。Google為普通使用者準備了三種零門檻玩法,網頁端今天就能上手,手機端也將在幾天內完成推送。最基礎的文字生成音樂,徹底解放了普通人的創作欲。你不用懂樂理,不用寫歌詞,那怕只是隨口說一句「寫一首搞笑的90年代R&B慢板情歌,主題是一隻襪子終於找到了它的另一半」,或是「給媽媽做一首非洲鼓點的歡快歌曲,紀念小時候她給我做的烤大蕉」,Gemini都能在30秒內,給你交出一首完整的成品——有量身定製的歌詞,有貼合情緒的演唱,有層次豐富的編曲,甚至連歌曲封面,都會由Nano Banana Pro模型自動生成,直接就能下載分享。更讓人驚喜的是圖片與視訊生成音樂,這也是Google甩開一眾競品的王牌能力。你只需要上傳一張照片、一段視訊,Gemini就會自動分析畫面裡的內容、情緒與故事,自動填詞譜曲。貓咪窩在陽台曬太陽的照片,能生成一首慵懶鬆弛的爵士小曲;戶外徒步的風景視訊,能生成一首開闊治癒的民謠;甚至是朋友聚會的搞怪合照,也能變成一首歡快熱鬧的流行歌。不用你絞盡腦汁寫提示詞,畫面本身,就是最好的創作靈感。那怕你完全沒有創作靈感,Google也準備了現成的範本與動態建議,從lo-fi節拍、拉丁流行到可愛金屬樂,幾十種風格任選,改一改細節就能生成屬於自己的歌,真正做到了「人人都能當30秒的音樂家」。相比前代模型,Lyria 3的升級堪稱脫胎換骨。此前的Lyria模型,還需要使用者自己提供歌詞,而現在,從歌詞創作、編曲譜曲到人聲演唱、封面製作,全流程一步到位。使用者還能對音樂風格、人聲特點、節奏快慢等核心元素進行精細調整,生成的曲目也擁有了更真實的聽感、更複雜的編曲結構,徹底擺脫了早期AI音樂的生硬感。更關鍵的是,Google從一開始就避開了AI音樂行業最大的雷區——版權爭議。此前Suno、Udio都曾被三大唱片巨頭告上法庭,關於訓練資料版權、藝術家聲音模仿的爭議從未停歇。而Google給出了一套更周全的解決方案:Lyria 3從底層就定位於「原創表達」,而非模仿現有藝術家。即便你在提示詞裡提到了某個歌手的名字,它也只會將其作為寬泛的風格參考,而非直接復刻其聲音與作品。同時,所有用Lyria 3生成的曲目,都會嵌入Google的SynthID隱形水印,既不會影響聽感,又能精準識別音訊是否為GoogleAI生成。Gemini也同步上線了音訊驗證功能,你只需上傳一段音訊,就能快速確認它是否出自Google的AI工具,這套此前已經在圖片、視訊領域成熟應用的技術,如今補上了音訊領域的最後一塊短板。Google還設定了內容過濾機制與侵權舉報通道,儘可能降低版權風險,這份穩妥,也是初創玩家難以比擬的優勢。很多人會問,Lyria 3隻能生成30秒的曲目,比起能生成完整歌曲的Suno、Udio,是不是根本不夠打?但恰恰是這個30秒的限制,藏著Google最精準的野心。Google從一開始就沒打算把Lyria 3做成專業音樂人的生產力工具,它瞄準的,是7.5億普通使用者的日常表達需求——朋友圈的配樂、短影片的BGM、給朋友的祝福小歌、記錄日常的小趣味,這些場景,30秒剛剛好。專業音樂市場終究是小眾的,而普通人的日常創意表達,才是真正的兆級市場。更別說Google還手握YouTube這個全球最大的短影片平台,隨著Lyria 3的上線,此前僅對美國使用者開放的YouTube Dream Track功能,也正式開啟全球推送。短影片創作者可以直接用Lyria 3,根據視訊內容生成專屬的原創配樂,不管是帶歌詞的演唱段落,還是純器樂的背景音,都能一鍵搞定,徹底告別了公共版權庫的同質化與版權風險,直接打通了「創作-生成-發佈」的完整閉環。這才是Suno、Udio們真正需要緊張的地方。它們還在卷「誰能生成更長、更專業的歌曲」,而Google直接換了賽道,用7.5億的海量使用者、零門檻的多模態創作能力、完整的內容生態,把AI音樂的全民化大門徹底推開了。當普通人拍張照就能免費生成一首專屬歌曲,當AI音樂從「需要特意學習的工具」變成「隨手就能用的日常功能」,賽道的遊戲規則,已經被Google徹底改寫。目前Lyria 3已經支援英語、德語、日語等8種語言,雖然暫不支援中文,但Google已經明確表示後續會擴展更多語言。可以預見的是,隨著Google的入場,AI音樂再也不是小眾圈子的狂歡,屬於每一個普通人的音樂創作時代,真的來了。(AI時代潮)
GoogleLyria 3凌晨突發!照片秒變30秒神曲,音樂圈的飯碗要被端了
今天凌晨,Google重磅發佈音樂模型 Lyria 3,並且直接整合在 Gemini 裡,未來幾天全球使用者全員開放,這回是真·人均音樂人了。Lyria 3這次最狠的地方在於,不只是能理解文字,你甩一張照片或者一段視訊過去,就能給你整出一首 30秒的配樂。音樂的多模態理解力,真的太驚豔了。用過之前Lyria系列模型的能明顯感覺到,這次的Lyria 3在音訊生成上直接拉滿了,核心就三個大升級,每一個都踩在創作者的需求上。首先是不用自己絞盡腦汁寫歌詞了,模型會順著你的提示自動編出適配的歌詞,徹底告別詞窮的煩惱。創作的掌控感變高了,不管是音樂風格還是人聲、節奏這些細節,都能按照自己的想法調,想做溫柔的慢歌還是炸場的快節奏都可以。最後就是做出來的曲子質感更棒了,不僅聽著更真實,編曲的複雜度也上去了,不再是那種單薄的簡單旋律,整體的音樂性提升特別多。Lyria 3生成的玩法也更多了:第一種是文字生成音樂,你只要把自己想要的感覺說清楚就行。比如具體的音樂流派、當下的心情,甚至是一段專屬的小回憶、小玩笑,模型都能接住,做出來的曲子要麼帶歌詞要麼純器樂,完全貼合你想要的心境。你想給媽媽做首歌,懷念小時候一起的時光,指定做成歡快的非洲節拍曲風,模型都能精準還原這份心意。第二種玩法更高效,可以用圖片或者視訊直接生成音樂。你把素材傳上去,Gemini 會先讀懂內容的氛圍,再順著這個感覺作曲寫歌詞,相當於給你的畫面量身打造專屬BGM。比如你傳了狗狗在林間徒步的照片,模型就能圍繞這個場景做出一首溫馨的小曲子,氛圍感直接拉滿。並且生成的 30 秒音樂片段,還會自動配一張專屬封面圖,這是由 Nano Banana 模型做的,不用自己額外費心設計。如果你是YT創作者,這個技術其實並不陌生。Dream Track功能裡早就用上了類似的技術,現在Lyria 3進駐YT。意味著做Shorts 短影片的時候,配樂的質量和定製化程度又上了一個台階,再也不用擔心版權問題或者找不到合適的背景音樂了。Google這次還考慮到了AI內容的識別問題,給Lyria 3生成的音樂都加了專屬的隱形水印 SynthID,這是Google自己研發的技術,專門用來標記自家AI生成的內容,肉眼聽感都察覺不到,但能精準溯源。並且Gemini的驗證功能也升級了,之前只能識別圖像和視訊的AI內容,現在音訊也能查了,你只要把音訊檔案傳上去,問一句是不是GoogleAI做的。模型就會先檢測裡面的SynthID水印,再結合自己的推理給出答案,不管是自己驗證還是分辨別人的內容,都特別方便。關於版權和原創性,大家肯定很關心。其實從 2023 年第一款 Lyria 模型出來,Google就一直在和音樂行業的各方合作,踏踏實實做技術研發,不是瞎搞的那種。中間還做了音樂人工智慧沙盒這類實驗項目,攢了不少經驗,這次訓練 Lyria 3,更是把版權規定和合作協議摳得很細,一點都不馬虎。這個模型的核心是鼓勵原創,不是讓大家去模仿現有的歌手藝人。就算你在提示裡提到了某個特定的藝術家,模型也只會把這個名字當成創作靈感,做出來的曲子只會在風格或者情緒上相近,不會照搬人家的作品。同時Google還加了過濾機制,會把生成的內容和現有的音樂作品做比對,避免出現雷同的情況。目前這個功能已經開始向部分使用者開放了,支援的語言不少,英語、德語、法語等。桌面端現在就能用,手機端隨後幾天也會跟上。如果你是付費訂閱使用者,還能享受更高的生成額度。對於這個重磅新模型,網友表示,這樣一來,創作者就不用再使用素材網站上那些被用濫了的免版稅音樂,而是能為視訊配上專屬定製的背景音樂。背景音樂對視訊的整體氛圍影響太大了!真的很開心看到AI能這樣突破創意的邊界!那些能把文字、圖片等想法直接轉化成音樂的工具,徹底改變了創作者嘗試和迭代的方式。GoogleAI帶來的這些成果,真的太令人興奮了。照片轉音樂提示功能太棒了,光是這一點就開啟了許多創意工作流程。這是生成式音訊技術的一次驚人飛躍。音質已經非常出色,但如果能實現原生3分鐘音訊生成,那將真正徹底改變音訊製作流程。期待擴展上下文窗口。 (經管之家)