#Lyria
Google發佈Lyria 3 AI音樂模型,Gemini一鍵生成30秒高保真歌曲
Google旗下DeepMind發佈了最新AI音樂生成模型Lyria 3,該模型已率先整合至Gemini桌面端應用,未來幾日將逐步登陸移動端,面向全球18歲及以上使用者免費開放。據悉,作為Lyria系列模型的重大升級版本,Lyria 3支援通過文字、圖片、視訊等多模態輸入生成原創音樂,進一步降低了音樂創作的專業門檻,同時聯動YouTube生態,為內容創作者提供全新工具。根據官方介紹,Lyria 3相較於前代模型實現了三大核心升級。首先,該模型支援自動生成歌詞,使用者無需自行撰寫,只需通過提示詞描述音樂的主題、風格或情緒,模型便可自動創作匹配的歌詞與旋律。其次,使用者可實現更精細的創作控制,通過提示詞精準指定曲風、人聲類型、節奏速度等音樂元素。此外,Lyria 3生成的音軌在樂器層次、人聲真實感和音樂結構上均有顯著提升,音質更接近專業製作水準,打破了前代模型輸出內容相對單薄的侷限。在使用場景與操作便捷性上,使用者只需打開Gemini應用,在“工具”下拉菜單中找到帶有音符圖示的“音樂”選項,即可啟動創作功能,Google同步發佈的Lyria 3提示詞指南,可幫助使用者快速上手。此外,Lyria 3不僅整合於Gemini應用,還同步接入了YouTube的Dream Track功能,助力短影片創作者為Shorts生成定製化背景音樂,該功能此前僅面向美國使用者,此次隨Lyria 3的發佈向全球擴展。此外,開發者可通過Google Cloud上的Vertex AI API使用Lyria模型(當前API版本為lyria-002),以程式設計方式生成音樂,適配視訊配樂、廣告創作、遊戲音效製作等商業場景。使用權限方面,Lyria 3目前支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語8種語言,後續將逐步增加更多語言支援。所有18歲及以上的Gemini使用者均可免費使用該功能,而訂閱Google AI Plus、AI Ultra等付費服務的使用者,將享有更高的音樂生成額度,具體額度Google暫未明確披露。 (TechWeb)
Google,再掀AI戰火
周三(2月18日)美股盤中,Google在官網部落格中宣佈,Gemini應用已配備公司最先進的音樂生成模型Lyria 3,使用者可使用文字或圖像製作30秒的音樂片段。新聞稿稱,“只需描述一個想法或上傳一張照片,Gemini就能在幾秒鐘內將其轉化為一首高品質、朗朗上口的歌曲。為了進一步拓展創意空間,您甚至可以讓Gemini從上傳的內容中汲取靈感。”根據Google的說法,Gemini不僅可以“文字轉歌曲”,還可以通過“上傳照片或視訊”創作一首完美契合氛圍的歌曲,歌曲長為30秒,並配有Nano Banana設計的自訂封面。另外,創作者還可以通過YouTube的Dream Track功能探索Lyria 3,以提升Shorts短影片配樂的品質。Google稱,Lyria 3已在美國推出,並正在逐步推廣至其他地區的創作者。Google提到,Lyria的音訊生成功能採用了公司最新的隱私和安全特性,所有生成的曲目都使用SynthID技術加入了不易察覺的水印,可以檢測音樂是否由人工智慧創作或編輯。消息公佈後,歐美主流串流媒體音樂服務平台Spotify(股票程式碼:SPOT)股價回吐了日內近5%的漲幅,Sirius XM(股票程式碼:SIRI)也一度轉跌。有分析表示,雖然Google的音樂生成模型預計不會成為Spotify的致命打擊,但這些舉措可能迫使後者盡快推出AI混音功能。另外,把音訊創作工具加入移動應用,有望增強Google的消費者產品競爭力。對於Google來說,公司需要持續向投資者證明其AI產品投入能夠帶來收入增長。生成式AI工具在音樂行業一直受到謹慎甚至敵視的對待,許多從業者認為其可能威脅商業模式和智慧財產權。Google在部落格中強調,其系統設有保護措施,禁止AI直接挪用特定藝術家的作品。如果使用者點名真實音樂人,Gemini只會將其視為“廣泛的創作靈感來源”,生成風格或氛圍與之相似的曲目。 (財聯社)
Google Lyria 3(AI音樂生成模型)發佈 + AI 音樂模型對比
Google DeepMind 推出的 Lyria 3 (2.19發佈)是其目前最先進的 AI 音樂生成模型,已正式整合進 Gemini 應用程式中。與之前的版本相比,它不再僅僅是實驗性質,而是成為了一個功能齊全的創意工具,字、圖片、視訊都能秒變音樂。Lyria 3 的功能細節非常豐富,它不僅是一個“文字轉音樂”的工具,更是一個深度整合的多模態創作引擎。以下是根據最新技術文件整理的具體功能細節:1. 多模態輸入(Multimodal Inputs)Lyria 3 最強大的地方在於它能“看圖/視訊說話”:圖像轉音樂: 你可以上傳一張日落、聚會或寵物的照片,Lyria 3 會分析照片的色彩、氛圍和主體,生成一段情緒契合的背景音樂。視訊轉音樂: 支援上傳視訊短片,模型會捕捉視訊的節奏感(如剪輯點或動作頻率)來合成配樂。跨媒介觸發: 你甚至可以把一封“入職歡迎郵件”或一段“冷笑話”作為提示,它會將其轉化為一段充滿幽默感或職業感的音樂短片。2. 音樂控制與生成參數對於有進階需求的使用者,Lyria 3 提供了更專業的調節維度:時長與格式: 生成音軌的標準長度為 30 秒(在 Vertex AI 專業版中可精確到 32.8 秒),輸出格式為高品質的 48kHz WAV 檔案。負向提示詞 (Negative Prompting): 你可以明確要求“不要人聲”、“不要電子合成器”或“避開憂鬱的情緒”,以精準排除不需要的元素。種子值 (Seed): 支援設定 Seed 值,這意味著如果你對某次生成的旋律很滿意,可以固定 Seed 並微調提示詞,從而實現可重複、可迭代的創作。自動歌詞與演唱: 相比 Lyria 2 隻能生成純音樂,Lyria 3 可以根據主題自動編寫歌詞,並以極其自然的人聲(支援多種語言)演唱出來。3. 全自動化配套功能視覺包裝: 每次生成音樂時,系統會呼叫 Nano Banana 圖像模型,同步生成一張風格統一的自訂專輯封面圖。即時“即興” (Lyria RealTime): 通過 API,Lyria 3 具備低延遲的“即興演奏”能力,能像樂隊樂手一樣根據你不斷輸入的指令即時改變正在播放的音樂(如改變 BPM 或增加樂器密度)。4. 內容安全與識別SynthID 數字水印: 這是 Google 的核心技術,在音訊頻譜中嵌入人耳聽不到、但演算法可識別的水印。即使經過壓縮、剪輯,仍能追溯其為 AI 生成。版權過濾: 內建了嚴格的過濾器。如果你要求“創作一段像周杰倫風格的歌”,它會生成具有“華語流行/鋼琴”特徵的原創樂曲,而不會直接挪用其受版權保護的旋律或音色。相比於目前市面上主流的 AI 音樂模型(如 Suno 和 Udio),Google 的 Lyria 3(及其背後的 Lyria 系列架構)走的是一條完全不同的道路。如果說 Suno 和 Udio 是“AI 唱片公司”,那麼 Lyria 3 更像是“AI 創意副駕駛”。以下是 Lyria 3 的核心優勢對比:1. 真正的“多模態”理解力Suno/Udio: 主要依賴文字(Text-to-Audio)。雖然現在也支援音訊上傳(Audio Upload),但大多是作為旋律參考。Lyria 3 的優勢: 它深度整合了 Google 的視覺能力。你可以直接上傳照片或視訊,它能自動“讀懂”畫面裡的情緒、節奏和場景,並生成匹配的 BGM。這種“視覺到音樂”的直覺化創作是其他模型目前難以比擬的。2. 創作的“可互動性”與“精準度”Suno/Udio: 傾向於“抽卡式”生成。你輸入一段話,它給你 2-4 分鐘的完整歌曲。如果你不喜歡某一部分,修改起來相對死板(儘管 Udio 的 Inpainting 局部重繪功能正在改善這一點)。Lyria 3 的優勢: 強調即時性與細粒度控制。它可以根據你的指令即時調整樂器密度或節奏 (BPM)。它可以處理複雜的指令,比如“在 15 秒處加入一段激昂的鼓點,同時保持人聲的輕柔”,這在專業音訊製作中更具實用價值。3. 版權與合規性的“國家隊”標準Suno/Udio: 目前正面臨大型唱片公司的侵權訴訟(如索尼、環球等),因為它們的訓練資料被質疑包含大量版權音源,且有時會生成與知名歌手極度相似的聲音。Lyria 3 的優勢: * 合法授權: Google 與 YouTube 旗下的眾多藝術家(如 Charlie Puth、T-Pain 等)達成了直接合作,通過 Dream Track 功能合法使用他們的聲線特徵。強制水印: 內建 SynthID。這讓 Lyria 3 生成的內容在專業分發管道(如廣播、商業廣告)中更具安全性,因為它的身份是可追溯、可審計的。4. 生態系統的整合Suno/Udio: 獨立平台。生成的音樂需要你手動下載,再匯入剪輯軟體。Lyria 3 的優勢: 它是 Gemini 全家桶 的一部分。你可以先讓 Gemini 寫詩,然後一鍵轉為歌詞,再由 Lyria 生成音樂,最後由 Nano Banana 生成封面。它與 YouTube Shorts 無縫銜接,創作者可以直接在視訊編輯流中生成專屬配樂。出路在那裡?大部分使用者不關心大模型,使用者只關好用不好用。圖形圖像裡面的例子,美圖秀秀,或者剪映等產品,使用者並不會關心底層的大模型到底是不是自研發或者套殼其他家,只需要好用就行。做好應用層,滿足不同類型使用者的需求。給專業的使用者,做生產力工具,基於這個工具能賺到錢。給大眾使用者,做玩具,和AI修圖一樣的可以簡單做出來一些好玩,可以拿出來炫耀的東西。 (出海流量玄學研究)
拍照就能出歌!GoogleGemini攜Lyria 3殺進AI音樂圈,7.5億使用者免費玩,Suno們慌了?
想給朋友圈的日常片段配一首專屬BGM,卻苦於不會寫詞編曲;想給朋友的生日準備一首定製祝福歌,卻連簡譜都認不全;想給自家貓咪的曬太陽日常配一首慵懶小曲,翻遍版權庫都找不到合心意的旋律——這些普通人的小遺憾,如今被Google一出手就徹底解決了。2026年2月18日,Google正式在Gemini中上線了旗下DeepMind研發的最新AI音樂生成模型Lyria 3,直接把AI音樂創作的門檻踩到了泥土裡。從文字、圖片、視訊到音樂,Gemini終於補齊了多模態創作的最後一塊拼圖,而這一次,Google直接把AI音樂從「小眾發燒友的工具」,變成了7.5億月活使用者人人能玩的「大眾玩具」,也讓此前在AI音樂賽道風頭無兩的Suno、Udio們,瞬間感受到了刺骨的寒意。Lyria 3最動人的地方,不是冰冷的參數升級,而是把「創作一首歌」這件事,變得比發朋友圈還要簡單。Google為普通使用者準備了三種零門檻玩法,網頁端今天就能上手,手機端也將在幾天內完成推送。最基礎的文字生成音樂,徹底解放了普通人的創作欲。你不用懂樂理,不用寫歌詞,那怕只是隨口說一句「寫一首搞笑的90年代R&B慢板情歌,主題是一隻襪子終於找到了它的另一半」,或是「給媽媽做一首非洲鼓點的歡快歌曲,紀念小時候她給我做的烤大蕉」,Gemini都能在30秒內,給你交出一首完整的成品——有量身定製的歌詞,有貼合情緒的演唱,有層次豐富的編曲,甚至連歌曲封面,都會由Nano Banana Pro模型自動生成,直接就能下載分享。更讓人驚喜的是圖片與視訊生成音樂,這也是Google甩開一眾競品的王牌能力。你只需要上傳一張照片、一段視訊,Gemini就會自動分析畫面裡的內容、情緒與故事,自動填詞譜曲。貓咪窩在陽台曬太陽的照片,能生成一首慵懶鬆弛的爵士小曲;戶外徒步的風景視訊,能生成一首開闊治癒的民謠;甚至是朋友聚會的搞怪合照,也能變成一首歡快熱鬧的流行歌。不用你絞盡腦汁寫提示詞,畫面本身,就是最好的創作靈感。那怕你完全沒有創作靈感,Google也準備了現成的範本與動態建議,從lo-fi節拍、拉丁流行到可愛金屬樂,幾十種風格任選,改一改細節就能生成屬於自己的歌,真正做到了「人人都能當30秒的音樂家」。相比前代模型,Lyria 3的升級堪稱脫胎換骨。此前的Lyria模型,還需要使用者自己提供歌詞,而現在,從歌詞創作、編曲譜曲到人聲演唱、封面製作,全流程一步到位。使用者還能對音樂風格、人聲特點、節奏快慢等核心元素進行精細調整,生成的曲目也擁有了更真實的聽感、更複雜的編曲結構,徹底擺脫了早期AI音樂的生硬感。更關鍵的是,Google從一開始就避開了AI音樂行業最大的雷區——版權爭議。此前Suno、Udio都曾被三大唱片巨頭告上法庭,關於訓練資料版權、藝術家聲音模仿的爭議從未停歇。而Google給出了一套更周全的解決方案:Lyria 3從底層就定位於「原創表達」,而非模仿現有藝術家。即便你在提示詞裡提到了某個歌手的名字,它也只會將其作為寬泛的風格參考,而非直接復刻其聲音與作品。同時,所有用Lyria 3生成的曲目,都會嵌入Google的SynthID隱形水印,既不會影響聽感,又能精準識別音訊是否為GoogleAI生成。Gemini也同步上線了音訊驗證功能,你只需上傳一段音訊,就能快速確認它是否出自Google的AI工具,這套此前已經在圖片、視訊領域成熟應用的技術,如今補上了音訊領域的最後一塊短板。Google還設定了內容過濾機制與侵權舉報通道,儘可能降低版權風險,這份穩妥,也是初創玩家難以比擬的優勢。很多人會問,Lyria 3隻能生成30秒的曲目,比起能生成完整歌曲的Suno、Udio,是不是根本不夠打?但恰恰是這個30秒的限制,藏著Google最精準的野心。Google從一開始就沒打算把Lyria 3做成專業音樂人的生產力工具,它瞄準的,是7.5億普通使用者的日常表達需求——朋友圈的配樂、短影片的BGM、給朋友的祝福小歌、記錄日常的小趣味,這些場景,30秒剛剛好。專業音樂市場終究是小眾的,而普通人的日常創意表達,才是真正的兆級市場。更別說Google還手握YouTube這個全球最大的短影片平台,隨著Lyria 3的上線,此前僅對美國使用者開放的YouTube Dream Track功能,也正式開啟全球推送。短影片創作者可以直接用Lyria 3,根據視訊內容生成專屬的原創配樂,不管是帶歌詞的演唱段落,還是純器樂的背景音,都能一鍵搞定,徹底告別了公共版權庫的同質化與版權風險,直接打通了「創作-生成-發佈」的完整閉環。這才是Suno、Udio們真正需要緊張的地方。它們還在卷「誰能生成更長、更專業的歌曲」,而Google直接換了賽道,用7.5億的海量使用者、零門檻的多模態創作能力、完整的內容生態,把AI音樂的全民化大門徹底推開了。當普通人拍張照就能免費生成一首專屬歌曲,當AI音樂從「需要特意學習的工具」變成「隨手就能用的日常功能」,賽道的遊戲規則,已經被Google徹底改寫。目前Lyria 3已經支援英語、德語、日語等8種語言,雖然暫不支援中文,但Google已經明確表示後續會擴展更多語言。可以預見的是,隨著Google的入場,AI音樂再也不是小眾圈子的狂歡,屬於每一個普通人的音樂創作時代,真的來了。(AI時代潮)