#Lyria | 熱門關鍵字 | 鉅亨號

Google旗下DeepMind發佈了最新AI音樂生成模型Lyria 3，該模型已率先整合至Gemini桌面端應用，未來幾日將逐步登陸移動端，面向全球18歲及以上使用者免費開放。據悉，作為Lyria系列模型的重大升級版本，Lyria 3支援通過文字、圖片、視訊等多模態輸入生成原創音樂，進一步降低了音樂創作的專業門檻，同時聯動YouTube生態，為內容創作者提供全新工具。根據官方介紹，Lyria 3相較於前代模型實現了三大核心升級。首先，該模型支援自動生成歌詞，使用者無需自行撰寫，只需通過提示詞描述音樂的主題、風格或情緒，模型便可自動創作匹配的歌詞與旋律。其次，使用者可實現更精細的創作控制，通過提示詞精準指定曲風、人聲類型、節奏速度等音樂元素。此外，Lyria 3生成的音軌在樂器層次、人聲真實感和音樂結構上均有顯著提升，音質更接近專業製作水準，打破了前代模型輸出內容相對單薄的侷限。在使用場景與操作便捷性上，使用者只需打開Gemini應用，在“工具”下拉菜單中找到帶有音符圖示的“音樂”選項，即可啟動創作功能，Google同步發佈的Lyria 3提示詞指南，可幫助使用者快速上手。此外，Lyria 3不僅整合於Gemini應用，還同步接入了YouTube的Dream Track功能，助力短影片創作者為Shorts生成定製化背景音樂，該功能此前僅面向美國使用者，此次隨Lyria 3的發佈向全球擴展。此外，開發者可通過Google Cloud上的Vertex AI API使用Lyria模型（當前API版本為lyria-002），以程式設計方式生成音樂，適配視訊配樂、廣告創作、遊戲音效製作等商業場景。使用權限方面，Lyria 3目前支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語8種語言，後續將逐步增加更多語言支援。所有18歲及以上的Gemini使用者均可免費使用該功能，而訂閱Google AI Plus、AI Ultra等付費服務的使用者，將享有更高的音樂生成額度，具體額度Google暫未明確披露。 (TechWeb)

2026/02/19

•

Google，再掀AI戰火

周三（2月18日）美股盤中，Google在官網部落格中宣佈，Gemini應用已配備公司最先進的音樂生成模型Lyria 3，使用者可使用文字或圖像製作30秒的音樂片段。新聞稿稱，“只需描述一個想法或上傳一張照片，Gemini就能在幾秒鐘內將其轉化為一首高品質、朗朗上口的歌曲。為了進一步拓展創意空間，您甚至可以讓Gemini從上傳的內容中汲取靈感。”根據Google的說法，Gemini不僅可以“文字轉歌曲”，還可以通過“上傳照片或視訊”創作一首完美契合氛圍的歌曲，歌曲長為30秒，並配有Nano Banana設計的自訂封面。另外，創作者還可以通過YouTube的Dream Track功能探索Lyria 3，以提升Shorts短影片配樂的品質。Google稱，Lyria 3已在美國推出，並正在逐步推廣至其他地區的創作者。Google提到，Lyria的音訊生成功能採用了公司最新的隱私和安全特性，所有生成的曲目都使用SynthID技術加入了不易察覺的水印，可以檢測音樂是否由人工智慧創作或編輯。消息公佈後，歐美主流串流媒體音樂服務平台Spotify（股票程式碼：SPOT）股價回吐了日內近5%的漲幅，Sirius XM（股票程式碼：SIRI）也一度轉跌。有分析表示，雖然Google的音樂生成模型預計不會成為Spotify的致命打擊，但這些舉措可能迫使後者盡快推出AI混音功能。另外，把音訊創作工具加入移動應用，有望增強Google的消費者產品競爭力。對於Google來說，公司需要持續向投資者證明其AI產品投入能夠帶來收入增長。生成式AI工具在音樂行業一直受到謹慎甚至敵視的對待，許多從業者認為其可能威脅商業模式和智慧財產權。Google在部落格中強調，其系統設有保護措施，禁止AI直接挪用特定藝術家的作品。如果使用者點名真實音樂人，Gemini只會將其視為“廣泛的創作靈感來源”，生成風格或氛圍與之相似的曲目。 (財聯社)

2026/02/19

•

Google Lyria 3（AI音樂生成模型）發佈 + AI 音樂模型對比

Google DeepMind 推出的 Lyria 3 （2.19發佈）是其目前最先進的 AI 音樂生成模型，已正式整合進 Gemini 應用程式中。與之前的版本相比，它不再僅僅是實驗性質，而是成為了一個功能齊全的創意工具，字、圖片、視訊都能秒變音樂。Lyria 3 的功能細節非常豐富，它不僅是一個“文字轉音樂”的工具，更是一個深度整合的多模態創作引擎。以下是根據最新技術文件整理的具體功能細節：1. 多模態輸入（Multimodal Inputs）Lyria 3 最強大的地方在於它能“看圖/視訊說話”：圖像轉音樂：你可以上傳一張日落、聚會或寵物的照片，Lyria 3 會分析照片的色彩、氛圍和主體，生成一段情緒契合的背景音樂。視訊轉音樂：支援上傳視訊短片，模型會捕捉視訊的節奏感（如剪輯點或動作頻率）來合成配樂。跨媒介觸發：你甚至可以把一封“入職歡迎郵件”或一段“冷笑話”作為提示，它會將其轉化為一段充滿幽默感或職業感的音樂短片。2. 音樂控制與生成參數對於有進階需求的使用者，Lyria 3 提供了更專業的調節維度：時長與格式：生成音軌的標準長度為 30 秒（在 Vertex AI 專業版中可精確到 32.8 秒），輸出格式為高品質的 48kHz WAV 檔案。負向提示詞 (Negative Prompting)：你可以明確要求“不要人聲”、“不要電子合成器”或“避開憂鬱的情緒”，以精準排除不需要的元素。種子值 (Seed)：支援設定 Seed 值，這意味著如果你對某次生成的旋律很滿意，可以固定 Seed 並微調提示詞，從而實現可重複、可迭代的創作。自動歌詞與演唱：相比 Lyria 2 隻能生成純音樂，Lyria 3 可以根據主題自動編寫歌詞，並以極其自然的人聲（支援多種語言）演唱出來。3. 全自動化配套功能視覺包裝：每次生成音樂時，系統會呼叫 Nano Banana 圖像模型，同步生成一張風格統一的自訂專輯封面圖。即時“即興” (Lyria RealTime)：通過 API，Lyria 3 具備低延遲的“即興演奏”能力，能像樂隊樂手一樣根據你不斷輸入的指令即時改變正在播放的音樂（如改變 BPM 或增加樂器密度）。4. 內容安全與識別SynthID 數字水印：這是 Google 的核心技術，在音訊頻譜中嵌入人耳聽不到、但演算法可識別的水印。即使經過壓縮、剪輯，仍能追溯其為 AI 生成。版權過濾：內建了嚴格的過濾器。如果你要求“創作一段像周杰倫風格的歌”，它會生成具有“華語流行/鋼琴”特徵的原創樂曲，而不會直接挪用其受版權保護的旋律或音色。相比於目前市面上主流的 AI 音樂模型（如 Suno 和 Udio），Google 的 Lyria 3（及其背後的 Lyria 系列架構）走的是一條完全不同的道路。如果說 Suno 和 Udio 是“AI 唱片公司”，那麼 Lyria 3 更像是“AI 創意副駕駛”。以下是 Lyria 3 的核心優勢對比：1. 真正的“多模態”理解力Suno/Udio：主要依賴文字（Text-to-Audio）。雖然現在也支援音訊上傳（Audio Upload），但大多是作為旋律參考。Lyria 3 的優勢：它深度整合了 Google 的視覺能力。你可以直接上傳照片或視訊，它能自動“讀懂”畫面裡的情緒、節奏和場景，並生成匹配的 BGM。這種“視覺到音樂”的直覺化創作是其他模型目前難以比擬的。2. 創作的“可互動性”與“精準度”Suno/Udio：傾向於“抽卡式”生成。你輸入一段話，它給你 2-4 分鐘的完整歌曲。如果你不喜歡某一部分，修改起來相對死板（儘管 Udio 的 Inpainting 局部重繪功能正在改善這一點）。Lyria 3 的優勢：強調即時性與細粒度控制。它可以根據你的指令即時調整樂器密度或節奏 (BPM)。它可以處理複雜的指令，比如“在 15 秒處加入一段激昂的鼓點，同時保持人聲的輕柔”，這在專業音訊製作中更具實用價值。3. 版權與合規性的“國家隊”標準Suno/Udio：目前正面臨大型唱片公司的侵權訴訟（如索尼、環球等），因為它們的訓練資料被質疑包含大量版權音源，且有時會生成與知名歌手極度相似的聲音。Lyria 3 的優勢： * 合法授權： Google 與 YouTube 旗下的眾多藝術家（如 Charlie Puth、T-Pain 等）達成了直接合作，通過 Dream Track 功能合法使用他們的聲線特徵。強制水印：內建 SynthID。這讓 Lyria 3 生成的內容在專業分發管道（如廣播、商業廣告）中更具安全性，因為它的身份是可追溯、可審計的。4. 生態系統的整合Suno/Udio：獨立平台。生成的音樂需要你手動下載，再匯入剪輯軟體。Lyria 3 的優勢：它是 Gemini 全家桶的一部分。你可以先讓 Gemini 寫詩，然後一鍵轉為歌詞，再由 Lyria 生成音樂，最後由 Nano Banana 生成封面。它與 YouTube Shorts 無縫銜接，創作者可以直接在視訊編輯流中生成專屬配樂。出路在那裡？大部分使用者不關心大模型，使用者只關好用不好用。圖形圖像裡面的例子，美圖秀秀，或者剪映等產品，使用者並不會關心底層的大模型到底是不是自研發或者套殼其他家，只需要好用就行。做好應用層，滿足不同類型使用者的需求。給專業的使用者，做生產力工具，基於這個工具能賺到錢。給大眾使用者，做玩具，和AI修圖一樣的可以簡單做出來一些好玩，可以拿出來炫耀的東西。 (出海流量玄學研究)

2026/02/19

•

拍照就能出歌！GoogleGemini攜Lyria 3殺進AI音樂圈，7.5億使用者免費玩，Suno們慌了？

想給朋友圈的日常片段配一首專屬BGM，卻苦於不會寫詞編曲；想給朋友的生日準備一首定製祝福歌，卻連簡譜都認不全；想給自家貓咪的曬太陽日常配一首慵懶小曲，翻遍版權庫都找不到合心意的旋律——這些普通人的小遺憾，如今被Google一出手就徹底解決了。2026年2月18日，Google正式在Gemini中上線了旗下DeepMind研發的最新AI音樂生成模型Lyria 3，直接把AI音樂創作的門檻踩到了泥土裡。從文字、圖片、視訊到音樂，Gemini終於補齊了多模態創作的最後一塊拼圖，而這一次，Google直接把AI音樂從「小眾發燒友的工具」，變成了7.5億月活使用者人人能玩的「大眾玩具」，也讓此前在AI音樂賽道風頭無兩的Suno、Udio們，瞬間感受到了刺骨的寒意。Lyria 3最動人的地方，不是冰冷的參數升級，而是把「創作一首歌」這件事，變得比發朋友圈還要簡單。Google為普通使用者準備了三種零門檻玩法，網頁端今天就能上手，手機端也將在幾天內完成推送。最基礎的文字生成音樂，徹底解放了普通人的創作欲。你不用懂樂理，不用寫歌詞，那怕只是隨口說一句「寫一首搞笑的90年代R&B慢板情歌，主題是一隻襪子終於找到了它的另一半」，或是「給媽媽做一首非洲鼓點的歡快歌曲，紀念小時候她給我做的烤大蕉」，Gemini都能在30秒內，給你交出一首完整的成品——有量身定製的歌詞，有貼合情緒的演唱，有層次豐富的編曲，甚至連歌曲封面，都會由Nano Banana Pro模型自動生成，直接就能下載分享。更讓人驚喜的是圖片與視訊生成音樂，這也是Google甩開一眾競品的王牌能力。你只需要上傳一張照片、一段視訊，Gemini就會自動分析畫面裡的內容、情緒與故事，自動填詞譜曲。貓咪窩在陽台曬太陽的照片，能生成一首慵懶鬆弛的爵士小曲；戶外徒步的風景視訊，能生成一首開闊治癒的民謠；甚至是朋友聚會的搞怪合照，也能變成一首歡快熱鬧的流行歌。不用你絞盡腦汁寫提示詞，畫面本身，就是最好的創作靈感。那怕你完全沒有創作靈感，Google也準備了現成的範本與動態建議，從lo-fi節拍、拉丁流行到可愛金屬樂，幾十種風格任選，改一改細節就能生成屬於自己的歌，真正做到了「人人都能當30秒的音樂家」。相比前代模型，Lyria 3的升級堪稱脫胎換骨。此前的Lyria模型，還需要使用者自己提供歌詞，而現在，從歌詞創作、編曲譜曲到人聲演唱、封面製作，全流程一步到位。使用者還能對音樂風格、人聲特點、節奏快慢等核心元素進行精細調整，生成的曲目也擁有了更真實的聽感、更複雜的編曲結構，徹底擺脫了早期AI音樂的生硬感。更關鍵的是，Google從一開始就避開了AI音樂行業最大的雷區——版權爭議。此前Suno、Udio都曾被三大唱片巨頭告上法庭，關於訓練資料版權、藝術家聲音模仿的爭議從未停歇。而Google給出了一套更周全的解決方案：Lyria 3從底層就定位於「原創表達」，而非模仿現有藝術家。即便你在提示詞裡提到了某個歌手的名字，它也只會將其作為寬泛的風格參考，而非直接復刻其聲音與作品。同時，所有用Lyria 3生成的曲目，都會嵌入Google的SynthID隱形水印，既不會影響聽感，又能精準識別音訊是否為GoogleAI生成。Gemini也同步上線了音訊驗證功能，你只需上傳一段音訊，就能快速確認它是否出自Google的AI工具，這套此前已經在圖片、視訊領域成熟應用的技術，如今補上了音訊領域的最後一塊短板。Google還設定了內容過濾機制與侵權舉報通道，儘可能降低版權風險，這份穩妥，也是初創玩家難以比擬的優勢。很多人會問，Lyria 3隻能生成30秒的曲目，比起能生成完整歌曲的Suno、Udio，是不是根本不夠打？但恰恰是這個30秒的限制，藏著Google最精準的野心。Google從一開始就沒打算把Lyria 3做成專業音樂人的生產力工具，它瞄準的，是7.5億普通使用者的日常表達需求——朋友圈的配樂、短影片的BGM、給朋友的祝福小歌、記錄日常的小趣味，這些場景，30秒剛剛好。專業音樂市場終究是小眾的，而普通人的日常創意表達，才是真正的兆級市場。更別說Google還手握YouTube這個全球最大的短影片平台，隨著Lyria 3的上線，此前僅對美國使用者開放的YouTube Dream Track功能，也正式開啟全球推送。短影片創作者可以直接用Lyria 3，根據視訊內容生成專屬的原創配樂，不管是帶歌詞的演唱段落，還是純器樂的背景音，都能一鍵搞定，徹底告別了公共版權庫的同質化與版權風險，直接打通了「創作-生成-發佈」的完整閉環。這才是Suno、Udio們真正需要緊張的地方。它們還在卷「誰能生成更長、更專業的歌曲」，而Google直接換了賽道，用7.5億的海量使用者、零門檻的多模態創作能力、完整的內容生態，把AI音樂的全民化大門徹底推開了。當普通人拍張照就能免費生成一首專屬歌曲，當AI音樂從「需要特意學習的工具」變成「隨手就能用的日常功能」，賽道的遊戲規則，已經被Google徹底改寫。目前Lyria 3已經支援英語、德語、日語等8種語言，雖然暫不支援中文，但Google已經明確表示後續會擴展更多語言。可以預見的是，隨著Google的入場，AI音樂再也不是小眾圈子的狂歡，屬於每一個普通人的音樂創作時代，真的來了。(AI時代潮)