#音樂
中國AI音樂,悄悄把全球第一拿走了
中國AI音樂,悄悄把全球第一拿走了——崑崙萬維Mureka V8,最新登頂Artificial Analysis音樂模型榜,一舉超越Suno V4.5、Udio v1.5 Allegro等國際主流模型。而且還是人聲(vocal)、器樂(instrument)雙料第一那種。那麼問題來了,這個新鮮出爐的“雙料第一”到底有多能打?咱直接實測說話。人聲、器樂雙實測先看最直觀的人聲。這塊兒我們先給出了一個極簡提示詞,不加複雜的結構和參數,就看Mureka V8最原始的理解和生成能力:晚風民謠,溫柔女聲,黃昏鄉間的慢時光。怎麼說?AI唱歌是不是太有真人感了!!吐字清晰咱就不提了,關鍵在細節。第四句開頭能聽到一個明顯的換氣聲,再往後,幾處歌詞結尾也明顯能聽出氣息的上揚or下落處理。這種呼吸起伏恰到好處地在曲子裡穿插銜接,非常自然,而不是那種生硬堆砌。還有溫柔這個標籤,不只是貼在聲音上,在段落的推進上也貫穿始終。主歌更克制、更貼耳、氣息更輕;副歌才稍微把聲帶打開,情緒抬起來,不過這種情緒依然是收著的,沒有用力過猛。木吉他帶入,人聲一出,田間、黃昏、晚風……這愜意感簡直撲面而來。聽完民謠,我們又甩給Mureka V8一個極其刁鑽的指令。“曲風要Pop Rock和R&B混著來,節奏要卡死在72BPM的慢板,人聲還得在幾個段落裡來回切換:第一段氣聲唱法是那種沙沙的、帶點破碎感的聲音;副歌直接切搖滾嗓,帶嘶吼的那種;間奏再來一段R&B轉音,最後用假聲慢慢收尾。”沒想到這反覆橫跳的刁鑽需求,還真被Mureka V8給跑出來了,聽上去完成得不錯(doge)。幾種狀態截然不同的絲滑轉聲,中間切換還不斷檔、不卡頓。好吧我承認V8你的唱商在我之上……再讓AI試試玩樂器。一提到樂器,英式搖滾樂隊The Kinks的《You Really Got Me》簡直不要太出名——這首歌的前奏,是一段1960年代最具標誌性的失真吉他riff。所謂riff就是一段簡短、重複、極具辨識度的樂器樂句,通常是吉他或貝斯演奏,構成整首歌的記憶點。而Mureka V8在學到這種技巧後,為我們生成了一首純器樂演奏曲《Got Me Going》:就問有誰不想邊聽邊搖頭抖腿呢(笑.jpg)。開頭的riff味道非常正,一下子就把記憶點拉滿,然後整個器樂編排也十分有畫面感——一聽就知道人已經坐在酒館或Livehouse台下了,而此時台上正有一支帥氣逼人的樂隊在演奏,還是邊演邊跳舞那種。u1s1,AI生成的器樂演奏如今能到這個水平,確實給了人很大驚喜。聽完之後,你會很明顯感受到它對不同樂器特性、歌曲意境的理解等,都往前邁出了一大步。而當這種器樂演奏能力和人聲能力相結合之後,Mureka V8曾被反覆提及的一點,也愈發清晰——它所生成的,已經不再是一段“AI音訊片段”,而是一首結構完整、情感連貫、製作精良的“歌”。換句話說,它知道什麼時候該唱、情緒怎麼推進、用什麼樂器以及該怎麼用。這種近乎專業音樂人的創作能力,讓它真正跨越了一條從“可生成”到“可直接發佈”的線。因為懂音樂,所以可以直接生成“歌”。而能夠生成一首完整的“歌”,則意味著普通人無需專業訓練也能擁有屬於自己的作品——人人都能參與創作發表的時代,真的來了。至此,靠著“雙料第一”實力打底的Mureka V8,也把AI音樂直接捲到了新的高度。三個月一更,崑崙萬維太捲了不過實測一圈下來,我就想知道:它這股子暴力進化感是咋做到的?答案大概藏在那條密密麻麻的時間線裡——崑崙萬維這家公司在AI音樂的賽道上簡直捲瘋了。2024年2月SkyMusic 1.0內測起步,到了2026年1月,Mureka V8正式發佈,滿打滿算不到兩年時間,硬生生迭代了8個大版本。什麼概念?平均三個月一更?!能這麼玩,到底是在燒錢還是真憋著一口氣要把這事兒幹成?從結果來看,崑崙萬維應該是後者。回看Mureka這不到兩年的進化史,其實就是一個把“AI音樂好聽”從玄學變成可量化、可復現的工業化生產能力的迭代過程。第一階段是從不能用到能用。SkyMusic 1.0當時還只是個能跑通的內測版本,那時候團隊就盯著一件事,先把端到端“能用”這件事做出來,跑通訓練到評測的基礎閉環。緊接著兩個月後,2.0版本就直接把中英文版本上線到天工,這時候的AI音樂勉強算是邁過了“能出聲、不鬼畜”的門檻。第二階段是從能用到好用。到了2024年8月,產品迎來3.0到4.0大版本躍遷,解決了規模化的問題。崑崙萬維這次不僅落地了Mureka首個超大規範本本,建構起穩定的規模化基模能力,還在聽感和音質方面還實現了“肉耳可聽”的級數躍遷。獨立產品也借此殺出重圍,正式切入市場。到了5.0/5.5版本,多語種工程化能力補齊,Mureka開始在全球市場刷臉。進入2025年,隨著MusiCoT和更系統化的強化學習跑成閉環,模型開始具備主動思考的能力。這時候的Mureka就不是盲目撞大運了,擁有了先規劃音樂框架、敲定配器細節和情緒,再按邏輯推進創作的主動能力。第三階段是從好用到直接生產可發佈內容。到了V8,量變終於引起了質變。人聲的呼吸感、樂器的空間感、混音的專業度讓它在AA榜單雙料登頂,直接干翻了Suno和Udio。這一步跨了兩年,但崑崙萬維是真跨過去了。所以那套看似“超速”的迭代節奏,好像也沒那麼“瘋”了——不這麼卷,怎麼在兩年內把一個從零開始的模型做到全球第一?說它卷它還真沒完!!V8發佈剛剛過去兩個月,基於MusiCoT進一步深化的Mureka V9就要來了……Mureka V8解決了AI音樂“能寫出來”這件事,至於V9捲成了什麼樣嘛——咱只能說,它琢磨的是“能按你想的方式寫出來”。不懂?3月27日看發佈會估計你就懂了。AI音樂,這下得看北京了當然了,即使不談Mureka V9,僅從V8的兩次登頂,我們也已經能看到一個更清晰的變化:“東昇西落”正在AI音樂這個垂類賽道上演。之所以這樣說,是因為過去很長一段時間,AI音樂基本是太平洋那頭的主場,出名的模型也就那幾家。包括這次提到的Suno、Udio等,基本有一個算一個。但是現在,以崑崙萬維Mureka V8為代表的國產模型,卻悄然間拿回了主動權。說到這裡有人或許就好奇了,為什麼會出現這種反轉?答案,其實早就已經浮出水面了。一旦把這件事放在一個更大的背景下來看,你會發現,“東昇西落”幾乎已經成了各個AI賽道必然會出現的一幕景象。從引爆這輪AI革命的大語言模型,到最近掀起熱潮的“龍蝦”,劇本基本都一樣——前期由海外公司完成技術引爆,後期則由國產團隊實現追趕,甚至反超。到現在,國產開源已經成了比肩閉源的重要力量、國產模型被海外公司“友好借鑑”拿去玩“龍蝦”……人們總是後知後覺發現,很多原本以為的“追趕”,其實早就變了。而這一切背後的邏輯,其實大家也都心知肚明。放在製造業領域,大家會說這是因為有“中國製造”;而放在網際網路科技、放在AI領域,答案則是“中國速度”“中國規模”“中國場景”。一方面,國內這批AI玩家基本都經歷過網際網路從誕生到發展的完整時期,所以他們很熟悉那套“小步快跑、不斷根據使用者反饋進行迭代”的打法。可以說,相比從0到1,我們尤為擅長從1到100。另一方面,在內容、場景和使用者規模上,國內也擁有得天獨厚的“練兵場”——無論是龐大的網際網路使用者群體、豐富多元的應用場景,還是足夠複雜的內容生態,都給國產模型提供了快速試錯、持續最佳化的土壤。相應地,國產AI也能更快形成“飛輪效應”。而這些,也同樣正在支撐著AI音樂賽道的發展。所以,此時國產玩家裡有人能“站出來、站起來”,也就不足為奇了。至於為什麼會是崑崙萬維,上一部分也已經說了很多了——圍繞把“好聽”變成可復現的系統能力這個目標,他們對AI音樂這個垂類賽道進行了長期持續投入。俗話說,水滴石穿、繩鋸木斷。所以如今能有這個結果,也算是水到渠成的事情。再加上崑崙萬維還是北京市人工智慧產業的科技創新代表,所以登頂這件事本身也多了另一層象徵意義:AI音樂,往後高地就是北京了。據說,崑崙萬維還會在3.27(本周五)舉辦的中關村論壇開專場發佈會。屆時Mureka V9,應該會有更多詳情和介紹。 (量子位)
騰訊音樂2025Q4及全年業績穩健:業務多元增長,全年調整後淨利潤99.2億元
2026年3月17日,騰訊音樂娛樂集團(以下簡稱“騰訊音樂”)發佈了截至2025年12月31日止的第四季度及全年未經審計財務業績報告。財報顯示,騰訊音樂第四季度及全年財報整體業績實現穩健增長,2025全年總收入同比增長15.8%至329億元,創歷史新高;調整後淨利潤同比增長22%達99.2億元;其中,線上音樂業務持續有力增長,全年線上音樂服務收入為267.3億元,同比增長22.9%;第四季度,線上音樂服務收入同比上升21.7%至71億元,線上音樂訂閱收入穩健增長的同時,線上音樂非訂閱收入加速增長至25.4億元,同比增長40.8%。此外,財報披露,騰訊音樂將派發總額約為3.68億美元的2025財年年度現金股息,為股東創造長期價值回報。2025年第四季度及全年,騰訊音樂線上音樂業務持續有力增長,驅動整體業績穩中有進。在內容與平台“一體兩翼”戰略的指引下,騰訊音樂深化打造差異化的一站式音樂服務平台,在引入多樣化曲庫的基礎上深挖內容價值,豐富共創內容、加強宣推能力,並加速拓展以音樂為核心的多元化服務,建構充滿活力的內容生態,同時不斷完善平台多產品、多場景佈局,升級會員服務,並深化AI技術的創新與應用,為使用者帶來全方位、差異化的音樂消費體驗,推動業績穩健增長,持續為音樂產業創造長期價值。線上音樂業務多元增長,有力驅動整體業績穩中有進根據QuestMobile發佈的《中國網際網路發展年鑑(2025-2026年度核心趨勢洞察)》,網際網路平台的戰略中心從單純“抓流量”轉向“以使用者為中心”的價值深耕,從“場景覆蓋”到“全域陪伴”,建構使用者價值閉環。這一趨勢在線上音樂領域同樣凸顯。隨著使用者付費習慣深化,其對高品質內容與深層次體驗的需求日益增長。《2025中國音樂產業發展總報告》顯示,音樂消費形態正朝著多元化演進,已突破單純的聽覺享受範疇,轉向為情感共鳴、身份認同和文化體驗付費的價值體系。在行業持續演變的背景下,騰訊音樂精準把握前沿趨勢與使用者需求,依託多元的一體化音樂服務體系,不斷強化核心競爭力,實現了線上音樂業務的堅實增長,其中,線上音樂訂閱業務長期穩健增長的同時,圍繞音樂IP展開的非訂閱業務加速拓展,持續貢獻新增量,有力驅動整體業績穩中有進。資料顯示,得益於線上音樂訂閱收入的穩健增長與非訂閱收入的快速增長,騰訊音樂2025年線上音樂業務有力增長,進一步驅動整體業績穩中有升。2025全年總收入同比增長15.8%達329億元,線上音樂服務收入為267.3億元,同比增長22.9%,佔總收入比例超80%,其中線上音樂訂閱收入同比增長16%達176.6億元,線上音樂非訂閱收入同比增長39.2%至90.7億元;第四季度延續穩中向好的增長態勢,線上音樂服務收入同比增長21.7%達71億元,線上音樂付費使用者數提升至1.274億,ARPPU從2024年同期的11.1元提升至11.9元。基於騰訊音樂堅實穩健的業績表現,市場對其未來發展普遍持積極預期。花旗銀行在研報中指出,騰訊音樂正逐步將音樂行業的營運經驗轉化為強化其一站式音樂服務平台的優勢,既能滿足使用者多元化的音樂需求,又能通過多管道提升收入。摩根大通也在研報中認為騰訊音樂發力線下活動的戰略價值不僅限於直接變現,還能有效提升線上使用者參與度,進一步促進超級會員的增長。深化打造差異化一站式音樂服務平台,為行業創造長期價值2025年第四季度及全年,騰訊音樂在內容生態、技術創新與使用者體驗維度協同發力,深化差異化的一站式音樂服務平檯布局。在擴充多類型曲庫基礎上,騰訊音樂進一步延伸合作邊界、放大內容價值,並豐富自制與共創歌曲、加強宣推能力、拓展多元音樂服務,夯實獨特的內容生態優勢;在平台側,騰訊音樂持續推進AI賦能音樂創作與體驗,並最佳化多矩陣產品功能、升級會員權益,滿足使用者個性化需求,引領音樂消費潮流,以持續的價值創造助力音樂行業高品質發展。愈發充滿活力的內容生態對騰訊音樂業績增長的驅動作用日益顯著。為夯實多元化、差異化的內容供給,一方面,騰訊音樂不斷延伸與唱片公司的合作範疇,與華納音樂集團及相信音樂續約,並擴大與寰亞音樂的合作,首次為陳奕迅、劉德華、張國榮等殿堂級藝人的300余首經典作品增加杜比全景聲音效,提升使用者沉浸式聽歌體驗,同時拓展垂類內容,如近期與韓國廠牌P NATION CORPORATION續約,提供其旗下藝人及組合新作的30天首發權益,滿足年輕使用者的個性化聽歌需求;另一方面,騰訊音樂的內容製作能力持續提升,如由TME製作家工作室、肖戰工作室聯合出品的中秋主題曲《歲歲年年》上線後迅速登上全球17個國家及地區榜單。此外,騰訊音樂聯合出品的多首歌曲登上2026年總台春晚並迅速走紅,充分體現出其差異化自制內容獲得使用者與市場的高度認可。在豐富曲庫內容基礎上,騰訊音樂以音樂為核心,深化更廣泛的戰略藝人合作,加速拓展線下演出、周邊商品、歌曲宣推等多元內容服務,助力藝人影響力提升、進一步釋放IP價值。在演出領域,騰訊音樂成功舉辦多場旗艦級線下演出,如為G-DRAGON權志龍舉辦2025年大型巡演,其中第四季度在台北大巨蛋的兩場演出觀演人數超7.5萬,彰顯了平台成熟專業的大型演出操盤能力。此外,騰訊音樂持續創新藝人周邊商品,與歐美頭部藝人Ed Sheeran合作,為其新專輯《Play》打造KIT版本;並圍繞實體發行推出周邊藏品,包括虞書欣典藏版實體專輯《Spicy Honey》,以及張藝興、鹿晗等藝人的巡演相關商品,滿足樂迷收藏需求,引領音樂消費熱潮。憑藉高效能的音樂宣發服務,騰訊音樂助推林俊傑《明日坐標》、劉德華《非凡》、張傑《暴風少年》、周深《十年之約》等多首品牌主題曲登頂各大音樂榜單,助力品牌實現更廣泛使用者觸達,同時強化了品牌與使用者之間的情感聯結。內容生態優勢持續鞏固的同時,騰訊音樂創新打造全方位、多層次、以使用者為中心的平台服務與、酷我音樂、全民K歌、波點音樂、酷狗概念版等多元平台矩陣,廣泛滿足不同使用者群體的差異化需求。此外,音樂應用的全新社交功能激發更多使用者的參與熱情,如QQ音樂上線Weverse DM,引入HYBE等廠牌旗下約170位藝人,有效增進藝人與樂迷的連結與互動。為滿足更多高價值使用者的深層次音樂消費需求,騰訊音樂推出更加優質獨特的新權益,如QQ音樂2026超級巔峰之夜與《音樂緣計畫2》年度盛典的優先購票套餐,以及高品質音質音效、個性化裝扮等其他專屬功能,有效驅動超級會員的留存與轉化,其超級會員使用者數量在2025年底突破2000萬,創下新里程碑。騰訊音樂積極推動AI技術升級,並將其深度應用於產業鏈各環節,為音樂創作與消費帶來新體驗。在創作領域,騰訊音樂的一站式AI音樂製作平台已賦能超過15萬名音樂人及逾1000萬普通使用者,大幅提升創作效率。在分發與消費環節,騰訊音樂與騰訊生態深化合作,將元寶接入QQ音樂,最佳化音樂推薦效率、更好滿足使用者個性化需求。此外,QQ音樂的AI Agent依託元寶升級為系統級中樞,不僅能通過自然語言指令實現歌曲智能推薦與發現,還能直達數字專輯、周邊商品購買場景,有效促進消費轉化。第四季度及全年,騰訊音樂內容與平台“一體兩翼”戰略成效顯著,通過拓展多元化音樂服務,建構充滿活力的優質內容生態,並不斷創新平台功能與服務,聚焦AI賦能音樂創作與消費體驗,進一步打造差異化的一站式音樂服務平台,推動線上音樂業務多元增長,也印證了騰訊音樂在複雜多變的行業演進中持續發揮核心優勢,實現確定性的穩健發展。未來,騰訊音樂將繼續攜手行業夥伴,為使用者、藝人和行業創造長期可持續價值。 (TechWeb)
字節跳動,跑出一匹音樂黑馬
低價引客,演算法留人。字節跳動旗下汽水音樂,已成國內第四大音樂平台。2月中旬,QuestMobile發佈資料稱,截至2025年1月底,汽水音樂月活使用者數已近1.4億,離第三名網易雲音樂只差約700萬。其在春節期間也長袖善舞,聯動各方。在小年夜,汽水音樂冠名湖南春晚,黃明昊、王玉雯等年輕藝人,演繹《拜託拜託》《冬至線》等歌曲;還向車機端發力,給小鵬、長安車主送SVIP會員權益。該平台於2022年推出,祭出演算法和低價武器,突圍成功。“汽水音樂如果想進一步突破,要借平台原創神曲之力,形成別處沒有的關鍵音樂,才能改變格局。”網際網路產業分析師張書樂告訴《21CBR》記者。1背靠大樹汽水音樂和抖音,聯絡緊密。其Logo是一個綠色音符,形似抖音的黑色音符;互動方面,使用者上下滑動,如同刷抖音,音樂自動推送。兩家資料互通,使用者只需要登錄抖音帳號,就可以將自己的抖音歌單、播放歷史等同步到汽水音樂。兩家平台的推薦演算法,都由抖音音樂團隊負責。依託字節系強大演算法,汽水音樂打造“歌找人”模式,提供45種聽歌場景,涵蓋圖書館、歐美、摸魚、民謠、洗澡、深夜EMO等,從曲風、樂器、場景、心情裡,捕捉使用者偏好。“抖音的核心功能是短影片,音樂通常作為視訊的背景或主角之一;汽水音樂則專注於音樂的推薦和播放。”平台解釋兩者區別。背靠日活超6億的抖音,汽水音樂在串流媒體音樂賽道,一路狂飆。QuestMobile資料顯示,截至2025年6月,汽水音樂82%的流量,來源於抖音App。舉個例子,使用者在抖音刷到短影片背景音樂時,可以一鍵跳轉至汽水音樂收聽全曲。演算法之外,“低價”是另一利器。記者打開汽水音樂App,即可免費領取1天VIP,持續登錄可體驗一月會員權益,連續包年僅需88元。這個價格,約為QQ音樂會員綠鑽158元/年、網易雲音樂黑膠VIP 158元/年的一半。該平台還推出了看廣告免費聽歌的模式,迅速收割價格敏感型使用者。截至2025年11月底,汽水音樂日活(DAU)達4431萬,僅次於酷狗音樂和QQ音樂,超越網易雲音樂。“免費能讓平台崛起,卻不能制霸音樂市場,場景突圍,是線上音樂平台的頭號難題。”張書樂解釋。2長於發行新歌冷啟,一直是困擾音樂人的難題。過去,新歌宣發依賴唱片公司、電視綜藝等資源,新人若沒有資本或人脈加持,很難獲得推廣機會。短影片平台,再造分發流程,抖音通過卡點、變裝等方式,讓歌曲繫結情緒與畫面,推動音樂出圈。以王霏霏的《TOOOOOBUSY》歌曲為例,其在抖音發佈後,結合“去班味兒”舞蹈挑戰,一炮而紅。歌曲《大展鴻圖》也憑藉抖音短影片走紅,經“不齊舞團”改編成舞曲後,成為全球現象級熱曲。音樂人攬佬,也超越周杰倫,成為spotify2025年7月聽眾數最高的華語歌手。資料顯示,汽水音樂TOP1000熱歌中,86%生長於抖音,54%從抖音冷啟動爆火。2月21日,汽水音樂熱歌榜單前五名,分別為《小半》《詠春》《水手》《海嶼你》《雨愛》,均為抖音熱曲。其中,《小半》由陳粒創作,這首2016年發行的老歌,於2026年初在抖音翻紅,被大量翻唱和二創,成為失戀自癒類視訊的“御用BGM”。抖音再將流量導至汽水音樂,使熱曲獲得“單曲循環”的長尾生命力。與傳統巨頭相比,汽水音樂的短板,是曲庫。其坐擁千萬首歌,主要是抖音熱歌和小眾音樂,尚未將周杰倫等頭部歌手的歌曲版權收入囊中。比如,其只有周杰倫歌曲的MV版權,使用者無法收聽全曲。部分經典老歌,由博主翻唱,存在版權風險。“老牌線上音樂平台握有頭部音樂版權,這是其獲取付費使用者的關鍵。”張書樂分析,汽水音樂難獲付費意願最高的頭部曲目。3抓緊補課汽水音樂一邊買版權,一邊挖掘優質原創歌曲。2025年3月,其攜手抖音,與摩登天空達成版權合作。摩登天空實力不俗,製作並行行專輯超過500張,涵蓋新褲子、重塑雕像的權利、二手玫瑰等樂隊,擁有數千首版權歌曲,包括《你要跳舞嗎》《沒有理想的人不傷心》等經典曲目。此外,汽水音樂逐步與三大唱片公司——環球、索尼、華納等達成合作,拓展主流版權,目前曲庫規模約為5000萬首。對比來看,騰訊音樂曲庫超2.6億首,覆蓋95%以上華語熱門曲目;網易雲音樂曲庫約1.6億首,匯聚超77萬名獨立音樂人。“在經典曲目、頭部藝人版權方面,汽水音樂存在明顯差距。”中信建投研報評價。該平台還推出“看見音樂計畫”,投入25億流量,助力原創音樂發展,如新歌推廣、音樂人曝光等。汽水音樂挖掘了一批潛力音樂人,比如北大的復古流行樂隊ZaZaZsu,其歌曲《愛河》,上線兩個月即達成超100萬播放。線下音樂節,也成為關鍵落子。2025年,海口、昆明、杭州、上海等城市,辦起汽水音樂節活動。“線下音樂會,可以收穫一些原唱歌曲,但這不是平台獨有,友商早就在嘗試,效果一般。”張書樂告訴《21CBR》記者,靠原始方法慢慢攢歌,太慢太難。背靠抖音的澎湃流量和造星能力,汽水音樂撕開一道裂縫,要想更上一層樓,挺進前三,得拓展版權。 (21世紀商業評論)
Google發佈Lyria 3 AI音樂模型,Gemini一鍵生成30秒高保真歌曲
Google旗下DeepMind發佈了最新AI音樂生成模型Lyria 3,該模型已率先整合至Gemini桌面端應用,未來幾日將逐步登陸移動端,面向全球18歲及以上使用者免費開放。據悉,作為Lyria系列模型的重大升級版本,Lyria 3支援通過文字、圖片、視訊等多模態輸入生成原創音樂,進一步降低了音樂創作的專業門檻,同時聯動YouTube生態,為內容創作者提供全新工具。根據官方介紹,Lyria 3相較於前代模型實現了三大核心升級。首先,該模型支援自動生成歌詞,使用者無需自行撰寫,只需通過提示詞描述音樂的主題、風格或情緒,模型便可自動創作匹配的歌詞與旋律。其次,使用者可實現更精細的創作控制,通過提示詞精準指定曲風、人聲類型、節奏速度等音樂元素。此外,Lyria 3生成的音軌在樂器層次、人聲真實感和音樂結構上均有顯著提升,音質更接近專業製作水準,打破了前代模型輸出內容相對單薄的侷限。在使用場景與操作便捷性上,使用者只需打開Gemini應用,在“工具”下拉菜單中找到帶有音符圖示的“音樂”選項,即可啟動創作功能,Google同步發佈的Lyria 3提示詞指南,可幫助使用者快速上手。此外,Lyria 3不僅整合於Gemini應用,還同步接入了YouTube的Dream Track功能,助力短影片創作者為Shorts生成定製化背景音樂,該功能此前僅面向美國使用者,此次隨Lyria 3的發佈向全球擴展。此外,開發者可通過Google Cloud上的Vertex AI API使用Lyria模型(當前API版本為lyria-002),以程式設計方式生成音樂,適配視訊配樂、廣告創作、遊戲音效製作等商業場景。使用權限方面,Lyria 3目前支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語8種語言,後續將逐步增加更多語言支援。所有18歲及以上的Gemini使用者均可免費使用該功能,而訂閱Google AI Plus、AI Ultra等付費服務的使用者,將享有更高的音樂生成額度,具體額度Google暫未明確披露。 (TechWeb)
Google Lyria 3(AI音樂生成模型)發佈 + AI 音樂模型對比
Google DeepMind 推出的 Lyria 3 (2.19發佈)是其目前最先進的 AI 音樂生成模型,已正式整合進 Gemini 應用程式中。與之前的版本相比,它不再僅僅是實驗性質,而是成為了一個功能齊全的創意工具,字、圖片、視訊都能秒變音樂。Lyria 3 的功能細節非常豐富,它不僅是一個“文字轉音樂”的工具,更是一個深度整合的多模態創作引擎。以下是根據最新技術文件整理的具體功能細節:1. 多模態輸入(Multimodal Inputs)Lyria 3 最強大的地方在於它能“看圖/視訊說話”:圖像轉音樂: 你可以上傳一張日落、聚會或寵物的照片,Lyria 3 會分析照片的色彩、氛圍和主體,生成一段情緒契合的背景音樂。視訊轉音樂: 支援上傳視訊短片,模型會捕捉視訊的節奏感(如剪輯點或動作頻率)來合成配樂。跨媒介觸發: 你甚至可以把一封“入職歡迎郵件”或一段“冷笑話”作為提示,它會將其轉化為一段充滿幽默感或職業感的音樂短片。2. 音樂控制與生成參數對於有進階需求的使用者,Lyria 3 提供了更專業的調節維度:時長與格式: 生成音軌的標準長度為 30 秒(在 Vertex AI 專業版中可精確到 32.8 秒),輸出格式為高品質的 48kHz WAV 檔案。負向提示詞 (Negative Prompting): 你可以明確要求“不要人聲”、“不要電子合成器”或“避開憂鬱的情緒”,以精準排除不需要的元素。種子值 (Seed): 支援設定 Seed 值,這意味著如果你對某次生成的旋律很滿意,可以固定 Seed 並微調提示詞,從而實現可重複、可迭代的創作。自動歌詞與演唱: 相比 Lyria 2 隻能生成純音樂,Lyria 3 可以根據主題自動編寫歌詞,並以極其自然的人聲(支援多種語言)演唱出來。3. 全自動化配套功能視覺包裝: 每次生成音樂時,系統會呼叫 Nano Banana 圖像模型,同步生成一張風格統一的自訂專輯封面圖。即時“即興” (Lyria RealTime): 通過 API,Lyria 3 具備低延遲的“即興演奏”能力,能像樂隊樂手一樣根據你不斷輸入的指令即時改變正在播放的音樂(如改變 BPM 或增加樂器密度)。4. 內容安全與識別SynthID 數字水印: 這是 Google 的核心技術,在音訊頻譜中嵌入人耳聽不到、但演算法可識別的水印。即使經過壓縮、剪輯,仍能追溯其為 AI 生成。版權過濾: 內建了嚴格的過濾器。如果你要求“創作一段像周杰倫風格的歌”,它會生成具有“華語流行/鋼琴”特徵的原創樂曲,而不會直接挪用其受版權保護的旋律或音色。相比於目前市面上主流的 AI 音樂模型(如 Suno 和 Udio),Google 的 Lyria 3(及其背後的 Lyria 系列架構)走的是一條完全不同的道路。如果說 Suno 和 Udio 是“AI 唱片公司”,那麼 Lyria 3 更像是“AI 創意副駕駛”。以下是 Lyria 3 的核心優勢對比:1. 真正的“多模態”理解力Suno/Udio: 主要依賴文字(Text-to-Audio)。雖然現在也支援音訊上傳(Audio Upload),但大多是作為旋律參考。Lyria 3 的優勢: 它深度整合了 Google 的視覺能力。你可以直接上傳照片或視訊,它能自動“讀懂”畫面裡的情緒、節奏和場景,並生成匹配的 BGM。這種“視覺到音樂”的直覺化創作是其他模型目前難以比擬的。2. 創作的“可互動性”與“精準度”Suno/Udio: 傾向於“抽卡式”生成。你輸入一段話,它給你 2-4 分鐘的完整歌曲。如果你不喜歡某一部分,修改起來相對死板(儘管 Udio 的 Inpainting 局部重繪功能正在改善這一點)。Lyria 3 的優勢: 強調即時性與細粒度控制。它可以根據你的指令即時調整樂器密度或節奏 (BPM)。它可以處理複雜的指令,比如“在 15 秒處加入一段激昂的鼓點,同時保持人聲的輕柔”,這在專業音訊製作中更具實用價值。3. 版權與合規性的“國家隊”標準Suno/Udio: 目前正面臨大型唱片公司的侵權訴訟(如索尼、環球等),因為它們的訓練資料被質疑包含大量版權音源,且有時會生成與知名歌手極度相似的聲音。Lyria 3 的優勢: * 合法授權: Google 與 YouTube 旗下的眾多藝術家(如 Charlie Puth、T-Pain 等)達成了直接合作,通過 Dream Track 功能合法使用他們的聲線特徵。強制水印: 內建 SynthID。這讓 Lyria 3 生成的內容在專業分發管道(如廣播、商業廣告)中更具安全性,因為它的身份是可追溯、可審計的。4. 生態系統的整合Suno/Udio: 獨立平台。生成的音樂需要你手動下載,再匯入剪輯軟體。Lyria 3 的優勢: 它是 Gemini 全家桶 的一部分。你可以先讓 Gemini 寫詩,然後一鍵轉為歌詞,再由 Lyria 生成音樂,最後由 Nano Banana 生成封面。它與 YouTube Shorts 無縫銜接,創作者可以直接在視訊編輯流中生成專屬配樂。出路在那裡?大部分使用者不關心大模型,使用者只關好用不好用。圖形圖像裡面的例子,美圖秀秀,或者剪映等產品,使用者並不會關心底層的大模型到底是不是自研發或者套殼其他家,只需要好用就行。做好應用層,滿足不同類型使用者的需求。給專業的使用者,做生產力工具,基於這個工具能賺到錢。給大眾使用者,做玩具,和AI修圖一樣的可以簡單做出來一些好玩,可以拿出來炫耀的東西。 (出海流量玄學研究)
拍照就能出歌!GoogleGemini攜Lyria 3殺進AI音樂圈,7.5億使用者免費玩,Suno們慌了?
想給朋友圈的日常片段配一首專屬BGM,卻苦於不會寫詞編曲;想給朋友的生日準備一首定製祝福歌,卻連簡譜都認不全;想給自家貓咪的曬太陽日常配一首慵懶小曲,翻遍版權庫都找不到合心意的旋律——這些普通人的小遺憾,如今被Google一出手就徹底解決了。2026年2月18日,Google正式在Gemini中上線了旗下DeepMind研發的最新AI音樂生成模型Lyria 3,直接把AI音樂創作的門檻踩到了泥土裡。從文字、圖片、視訊到音樂,Gemini終於補齊了多模態創作的最後一塊拼圖,而這一次,Google直接把AI音樂從「小眾發燒友的工具」,變成了7.5億月活使用者人人能玩的「大眾玩具」,也讓此前在AI音樂賽道風頭無兩的Suno、Udio們,瞬間感受到了刺骨的寒意。Lyria 3最動人的地方,不是冰冷的參數升級,而是把「創作一首歌」這件事,變得比發朋友圈還要簡單。Google為普通使用者準備了三種零門檻玩法,網頁端今天就能上手,手機端也將在幾天內完成推送。最基礎的文字生成音樂,徹底解放了普通人的創作欲。你不用懂樂理,不用寫歌詞,那怕只是隨口說一句「寫一首搞笑的90年代R&B慢板情歌,主題是一隻襪子終於找到了它的另一半」,或是「給媽媽做一首非洲鼓點的歡快歌曲,紀念小時候她給我做的烤大蕉」,Gemini都能在30秒內,給你交出一首完整的成品——有量身定製的歌詞,有貼合情緒的演唱,有層次豐富的編曲,甚至連歌曲封面,都會由Nano Banana Pro模型自動生成,直接就能下載分享。更讓人驚喜的是圖片與視訊生成音樂,這也是Google甩開一眾競品的王牌能力。你只需要上傳一張照片、一段視訊,Gemini就會自動分析畫面裡的內容、情緒與故事,自動填詞譜曲。貓咪窩在陽台曬太陽的照片,能生成一首慵懶鬆弛的爵士小曲;戶外徒步的風景視訊,能生成一首開闊治癒的民謠;甚至是朋友聚會的搞怪合照,也能變成一首歡快熱鬧的流行歌。不用你絞盡腦汁寫提示詞,畫面本身,就是最好的創作靈感。那怕你完全沒有創作靈感,Google也準備了現成的範本與動態建議,從lo-fi節拍、拉丁流行到可愛金屬樂,幾十種風格任選,改一改細節就能生成屬於自己的歌,真正做到了「人人都能當30秒的音樂家」。相比前代模型,Lyria 3的升級堪稱脫胎換骨。此前的Lyria模型,還需要使用者自己提供歌詞,而現在,從歌詞創作、編曲譜曲到人聲演唱、封面製作,全流程一步到位。使用者還能對音樂風格、人聲特點、節奏快慢等核心元素進行精細調整,生成的曲目也擁有了更真實的聽感、更複雜的編曲結構,徹底擺脫了早期AI音樂的生硬感。更關鍵的是,Google從一開始就避開了AI音樂行業最大的雷區——版權爭議。此前Suno、Udio都曾被三大唱片巨頭告上法庭,關於訓練資料版權、藝術家聲音模仿的爭議從未停歇。而Google給出了一套更周全的解決方案:Lyria 3從底層就定位於「原創表達」,而非模仿現有藝術家。即便你在提示詞裡提到了某個歌手的名字,它也只會將其作為寬泛的風格參考,而非直接復刻其聲音與作品。同時,所有用Lyria 3生成的曲目,都會嵌入Google的SynthID隱形水印,既不會影響聽感,又能精準識別音訊是否為GoogleAI生成。Gemini也同步上線了音訊驗證功能,你只需上傳一段音訊,就能快速確認它是否出自Google的AI工具,這套此前已經在圖片、視訊領域成熟應用的技術,如今補上了音訊領域的最後一塊短板。Google還設定了內容過濾機制與侵權舉報通道,儘可能降低版權風險,這份穩妥,也是初創玩家難以比擬的優勢。很多人會問,Lyria 3隻能生成30秒的曲目,比起能生成完整歌曲的Suno、Udio,是不是根本不夠打?但恰恰是這個30秒的限制,藏著Google最精準的野心。Google從一開始就沒打算把Lyria 3做成專業音樂人的生產力工具,它瞄準的,是7.5億普通使用者的日常表達需求——朋友圈的配樂、短影片的BGM、給朋友的祝福小歌、記錄日常的小趣味,這些場景,30秒剛剛好。專業音樂市場終究是小眾的,而普通人的日常創意表達,才是真正的兆級市場。更別說Google還手握YouTube這個全球最大的短影片平台,隨著Lyria 3的上線,此前僅對美國使用者開放的YouTube Dream Track功能,也正式開啟全球推送。短影片創作者可以直接用Lyria 3,根據視訊內容生成專屬的原創配樂,不管是帶歌詞的演唱段落,還是純器樂的背景音,都能一鍵搞定,徹底告別了公共版權庫的同質化與版權風險,直接打通了「創作-生成-發佈」的完整閉環。這才是Suno、Udio們真正需要緊張的地方。它們還在卷「誰能生成更長、更專業的歌曲」,而Google直接換了賽道,用7.5億的海量使用者、零門檻的多模態創作能力、完整的內容生態,把AI音樂的全民化大門徹底推開了。當普通人拍張照就能免費生成一首專屬歌曲,當AI音樂從「需要特意學習的工具」變成「隨手就能用的日常功能」,賽道的遊戲規則,已經被Google徹底改寫。目前Lyria 3已經支援英語、德語、日語等8種語言,雖然暫不支援中文,但Google已經明確表示後續會擴展更多語言。可以預見的是,隨著Google的入場,AI音樂再也不是小眾圈子的狂歡,屬於每一個普通人的音樂創作時代,真的來了。(AI時代潮)
GoogleLyria 3凌晨突發!照片秒變30秒神曲,音樂圈的飯碗要被端了
今天凌晨,Google重磅發佈音樂模型 Lyria 3,並且直接整合在 Gemini 裡,未來幾天全球使用者全員開放,這回是真·人均音樂人了。Lyria 3這次最狠的地方在於,不只是能理解文字,你甩一張照片或者一段視訊過去,就能給你整出一首 30秒的配樂。音樂的多模態理解力,真的太驚豔了。用過之前Lyria系列模型的能明顯感覺到,這次的Lyria 3在音訊生成上直接拉滿了,核心就三個大升級,每一個都踩在創作者的需求上。首先是不用自己絞盡腦汁寫歌詞了,模型會順著你的提示自動編出適配的歌詞,徹底告別詞窮的煩惱。創作的掌控感變高了,不管是音樂風格還是人聲、節奏這些細節,都能按照自己的想法調,想做溫柔的慢歌還是炸場的快節奏都可以。最後就是做出來的曲子質感更棒了,不僅聽著更真實,編曲的複雜度也上去了,不再是那種單薄的簡單旋律,整體的音樂性提升特別多。Lyria 3生成的玩法也更多了:第一種是文字生成音樂,你只要把自己想要的感覺說清楚就行。比如具體的音樂流派、當下的心情,甚至是一段專屬的小回憶、小玩笑,模型都能接住,做出來的曲子要麼帶歌詞要麼純器樂,完全貼合你想要的心境。你想給媽媽做首歌,懷念小時候一起的時光,指定做成歡快的非洲節拍曲風,模型都能精準還原這份心意。第二種玩法更高效,可以用圖片或者視訊直接生成音樂。你把素材傳上去,Gemini 會先讀懂內容的氛圍,再順著這個感覺作曲寫歌詞,相當於給你的畫面量身打造專屬BGM。比如你傳了狗狗在林間徒步的照片,模型就能圍繞這個場景做出一首溫馨的小曲子,氛圍感直接拉滿。並且生成的 30 秒音樂片段,還會自動配一張專屬封面圖,這是由 Nano Banana 模型做的,不用自己額外費心設計。如果你是YT創作者,這個技術其實並不陌生。Dream Track功能裡早就用上了類似的技術,現在Lyria 3進駐YT。意味著做Shorts 短影片的時候,配樂的質量和定製化程度又上了一個台階,再也不用擔心版權問題或者找不到合適的背景音樂了。Google這次還考慮到了AI內容的識別問題,給Lyria 3生成的音樂都加了專屬的隱形水印 SynthID,這是Google自己研發的技術,專門用來標記自家AI生成的內容,肉眼聽感都察覺不到,但能精準溯源。並且Gemini的驗證功能也升級了,之前只能識別圖像和視訊的AI內容,現在音訊也能查了,你只要把音訊檔案傳上去,問一句是不是GoogleAI做的。模型就會先檢測裡面的SynthID水印,再結合自己的推理給出答案,不管是自己驗證還是分辨別人的內容,都特別方便。關於版權和原創性,大家肯定很關心。其實從 2023 年第一款 Lyria 模型出來,Google就一直在和音樂行業的各方合作,踏踏實實做技術研發,不是瞎搞的那種。中間還做了音樂人工智慧沙盒這類實驗項目,攢了不少經驗,這次訓練 Lyria 3,更是把版權規定和合作協議摳得很細,一點都不馬虎。這個模型的核心是鼓勵原創,不是讓大家去模仿現有的歌手藝人。就算你在提示裡提到了某個特定的藝術家,模型也只會把這個名字當成創作靈感,做出來的曲子只會在風格或者情緒上相近,不會照搬人家的作品。同時Google還加了過濾機制,會把生成的內容和現有的音樂作品做比對,避免出現雷同的情況。目前這個功能已經開始向部分使用者開放了,支援的語言不少,英語、德語、法語等。桌面端現在就能用,手機端隨後幾天也會跟上。如果你是付費訂閱使用者,還能享受更高的生成額度。對於這個重磅新模型,網友表示,這樣一來,創作者就不用再使用素材網站上那些被用濫了的免版稅音樂,而是能為視訊配上專屬定製的背景音樂。背景音樂對視訊的整體氛圍影響太大了!真的很開心看到AI能這樣突破創意的邊界!那些能把文字、圖片等想法直接轉化成音樂的工具,徹底改變了創作者嘗試和迭代的方式。GoogleAI帶來的這些成果,真的太令人興奮了。照片轉音樂提示功能太棒了,光是這一點就開啟了許多創意工作流程。這是生成式音訊技術的一次驚人飛躍。音質已經非常出色,但如果能實現原生3分鐘音訊生成,那將真正徹底改變音訊製作流程。期待擴展上下文窗口。 (經管之家)