#AI音樂生成模型
2025/03/12
•
10秒生成4分鐘音樂,8GB視訊記憶體就能跑!已登Hugging Face趨勢榜一
DiffRhythm是一款新型AI音樂生成模型,能在10秒內生成長達4分45秒的完整歌曲,包含人聲和伴奏。它採用簡單高效的全diffusion架構,僅需歌詞和風格提示即可創作,還支援本地部署,最低只需8G視訊記憶體。 音樂創作,尤其是完整歌曲的生成,一直是人工智慧領域的一大挑戰。 Suno、Udio等商用音樂生成大模型展現出驚人的音樂生成能力。但現有開放原始碼的音樂生成模型要麼只能生成人聲或伴奏,要麼依賴複雜的多階段架構,難以擴展到長音訊生成。 而現在,AI音樂破局時刻到了!