AI音乐生成模型DiffRhythm开源引发创作革命
时间:9/1/2025 8:59:00 AM
西北工业大学与香港中文大学联合研发的DiffRhythm模型,以“10秒生成4分45秒完整歌曲”的颠覆性技术引发全球关注。这款全扩散架构的AI工具,只需输入歌词和风格提示(如“电子摇滚”“古风抒情”),即可同步生成人声与伴奏双轨高保真音乐,最低8GB显存的消费级显卡即可本地运行 。其核心突破在于创新性地将歌词按句子拆分并转换为音素序列,通过时间戳映射技术实现人声与歌词的毫秒级精准对齐,即使复杂的电子节拍也无法干扰歌词清晰度 。更值得关注的是,模型通过训练修复MP3压缩损失的高频细节,能将音质受损的旧录音转化为专业级母带效果 。目前,该模型已在Hugging Face平台开源,三个月内被全球12万开发者下载,催生了《赛博敦煌》等融合敦煌壁画元素的实验性作品,被《自然·机器智能》评价为“让每个人都能成为音乐诗人的魔法工具”。