OpenAI被曝打造“文本+音频提示”生成式音乐工具:与茱莉亚音乐学院合作标注在内,产品形态仍待定
据外媒消息,OpenAI 正推进一款生成式音乐工具,可基于文本与音频提示创作音乐,用途包括为视频自动配乐或为清唱加乐器伴奏;知情人士称团队正与茱莉亚音乐学院部分学生合作进行乐谱标注以完善训练数据,但发布时间与产品形态(独立应用,抑或与 ChatGPT/Sora 深度整合)尚未确定。若该项目落地,将延续 OpenAI 在音频方向的技术路径——从 2020 年的 Jukebox 到如今 Whisper 与 GPT-4o/Voice Engine 的语音转写与实时多模态交互——在“理解—合成—编排”链路上进一步提升创作与制作效率;在市场侧,Google/DeepMind(Lyria)与 Suno/Udio 等已形成先发梯队,但也面临训练数据许可、声音/曲风仿真边界与分润机制等合规挑战,OpenAI 的优势在于模型能力与分发入口,关键仍取决于版权授权与安全策略如何设计,以及能否率先把生成能力稳定嵌入创作者与视频工作流的日常使用中。
支持率>95%