新Meta SAM Audio 全球首个多模态音频分离模型 SAM Audio 是 Meta 发布的全球首个支持 “点击分离声音” 的多模态音频基础模型,能够通过文本、视觉或时间片段提示,从复杂音频混合物中一键提取目标声音。 060 人声分离语音大模型# AI 基础模型# 内容创作辅助工具# 多模态 AI 模型