新Meta SAM Audio 全球首个多模态音频分离模型 SAM Audio 是 Meta 发布的全球首个支持 “点击分离声音” 的多模态音频基础模型,能够通过文本、视觉或时间片段提示,从复杂音频混合物中一键提取目标声音。
新MiniMax Speech-02 新一代语音合成技术的突破 MiniMax 稀宇极智推出的新一代文本转语音(TTS)模型,凭借其卓越的语音克隆能力、高质量的语音合成以及广泛的语言支持,成为当前语音合成领域的前沿技术。