新Copilot Audio 微软推出的个性化AI语音生成工具 Copilot Audio 是微软基于自研 MAI-Voice-1 模型推出的全新音频模式,支持情感、故事、脚本三种语音风格,带来更具表现力和沉浸感的语音交互体验。
新阿里 Qwen3-TTS 登场 49 种音色 + 10 语言 9 方言,WER 碾压主流商用模型 Qwen3-TTS 是阿里巴巴推出的零样本多角色跨语言语音合成引擎,一句话就能克隆任意音色并流畅朗读多语种文本。
新阿里通义 Fun-Audio-Chat-8B 开源语音交互大模型 Fun-Audio-Chat-8B 是阿里巴巴通义实验室开源的新一代端到端语音交互大模型,以双分辨率语音表征架构实现超低延迟与近 50% GPU 资源节省,兼具情感感知、语音指令执行、全双工交互等核心能力,性能逼近 GPT-4o Audio 与 Gemini 2.5 Pro,推动开源语音 AI 进入实用化新阶段。