MiniMax Speech 2.6 语音合成引擎 MiniMax Speech 2.6 是 MiniMax 推出的超低延迟、可一键复刻任意音色的实时语音合成引擎,让机器开口“像人”一样自然。 0520 语音大模型
Xiaomi-MiMo-Audio 小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio 是小米开源的首个原生端到端语音大模型,基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于 ICL 的少样本泛化。 0510 语音大模型
阿里 Qwen3-TTS 登场 49 种音色 + 10 语言 9 方言,WER 碾压主流商用模型 Qwen3-TTS 是阿里巴巴推出的零样本多角色跨语言语音合成引擎,一句话就能克隆任意音色并流畅朗读多语种文本。 0500 语音大模型# 多方言# 多角色# 教育配音