Xiaomi-MiMo-Audio 小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio 是小米开源的首个原生端到端语音大模型,基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于 ICL 的少样本泛化。 0260 语音大模型
Copilot Audio 微软推出的个性化AI语音生成工具 Copilot Audio 是微软基于自研 MAI-Voice-1 模型推出的全新音频模式,支持情感、故事、脚本三种语音风格,带来更具表现力和沉浸感的语音交互体验。 0260 文字转语音(配音播报)语音大模型
Maya1 实时、富有表现力的文本转语音开源模型 Maya1 是一款 30 亿参数的开源实时文本转语音模型,可仅凭单张 GPU 生成高表现力、多情感的自然语音。 0260 文字转语音(配音播报)语音大模型
Hume AI Voice Conversion 一次录音即可把“声音灵魂”完整移植到任意目标声线 Hume AI Voice Conversion:一次录音即可把“声音灵魂”完整移植到任意目标声线,实现带情感的跨语言、跨性别、跨风格语音转换。 0250 变声克隆文字转语音(配音播报)