IndexTTS-2.0 B站开源的情感与时长可控文本转语音模型 IndexTTS-2.0 是哔哩哔哩开源的全球首个支持情感与时长双重控制的自回归零样本文本转语音系统,专为高质量AI配音与跨语言内容本地化打造。
MiniMax Speech-02 新一代语音合成技术的突破 MiniMax 稀宇极智推出的新一代文本转语音(TTS)模型,凭借其卓越的语音克隆能力、高质量的语音合成以及广泛的语言支持,成为当前语音合成领域的前沿技术。
GPT-Realtime 开启语音交互新时代 GPT-Realtime是OpenAI推出的一款强大的语音到语音模型,采用端到端Speech-to-Speech架构,能够直接生成并处理语音,省去常规的文本转换步骤,广泛应用于多种语音交互场景。
昆仑万维 Matrix-Game 2.0 开启开源世界模型新纪元 Matrix - Game 2.0 是昆仑万维发布的开源世界模型,旨在推动人工智能在复杂环境中的决策能力,为研究人员和开发者提供强大的工具和平台,助力人工智能技术的创新与发展。