热门

MiniMax

3个月前发布 52 0 0

Speech 2.6 语音合成引擎 MiniMax Speech 2.6 是 MiniMax 推出的超低延迟、可一键复刻任意音色的实时语音合成引擎，让机器开口“像人”一样自然。

收录时间：

2026-02-14

打开网站手机查看

语音大模型

MiniMax

MiniMax

Speech 2.6 语音合成引擎 MiniMax Speech 2.6 是 MiniMax 推出的超低延迟、可一键复刻任意音色的实时语音合成引擎，让机器开口“像人”一样自然。

数据统计

相关导航

SoulX-Podcast语音模型

SoulX-Podcast语音模型

SoulX-Podcast是Soul推出的超长时长、高保真多语言AI播客生成引擎，可一键产出90分钟无中断、媲美真人录音的播客节目。

豆包语音识别模型2.0（Doubao-Seed-ASR-2.0）

豆包语音识别模型2.0（Doubao-Seed-ASR-2.0）

火山引擎推出的新一代多语种语音识别引擎，在复杂场景下实现更高精度与更强推理能力。

阶跃星辰Step-Audio2mini

阶跃星辰Step-Audio2mini

最强开源端到端语音大模型阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型，能够实现语音理解、音频推理与生成的统一建模。

阿里通义

Fun-Audio-Chat-8B 开源语音交互大模型 Fun-Audio-Chat-8B 是阿里巴巴通义实验室开源的新一代端到端语音交互大模型，以双分辨率语音表征架构实现超低延迟与近 50% GPU 资源节省，兼具情感感知、语音指令执行、全双工交互等核心能力，性能逼近 GPT-4o Audio 与 Gemini 2.5 Pro，推动开源语音 AI 进入实用化新阶段。

Finevoice AI

轻松创建您想象中的声音 FineVoice是由Fineshare推出的多功能AI语音工具，集成了实时变声、语音克隆、文本转语音、语音转文本及AI音效生成等功能，支持149种语言和1000多种AI声音模型，让用户无需专业设备即可创作出专业级配音内容。

小红书FireRedTTS-2

小红书FireRedTTS-2

新一代对话合成模型 FireRedTTS-2 是小红书智创音频技术团队推出的新一代对话合成模型，可实现灵活的逐句生成和高质量的语音合成。

Maya1

实时、富有表现力的文本转语音开源模型 Maya1 是一款 30 亿参数的开源实时文本转语音模型，可仅凭单张 GPU 生成高表现力、多情感的自然语音。

科大讯飞星火同传语音大模型

国内首个具备端到端语音同传能力的大模型，其同传速度与精度直逼人类专家。

暂无评论

none

暂无评论...