
新阿里通义
Fun-Audio-Chat-8B 开源语音交互大模型 Fun-Audio-Chat-8B 是阿里巴巴通义实验室开源的新一代端到端语音交互大模型,以双分辨率语音表征架构实现超低延迟与近 50% GPU 资源节省,兼具情感感知、语音指令执行、全双工交互等核心能力,性能逼近 GPT-4o Audio 与 Gemini 2.5 Pro,推动开源语音 AI 进入实用化新阶段。
桌面端语音转写翻译一站式神器 在 PC 上“动嘴不动手”,即可把语音实时转成文字、翻译、改写,并同步开源 GLM-ASR 模型供开发者二次定制。







