热门

Meta SAM Audio

3个月前发布 59 0 0

全球首个多模态音频分离模型 SAM Audio 是 Meta 发布的全球首个支持 “点击分离声音” 的多模态音频基础模型，能够通过文本、视觉或时间片段提示，从复杂音频混合物中一键提取目标声音。

收录时间：

2026-02-14

打开网站手机查看

人声分离语音大模型 # AI 基础模型 # 内容创作辅助工具 # 多模态 AI 模型 # 音频分离工具 # 音频处理工具

Meta SAM Audio

Meta SAM Audio

全球首个多模态音频分离模型 SAM Audio 是 Meta 发布的全球首个支持 “点击分离声音” 的多模态音频基础模型，能够通过文本、视觉或时间片段提示，从复杂音频混合物中一键提取目标声音。

数据统计

相关导航

阶跃星辰Step-Audio2mini

阶跃星辰Step-Audio2mini

最强开源端到端语音大模型阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型，能够实现语音理解、音频推理与生成的统一建模。

Stability AI Stable Audio 2.5

Stability AI Stable Audio 2.5

专业级AI音频生成工具 Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型，可在几秒内生成高质量、多段落结构的音乐，支持文本转音频、音频修复等多种创作方式。

Ultimate

Vocal Remover Ultimate Vocal Remover,uvr免费在线ai人声分离网站,人声提取软件工具神器。

lalal.ai

lalal.ai,啦啦爱音频分离人声和音乐网站。

小红书FireRedTTS-2

小红书FireRedTTS-2

新一代对话合成模型 FireRedTTS-2 是小红书智创音频技术团队推出的新一代对话合成模型，可实现灵活的逐句生成和高质量的语音合成。

MiniMax

Speech 2.6 语音合成引擎 MiniMax Speech 2.6 是 MiniMax 推出的超低延迟、可一键复刻任意音色的实时语音合成引擎，让机器开口“像人”一样自然。

Infinite Talk

无限长度语音视频生成模型 Infinite Talk 是一个由 MeiGen-ai 研发小组开源的数字人项目，能够生成无限长度的视频，具有准确的口型同步和一致的身份保留。

智谱 AI 输入法

桌面端语音转写翻译一站式神器在 PC 上“动嘴不动手”，即可把语音实时转成文字、翻译、改写，并同步开源 GLM-ASR 模型供开发者二次定制。

暂无评论

none

暂无评论...