MaskGCT 零样本语音合成的创新突破 趣丸科技与香港中文大学(深圳)联合研发的开源文本转语音(TTS)模型,能够实现零样本语音合成,无需显式对齐信息和音素级时长预测,支持多种语言和情感控制。 0670 AI开源项目AI短剧
Mistral Voxtral 开源音频模型的新突破 Voxtral 是 Mistral 推出的首个开源音频模型,旨在为企业和开发者提供高性价比的语音智能解决方案。 0650 客服文字转语音(配音播报)# 人工智能# 开源模型# 自然语言处理
Sketch2Sound AI音频工具 哼唱和模仿创建音效 一个可控音频生成模型,能够根据一组可解释的时变控制信号(响度、亮度、音高)和文本提示来创造高质量的声音。 0650 AI开源项目变声克隆# 声音模仿# 文本到音频转换# 音乐制作辅助工具。
出门问问 TicVoice 7.0 开启AI语音合成新时代 高品质TTS(语音合成)引擎,基于新一代语音生成模型Spark-TTS,具备超自然的语音克隆与跨语种生成能力。 0650 企业创作与影视# 人工智能# 内容创作# 影视配音
阶跃星辰Step-Audio2mini 最强开源端到端语音大模型 阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型,能够实现语音理解、音频推理与生成的统一建模。 0650 AI开源项目文字转语音(配音播报)
Stability AI Stable Audio 2.5 专业级AI音频生成工具 Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,可在几秒内生成高质量、多段落结构的音乐,支持文本转音频、音频修复等多种创作方式。 0650 文字转语音(配音播报)电商广告
ElevenLabs AI ElevenLabs 提供了一个先进的 AI 声音生成器,允许用户将文本转换为多种语言的自然语音,未来还会开放其音乐生产平台ElevenLabs music。 0630 AI热门工具变声克隆
Supertone Play 开启个性化语音创作新时代 一款文本转语音工具,能够将输入的文本快速转换为高质量、富有表现力的语音内容。 0620 3D与动画创作与影视# 人工智能工具# 内容创作工具# 文本转语音
腾讯ARC团队的AudioStory模型 开启AI音频生成新时代 腾讯ARC团队推出的AudioStory模型,能够根据文字描述生成高质量的音频内容,具有强大的叙事能力。 0620 AI开源项目文字转语音(配音播报)
IndexTTS-2.0 B站开源的情感与时长可控文本转语音模型 IndexTTS-2.0 是哔哩哔哩开源的全球首个支持情感与时长双重控制的自回归零样本文本转语音系统,专为高质量AI配音与跨语言内容本地化打造。 0610 文字转语音(配音播报)