阶跃星辰Step-Audio2mini 最强开源端到端语音大模型 阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型,能够实现语音理解、音频推理与生成的统一建模。 0310 AI开源项目文字转语音(配音播报)
Finevoice AI 轻松创建您想象中的声音 FineVoice是由Fineshare推出的多功能AI语音工具,集成了实时变声、语音克隆、文本转语音、语音转文本及AI音效生成等功能,支持149种语言和1000多种AI声音模型,让用户无需专业设备即可创作出专业级配音内容。 0310 AI热门工具创作与影视
Qwen2-VL Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。 0300 AI开源项目多模态大模型
Mistral Voxtral 开源音频模型的新突破 Voxtral 是 Mistral 推出的首个开源音频模型,旨在为企业和开发者提供高性价比的语音智能解决方案。 0290 客服文字转语音(配音播报)# 人工智能# 开源模型# 自然语言处理
出门问问 TicVoice 7.0 开启AI语音合成新时代 高品质TTS(语音合成)引擎,基于新一代语音生成模型Spark-TTS,具备超自然的语音克隆与跨语种生成能力。 0290 企业创作与影视# 人工智能# 内容创作# 影视配音
腾讯ARC实验室AudioStory技术 开启音频生成新纪元 AudioStory是腾讯ARC实验室推出的一种能够根据文字描述生成高质量音频内容的技术,具有强大的叙事能力。 0290 文字转语音(配音播报)
GPT-Realtime 开启语音交互新时代 GPT-Realtime是OpenAI推出的一款强大的语音到语音模型,采用端到端Speech-to-Speech架构,能够直接生成并处理语音,省去常规的文本转换步骤,广泛应用于多种语音交互场景。 0280 文字转语音(配音播报)语音转文字(语音识别)
IndexTTS-2.0 B站开源的情感与时长可控文本转语音模型 IndexTTS-2.0 是哔哩哔哩开源的全球首个支持情感与时长双重控制的自回归零样本文本转语音系统,专为高质量AI配音与跨语言内容本地化打造。 0280 文字转语音(配音播报)
Stability AI Stable Audio 2.5 专业级AI音频生成工具 Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,可在几秒内生成高质量、多段落结构的音乐,支持文本转音频、音频修复等多种创作方式。 0280 文字转语音(配音播报)电商广告