新商汤如影 让每个人都可以轻松创作令人惊艳的数字人短视频。通过数字人形象定制、声音克隆技术,能够生成出比拟真实人物的外貌、表情、动作和声音,并且通过AI文案功能快速生成企业宣传、网络营销文案,使创作效率得到更进一步的提升。 030 创作与影视变声克隆
新Mistral Voxtral 开源音频模型的新突破 Voxtral 是 Mistral 推出的首个开源音频模型,旨在为企业和开发者提供高性价比的语音智能解决方案。 030 客服文字转语音(配音播报)# 人工智能# 开源模型# 自然语言处理
新DICE-Talk 基于扩散模型的情感化动态头像生成工具 基于扩散模型的情感化动态头像生成方法,能够为说话的肖像生成生动且多样化的情感表达。 020 AI开源项目头像生成# 人工智能# 动态头像生成# 多模态学习
新Sketch2Sound AI音频工具 哼唱和模仿创建音效 一个可控音频生成模型,能够根据一组可解释的时变控制信号(响度、亮度、音高)和文本提示来创造高质量的声音。 060 AI开源项目变声克隆# 声音模仿# 文本到音频转换# 音乐制作辅助工具。
新Supertone Play 开启个性化语音创作新时代 一款文本转语音工具,能够将输入的文本快速转换为高质量、富有表现力的语音内容。 070 3D与动画创作与影视# 人工智能工具# 内容创作工具# 文本转语音
新出门问问 TicVoice 7.0 开启AI语音合成新时代 高品质TTS(语音合成)引擎,基于新一代语音生成模型Spark-TTS,具备超自然的语音克隆与跨语种生成能力。 060 企业创作与影视# 人工智能# 内容创作# 影视配音
新Qwen2-VL Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。 060 AI开源项目多模态大模型
新Deepgram 语音 AI 一个提供语音到文本、文本到语音以及语言理解 API 的语音 AI 平台。它被全球顶尖企业、对话式 AI 领导者和初创公司所信赖,适用于医疗转录到自主代理等多种场景。 050 API 超市文字转语音(配音播报)