柠檬AI
  • AI提示词
    • AI提示词

    语音大模型

    共 19 篇网址
    测试用网址目录常用工具提示词AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音(配音播报)语音大模型多模态大模型AI搜索工具学生教师文本生成编程代码图像生成AI 小助手AI 翻译总结摘要文档论文聊天对话辅助写作AI开源项目生物医药科研视频生成AI游戏娱乐休闲API 超市对口型模特生成编辑转换AI 会议AI 办公ExcelPPT公文写作思维导图AI应用开发AI开放平台网站开发语音转文字(语音识别)智能体创建AI插件与浏览器Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康3D与动画AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告AI 学堂文献资料检测查重企业客服金融法律AI 课程字幕水印AI社区协作AI短剧翻译配音简历|招聘|面试AI艺术设计图像编辑AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量AI视频工具AI音频工具虚拟歌手伪造检测MCP资源平台出行旅游AI 机器人AI 自动驾驶体育运动音乐发行AI音乐平台世界模型AI算力平台AI数据集提示词 Prompt脑机接口网络安全
    排序
    发布更新浏览点赞
    Xiaomi-MiMo-Audio

    新Xiaomi-MiMo-Audio

    小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio 是小米开源的首个原生端到端语音大模型,基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于 ICL 的少样本泛化。
    060
    语音大模型
    Infinite Talk

    新Infinite Talk

    无限长度语音视频生成模型 Infinite Talk 是一个由 MeiGen-ai 研发小组开源的数字人项目,能够生成无限长度的视频,具有准确的口型同步和一致的身份保留。
    060
    虚拟数字人视频生成
    MiniMax

    新MiniMax

    Speech 2.6 语音合成引擎 MiniMax Speech 2.6 是 MiniMax 推出的超低延迟、可一键复刻任意音色的实时语音合成引擎,让机器开口“像人”一样自然。
    060
    语音大模型
    阿里 Qwen3-TTS 登场

    新阿里 Qwen3-TTS 登场

    49 种音色 + 10 语言 9 方言,WER 碾压主流商用模型 Qwen3-TTS 是阿里巴巴推出的零样本多角色跨语言语音合成引擎,一句话就能克隆任意音色并流畅朗读多语种文本。
    060
    语音大模型# 多方言# 多角色# 教育配音
    豆包语音识别模型2.0(Doubao-Seed-ASR-2.0)

    新豆包语音识别模型2.0(Doubao-Seed-ASR-2.0)

    火山引擎推出的新一代多语种语音识别引擎,在复杂场景下实现更高精度与更强推理能力。
    060
    多模态大模型语音大模型
    阿里通义

    新阿里通义

    Fun-Audio-Chat-8B 开源语音交互大模型 Fun-Audio-Chat-8B 是阿里巴巴通义实验室开源的新一代端到端语音交互大模型,以双分辨率语音表征架构实现超低延迟与近 50% GPU 资源节省,兼具情感感知、语音指令执行、全双工交互等核心能力,性能逼近 GPT-4o Audio 与 Gemini 2.5 Pro,推动开源语音 AI 进入实用化新阶段。
    060
    语音大模型
    Meta SAM Audio

    新Meta SAM Audio

    全球首个多模态音频分离模型 SAM Audio 是 Meta 发布的全球首个支持 “点击分离声音” 的多模态音频基础模型,能够通过文本、视觉或时间片段提示,从复杂音频混合物中一键提取目标声音。
    060
    人声分离语音大模型# AI 基础模型# 内容创作辅助工具# 多模态 AI 模型
    智谱 AI 输入法

    新智谱 AI 输入法

    桌面端语音转写翻译一站式神器 在 PC 上“动嘴不动手”,即可把语音实时转成文字、翻译、改写,并同步开源 GLM-ASR 模型供开发者二次定制。
    060
    语音大模型
    阶跃星辰Step-Audio2mini

    新阶跃星辰Step-Audio2mini

    最强开源端到端语音大模型 阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型,能够实现语音理解、音频推理与生成的统一建模。
    060
    AI开源项目文字转语音(配音播报)
    科大讯飞星火同传语音大模型

    新科大讯飞星火同传语音大模型

    国内首个具备端到端语音同传能力的大模型,其同传速度与精度直逼人类专家。
    050
    AI 会议AI 办公# 人工智能# 翻译工具# 自然语言处理
    西湖心辰Lingo

    新西湖心辰Lingo

    Lingo语音大模型是西湖心辰推出的具备实时打断和控制能力的超拟人化语音交互系统,旨在重塑沟通的艺术。
    030
    聊天对话语音大模型
    腾讯ARC团队的AudioStory模型

    新腾讯ARC团队的AudioStory模型

    开启AI音频生成新时代 腾讯ARC团队推出的AudioStory模型,能够根据文字描述生成高质量的音频内容,具有强大的叙事能力。
    030
    AI开源项目文字转语音(配音播报)
    小红书FireRedTTS-2

    新小红书FireRedTTS-2

    新一代对话合成模型 FireRedTTS-2 是小红书智创音频技术团队推出的新一代对话合成模型,可实现灵活的逐句生成和高质量的语音合成。
    030
    文字转语音(配音播报)语音大模型# :语音合成# 人工智能# 内容创作
    Stability AI Stable Audio 2.5

    新Stability AI Stable Audio 2.5

    专业级AI音频生成工具 Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,可在几秒内生成高质量、多段落结构的音乐,支持文本转音频、音频修复等多种创作方式。
    030
    文字转语音(配音播报)电商广告
    Copilot Audio

    新Copilot Audio

    微软推出的个性化AI语音生成工具 Copilot Audio 是微软基于自研 MAI-Voice-1 模型推出的全新音频模式,支持情感、故事、脚本三种语音风格,带来更具表现力和沉浸感的语音交互体验。
    030
    文字转语音(配音播报)语音大模型
    加载更多
    柠檬AI
    OneNav 一为导航主题,集网址、资源、资讯于一体的 WordPress 导航主题,简约优雅的设计风格,全面的前端用户功能,简单的模块化配置,欢迎您的体验

    友链申请 免责声明 广告合作 关于我们

    Copyright © 2026 柠檬AI 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍