语音转文字（语音识别）

共 23 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

D-ID

Video Translate D-ID Video Translate是一款利用人工智能技术，能够将视频翻译成多种语言的在线服务工具。

0890

AI 翻译字幕水印

讯飞听见

是科大讯飞旗下的一款明星产品，依托于科大讯飞先进的智能语音及语言处理技术，致力于为用户提供高效、便捷的语音交互体验。

0890

AI 会议语音转文字（语音识别）

Voicenotes

智能笔记 Voicenotes 是一款以录音为核心的智能笔记应用程序，它通过先进的人工智能技术，为用户提供了一个方便快捷的记录和搜索语音笔记的平台。

0880

AI 会议 AI 翻译

BibiGPT

AI 音视频助理插件 BibiGPT是一款基于人工智能的视频总结工具，具有广泛的应用范围和强大的功能。支持多种平台，包括哔哩哔哩、YouTube、抖音等，广泛应用于学习助手和内容创作领域。

0860

AI插件与浏览器语音转文字（语音识别）

Elmo

一款在 Chrome 网上应用店提供的浏览器插件扩展程序，它旨在通过人工智能技术帮助用户总结文档内容、问答、翻译、总结视频内容等功能。

0810

AI 翻译 AI插件与浏览器

Fireflies.ai

Fireflies.ai是一个创新平台，它使用AI来转录、总结和分析录制的对话。这个AI助手是一个虚拟笔记器，非常适合捕捉讲座、课堂讨论和小组项目。它与在线学习环境中流行的视频会议工具无缝集成，确保保留每个课程细节。

0780

AI 会议学生

谷歌 Gemini

多模态 AI 模型的革新者谷歌 Gemini 是谷歌推出的新一代多模态 AI 模型，凭借其强大的性能和广泛的应用场景备受关注。

0780

AI应用开发 AI开放平台 # 人工智能 # 多模态处理 # 数据分析

Deepgram

语音 AI 一个提供语音到文本、文本到语音以及语言理解 API 的语音 AI 平台。它被全球顶尖企业、对话式 AI 领导者和初创公司所信赖，适用于医疗转录到自主代理等多种场景。

0760

API 超市文字转语音（配音播报）

Kimi-Audio

开源音频基础模型开源的音频基础模型，擅长音频理解、生成和对话，适用于多种音频处理任务。

0750

AI开源项目文字转语音（配音播报）# 对话系统 # 开源工具 # 语音识别

Supernormal

Supernormal是一款由Suki提供的人工智能会议助手工具，它通过自动化的方式帮助用户更高效地组织、参与和回顾会议。该工具利用先进的AI技术，提供了一系列强大的功能，旨在改善会议体验和提高工作生产力。

0750

AI 会议语音转文字（语音识别）

ElevenLabs Scribe v1

ElevenLabs Scribe v1

语音转文本模型，多语言高精度转录领先 Scribe v1支持99种语言的高精度转录，尤其在英语（准确率96.7%）和意大利语（准确率98.7%）上表现出色。

0740

AI 会议字幕水印

Step-Audio

阶跃开源的130B语音模型一款强大的开源语音交互模型，能够实现语音识别、对话生成、情感克隆和多语言支持，为用户提供高质量的实时语音交互体验。

0710

AI开源项目变声克隆

OpenAI.fm

探索文本到语音的新境界为开发者提供的交互式演示平台，用于体验 OpenAI API 中的新型文本到语音模型，助力开发者快速构建相关应用。

0700

AI开放平台语音转文字（语音识别）

Fun-ASR

钉钉与通义实验室联合发布的语音识别大模型 Fun-ASR是由钉钉与通义实验室联合发布的新一代语音识别大模型，旨在为企业提供更强大、灵活的语音转写能力。

0700

语音转文字（语音识别）# 个性化定制 # 人工智能 # 企业协作

Captions

Captions是一个AI驱动的创意工作室，旨在简化创意过程并帮助用户提升叙事水平。它提供了一系列AI工具来增强视频和音频内容的制作。

0690

变声克隆字幕水印