新Fun-ASR 钉钉与通义实验室联合发布的语音识别大模型 Fun-ASR是由钉钉与通义实验室联合发布的新一代语音识别大模型,旨在为企业提供更强大、灵活的语音转写能力。 030 语音转文字(语音识别)# 个性化定制# 人工智能# 企业协作
新MiniMax Speech-02 新一代语音合成技术的突破 MiniMax 稀宇极智推出的新一代文本转语音(TTS)模型,凭借其卓越的语音克隆能力、高质量的语音合成以及广泛的语言支持,成为当前语音合成领域的前沿技术。 030 AI热门工具文字转语音(配音播报)# MiniMax Speech-02# 多语言支持# 情感控制
新Captions新模型Mirage AI驱动的UGC视频生成工具 用户生成内容(UGC)和广告制作的AI视频生成工具,能够通过简单的文本提示或音频文件快速生成完整的视频内容。 040 企业头像生成# AI创意工具# 多语言支持# 广告制作
新dots.ocr 多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具,它通过单一视觉 - 语言模型实现布局检测和内容识别的统一,同时保持良好的阅读顺序,具有出色的性能和高效的处理速度。 030 AI 办公AI开源项目# :文档解析# 多语言支持# 数据提取