AI开源项目

共 101 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

Zonos-TTS

高保真多语言文本到语音模型一款高保真多语言文本到语音（TTS）模型，支持实时语音克隆和多语言情感控制，能够生成自然、富有表现力的语音。

0630

AI开源项目变声克隆

Moonshine自动语音识别（ASR）工具

Moonshine自动语音识别（ASR）工具

Moonshine是一个为边缘设备提供快速且准确的自动语音识别（ASR）的工具。

0630

AI开源项目语音转文字（语音识别）

DLoRAL

一键实现视频超分辨率的开源框架 DLoRAL是由香港理工大学与OPPO研究院联合推出的一款开源视频超分辨率框架，基于扩散模型实现一步生成高清视频，为视频超分辨率领域带来了革命性突破。

0630

AI开源项目图片放大 # 人工智能 # 开源工具 # 视频处理

宇树UnifoLM-VLA-0

宇树UnifoLM-VLA-0

为人形机器人注入“物理常识”的通用大脑宇树开源的UnifoLM-VLA-0是一个专为通用人形机器人设计的视觉-语言-动作基础模型，它通过在真实机器人操作数据上进行预训练，使模型获得了对物理世界交互规律的基本理解，标志着机器人大脑从“图文理解”迈向具备“物理常识”的具身智能。

0620

AI 机器人 AI开源项目

Revisit-Anything

Revisit-Anything

视觉位置识别技术 Revisit-Anything 可以帮助用户高效地管理和回顾各种内容。它能够对文本、图像、代码等多种类型的文件进行分类和标记，方便用户快速找到所需内容。同时，该工具还支持搜索功能，用户可以通过关键词快速定位到特定的文件或信息。

0620

AI开源项目 AI数据集

MoCha

电影级对话角色合成工具 MoCha 是一款能够仅通过语音和文本生成电影级对话角色的合成工具，支持情感控制、动作控制以及多角色对话等功能。

0620

3D与动画 AI应用开发 # 动画制作工具 # 影视制作工具 # 游戏开发工具

Stable Virtual Camera

Stable Virtual Camera

让2D图像秒变3D视频 Stability AI 推出的一款 AI 模型，能够将二维图像转换为具有真实深度和透视感的沉浸式三维视频。

0620

3D与动画 AI开源项目 # 人工智能 # 内容创作 # 创意工具

腾讯ARC团队的AudioStory模型

腾讯ARC团队的AudioStory模型

开启AI音频生成新时代腾讯ARC团队推出的AudioStory模型，能够根据文字描述生成高质量的音频内容，具有强大的叙事能力。

0620

AI开源项目文字转语音（配音播报）

Follow-Your-Emoji

Follow-Your-Emoji

Follow-Your-Emoji是一个基于扩散模型的人像动画框架，能够将目标表情序列动画化到参考人像上，同时保持人像身份的一致性、表情的传递、时间的连贯性和保真度。它通过采用表情感知标志和面部细粒度损失技术，显著提升了模型在控制自由风格人像表情方面的表现，包括真实人物、卡通、雕塑甚至动物。此外，它还通过简单有效的逐步生成策略，扩展到稳定的长期动画，增加了其潜在的应用价值。

0620

AI开源项目图像编辑

AI换头技术CHANGER

CHANGER是一种新型头部融合管道，旨在为数字内容创作提供高保真的头部合成解决方案，特别适用于视觉效果(VFX)、数字人物创建和虚拟头像等领域。

0620

AI开源项目头像生成

Jaaz

AI设计助手 Jaaz是一款本地化的AI设计工具，能够智能生成图像、海报、分镜头脚本等设计内容，支持本地模型运行，是Lovart的免费替代品。

0620

AI开源项目学生

昆仑万维

SkyReels - V3 昆仑万维 SkyReels - V3 是一款由 Skywork AI 开源的多模态视频生成模型，在单一建模架构中实现参考图像转视频、视频延长和音频驱动虚拟形象三大核心能力，达成高保真多模态视频生成的行业领先水平。

0610

AI开源项目视频生成

MobileAgent

移动设备的智能操作助手 MobileAgent 是一款强大的移动设备操作辅助工具，通过多智能体协作实现复杂任务的自动化操作，提升移动设备的使用效率和便捷性。

0610

AI应用开发 AI开源项目

字节MegaTTS3

轻量化语音合成模型 MegaTTS3 是由字节跳动与浙江大学合作开发的一款轻量级文本转语音（TTS）模型，以高效、轻量化和高质量语音合成为特点。

0610

AI开源项目变声克隆

VideoPainter

视频局部编辑技术香港中文大学、腾讯ARC Lab、东京大学和澳门大学等机构联合推出的开源视频修复和编辑工具，能够通过文字指令实现对任意长度视频的高效修复和编辑。

0610

AI开源项目编辑转换