AI开源项目

共 101 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

Sketch2Sound

AI音频工具哼唱和模仿创建音效一个可控音频生成模型，能够根据一组可解释的时变控制信号（响度、亮度、音高）和文本提示来创造高质量的声音。

0650

AI开源项目变声克隆 # 声音模仿 # 文本到音频转换 # 音乐制作辅助工具。

Whisper-Medusa Whisper-Medusa

Whisper-Medusa Whisper-Medusa

一款基于Whisper模型的优化版语音识别工具，通过多解码头技术显著提升处理速度

0650

AI开源项目语音转文字（语音识别）

阶跃星辰Step-Audio2mini

阶跃星辰Step-Audio2mini

最强开源端到端语音大模型阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型，能够实现语音理解、音频推理与生成的统一建模。

0650

AI开源项目文字转语音（配音播报）

SadTalker SadTalker

SadTalker SadTalker

学习现实的3D运动系数风格化音频驱动的单图像说话的脸动画。

0650

3D与动画 AI开源项目

PramaLLC背景消除网络BEN2

PramaLLC背景消除网络BEN2

高效精准的图像与视频背景移除工具一款深度学习模型，专门用于从图像和视频中快速移除背景并提取前景。

0650

AI 抠图 AI开源项目 # 人工智能 # 前景分割 # 图像处理

Qwen3

阿里巴巴新一代混合推理大模型阿里巴巴推出的最新一代混合推理大模型，支持119种语言，具备强大的推理、编码和智能体能力，广泛应用于自然语言理解、复杂推理、代码生成等场景。

0640

AI开源项目 AI热门工具

Anthropic

Agent Skills 开源知识库 Anthropic Agent Skills 是 Anthropic 推出的开源知识库，为 Claude 模型提供可动态加载的示范性技能与最佳实践，涵盖多领域实用技能集，支持开发者直接使用或按规范自定义技能，通过按需加载指令集降低 Token 消耗、提升特定任务处理效率。

0640

AI开源项目 AI数据集

腾讯混元Hunyuan3D 2.0

腾讯混元Hunyuan3D 2.0

高分辨率 3D 资产生成工具一款用于生成高分辨率纹理化 3D 资产的大型 3D 合成系统，能够高效地创建高质量的 3D 模型和纹理。

0640

3D与动画 AI开源项目 # 3D 建模工具 # 人工智能工具 # 影视制作工具

🔥医疗AI黑科技！Google Med-Gemma

🔥医疗AI黑科技！Google Med-Gemma

你的私人健康数据科学家 Google 推出的 MedGemma 是目前最强大的开源医疗 AI 模型之一，专为医疗健康领域的 AI 开发而设计。

0640

AI开源项目医疗健康 # 临床支持 # 医学图像分析 # 医学研究

无偏水印（Unbiased

Watermark）该研究介绍了针对大型语言模型的无偏水印技术，表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架，确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法，而不会牺牲质量。

0640

AI开源项目字幕水印

AuraSR高清修复放大

AuraSR 是基于 GAN 的 Super-Resolution 模型，通过图像条件化增强技术，提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现，并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量，适用于图像处理领域。

0640

AI开源项目图像编辑

DeepMCPAgent

一键建神级AI代理的开源工具 DeepMCPAgent是一个开源的MCP驱动代理框架，具备动态MCP工具发现机制和模型无关设计架构，主要应用于AI代理开发场景。

0630

AI应用开发 AI开源项目

SpatialLM

让三维空间理解更智能专注于三维空间理解的大语言模型，能够将三维点云数据转化为结构化的三维场景理解输出，广泛应用于机器人导航、建筑设计等领域。

0630

3D与动画 AI开源项目 # 三维建模 # 人工智能 # 大语言模型

SkyReels-V1

昆仑万维开源AI短剧创作视频生成模型昆仑万维开源的中国首个面向AI短剧创作的视频生成模型，能够实现影视级人物微表情表演生成和高质量视频创作。

0630

3D与动画 AI开源项目

OpenManus

无需邀请码的开源智能体平台 MetaGPT 团队开发，旨在让用户无需邀请码即可创建和使用 AI 智能体，快速实现各种创意和任务自动化。

0630

AI应用开发 AI开源项目