AI开源项目

共 101 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

IntrinsicAnything

IntrinsicAnything

一种通过生成模型学习材料，规范优化过程的方法，以提高在未知静态照明条件下拍摄的姿势图像中恢复物体材质的准确性。

0610

AI开源项目图像生成

dots.ocr

多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具，它通过单一视觉 - 语言模型实现布局检测和内容识别的统一，同时保持良好的阅读顺序，具有出色的性能和高效的处理速度。

0610

AI 办公 AI开源项目 # ：文档解析 # 多语言支持 # 数据提取

TRELLIS.2-4B

微软开源的高精度图像到 3D 生成工具 TRELLIS.2-4B 是微软开源的一款基于流匹配 Transformer 的大型 3D 生成模型，能够以单张图片为输入，快速生成具备高保真度、复杂拓扑结构和 PBR 材质的 3D 资产，适用于多种高精度 3D 建模场景。

0600

3D与动画 AI开源项目 # AI 生成工具 # PBR 材质生成工具 # 图像到 3D 转换工具

ViViD

虚拟试衣技术 ViViD 是一个创新的视频虚拟试穿框架，它利用扩散模型技术，结合服装编码器和姿态编码器，为用户提供逼真的视频试穿体验。

0600

AI开源项目服装设计

昆仑万维开源SkyReels-V2

昆仑万维开源SkyReels-V2

无限时长电影生成模型昆仑万维SkyReels团队推出的一款无限时长电影生成模型，基于扩散强迫框架结合多模态大语言模型等技术，能够生成高质量、无限时长的视频内容。

0600

3D与动画 AI开源项目

AI对口型项目EchoMimic

AI对口型项目EchoMimic

EchoMimic是一款由蚂蚁集团研究团队推出的创新技术，能够根据音频内容和角色照片生成生动对口型视频。该技术突破了传统方法的局限性，实现了更逼真和动态的人像生成。

0600

AI开源项目对口型

蚂蚁集团

Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型，基于 Ling-2.0 MoE 架构打造，实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级，部分指标超越 Gemini 2.5 Pro，为多模态应用开发提供高效统一入口。

0600

AI开源项目图像生成

EasyControl_Ghibli

EasyControl_Ghibli

一键生成吉卜力风格图像的AI工具专注于生成吉卜力风格的图像，用户可以通过简单的操作将普通图像转换为具有吉卜力动画特色的艺术作品。

0600

AI开源项目图像生成

OminiControl Art

OminiControl Art

AI艺术创作的高效工具基于OminiControl框架开发的AI艺术创作工具，它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合，能够高效生成高质量的艺术图像。

0600

AI开源项目图像生成 # AI工具 # 图像生成 # 数字艺术

Meta Video Seal

Meta Video Seal

AI视频水印工具 Meta 公司推出的开源 AI 视频水印工具，旨在通过在 AI 生成的视频中加入不可察觉的水印来打击深度伪造和保护原创内容。

0590

AI开源项目伪造检测

蚂蚁集团LingBot-VLA

蚂蚁集团LingBot-VLA

开启双臂机器人“大模型操控”新时代正 LingBot-VLA是蚂蚁集团推出的一个专注于现实世界复杂操控任务的视觉-语言-动作基础模型，它通过海量真实机器人数据进行训练，实现了用自然语言指令直接操控多种不同形态的双臂机器人。

0590

AI 机器人 AI开源项目

FLUX.1-dev

LoRA 服装生成器 FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术，为用户带来前所未有的时尚设计体验，让设计小白也能秒出服装效果图。

0590

AI开源项目服装设计

ScreenPipe开源AI屏幕录制工具

ScreenPipe开源AI屏幕录制工具

一款24/7本地AI屏幕与麦克风录制工具，旨在帮助用户构建拥有完整上下文的AI应用。

0590

AI开源项目字幕水印

字节跳动

LatentSync 端到端唇同步技术一种基于音频条件的潜在扩散模型的端到端唇同步框架，能够直接建模复杂的音视频关联.

0590

3D与动画 AI开源项目 # 人工智能 # 唇同步 # 娱乐技术

InvSR

AI图片高清修复工具一个用于图像超分辨率的开源工具，它通过先进的算法来增强图像的分辨率，使低分辨率图像变得更加清晰。

0590

AI开源项目图片修复 # 医学成像 # 图像处理 # 图像超分辨率