FLUX.1-dev LoRA 服装生成器 FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术,为用户带来前所未有的时尚设计体验,让设计小白也能秒出服装效果图。 0260 AI开源项目服装设计
昆仑万维开源SkyReels-V2 无限时长电影生成模型 昆仑万维SkyReels团队推出的一款无限时长电影生成模型,基于扩散强迫框架结合多模态大语言模型等技术,能够生成高质量、无限时长的视频内容。 0260 3D与动画AI开源项目
百度PaddleOCR-VL文档解析模型 PaddleOCR-VL 是百度 2025 年 10 月开源的全球最强文档解析模型,仅用 0.9B 参数即可在复杂版面、手写、表格、公式、图表等全场景实现 SOTA 级“看懂+读懂”。 0260 AI 办公AI开源项目
阿里 Qwen3.5 开源大模型 Qwen3.5 是阿里巴巴即将推出的新一代开源基座大模型,采用全新混合注意力机制,大概率为原生视觉理解 VLM 模型,计划春节期间开源并推出多规格模型版本,目前已完成多个主流 AI 开发框架的适配开发。 0250 AI开源项目多模态大模型
DLoRAL 一键实现视频超分辨率的开源框架 DLoRAL是由香港理工大学与OPPO研究院联合推出的一款开源视频超分辨率框架,基于扩散模型实现一步生成高清视频,为视频超分辨率领域带来了革命性突破。 0250 AI开源项目图片放大# 人工智能# 开源工具# 视频处理
Office-PowerPoint-MCP-Server 高效管理 PPT 的智能工具 基于 Model Context Protocol(MCP)的服务器工具,使用 python-pptx 操作 PowerPoint 演示文稿,支持通过 MCP 协议创建、编辑和操作 PowerPoint 文件。 0250 AI开源项目PPT
DeepMCPAgent 一键建神级AI代理的开源工具 DeepMCPAgent是一个开源的MCP驱动代理框架,具备动态MCP工具发现机制和模型无关设计架构,主要应用于AI代理开发场景。 0240 AI应用开发AI开源项目
TRELLIS.2-4B 微软开源的高精度图像到 3D 生成工具 TRELLIS.2-4B 是微软开源的一款基于流匹配 Transformer 的大型 3D 生成模型,能够以单张图片为输入,快速生成具备高保真度、复杂拓扑结构和 PBR 材质的 3D 资产,适用于多种高精度 3D 建模场景。 0240 3D与动画AI开源项目# AI 生成工具# PBR 材质生成工具# 图像到 3D 转换工具
蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。 0240 AI开源项目图像生成