新InvSR AI图片高清修复工具 一个用于图像超分辨率的开源工具,它通过先进的算法来增强图像的分辨率,使低分辨率图像变得更加清晰。 030 AI开源项目图片修复# 医学成像# 图像处理# 图像超分辨率
新蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。 030 AI开源项目图像生成
新阿里Qwen-Image-Layered 分层图像编辑模型 Qwen-Image-Layered 是阿里通义千问开源的 AI 模型,可把单张照片一键拆成带透明通道的独立图层,让“零 PS 基础”的用户也能像专业设计师一样精准改图。 040 AI开源项目图像编辑# AI 抠图# 图像编辑# 图层分离
新OminiControl Art AI艺术创作的高效工具 基于OminiControl框架开发的AI艺术创作工具,它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,能够高效生成高质量的艺术图像。 030 AI开源项目图像生成# AI工具# 图像生成# 数字艺术
新PramaLLC背景消除网络BEN2 高效精准的图像与视频背景移除工具 一款深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。 060 AI 抠图AI开源项目# 人工智能# 前景分割# 图像处理
新NiuTrans.LMT 打破语言壁垒的多语种翻译开源大模型 NiuTrans.LMT 是东北大学开源的多语言翻译大模型,凭借双中心架构与三层语言覆盖设计,支持 60 种语言、234 个翻译方向,在低资源语言翻译领域实现重大突破,兼顾翻译效率与准确性,为跨文化交互提供高效开源解决方案。 030 AI 翻译AI开源项目
新腾讯开源翻译模型 Hunyuan-MT-7B Hunyuan-MT-7B 是腾讯开源的一款轻量级翻译模型,支持 33 种语言互译,在国际机器翻译比赛中拿下 30 个第一名。 040 AI 翻译AI开源项目# 人工智能# 开源模型# 机器翻译
新TabPedia 表格理解大模型 TabPedia是一个新型的大型视觉-语言模型,由中国科学技术大学和字节跳动公司联合开发。该模型通过概念协同机制,能够无缝集成多种视觉表格理解(VTU)任务,如表格检测、表格结构识别、表格查询和表格问题回答。 040 AI开源项目Excel
新dots.ocr 多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具,它通过单一视觉 - 语言模型实现布局检测和内容识别的统一,同时保持良好的阅读顺序,具有出色的性能和高效的处理速度。 030 AI 办公AI开源项目# :文档解析# 多语言支持# 数据提取
新Excel MCP Server 无需安装 Excel 即可操作 Excel 文件的服务器工具 能够让您在无需安装 Microsoft Excel 的情况下,通过 AI 代理对 Excel 文件进行创建、读取、修改、格式化、生成图表和透视表等操作。 030 AI开源项目Excel# AI 集成# Excel 操作# 工具
新Office-PowerPoint-MCP-Server 高效管理 PPT 的智能工具 基于 Model Context Protocol(MCP)的服务器工具,使用 python-pptx 操作 PowerPoint 演示文稿,支持通过 MCP 协议创建、编辑和操作 PowerPoint 文件。 030 AI开源项目PPT
新百度PaddleOCR-VL文档解析模型 PaddleOCR-VL 是百度 2025 年 10 月开源的全球最强文档解析模型,仅用 0.9B 参数即可在复杂版面、手写、表格、公式、图表等全场景实现 SOTA 级“看懂+读懂”。 040 AI 办公AI开源项目
新AlphaFold3 革命性的AI蛋白质结构预测工具 AlphaFold3是由谷歌DeepMind团队开发的AI模型,能够预测蛋白质、核酸(DNA和RNA)、小分子、离子及修饰残基等生物分子的三维结构。 030 AI开源项目AI热门工具