新无偏水印(Unbiased Watermark) 该研究介绍了针对大型语言模型的无偏水印技术,表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架,确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法,而不会牺牲质量。 030 AI开源项目字幕水印
新Follow-Your-Emoji Follow-Your-Emoji是一个基于扩散模型的人像动画框架,能够将目标表情序列动画化到参考人像上,同时保持人像身份的一致性、表情的传递、时间的连贯性和保真度。它通过采用表情感知标志和面部细粒度损失技术,显著提升了模型在控制自由风格人像表情方面的表现,包括真实人物、卡通、雕塑甚至动物。此外,它还通过简单有效的逐步生成策略,扩展到稳定的长期动画,增加了其潜在的应用价值。 030 AI开源项目图像编辑
新VideoPainter 视频局部编辑技术 香港中文大学、腾讯ARC Lab、东京大学和澳门大学等机构联合推出的开源视频修复和编辑工具,能够通过文字指令实现对任意长度视频的高效修复和编辑。 030 AI开源项目编辑转换
新InvSR AI图片高清修复工具 一个用于图像超分辨率的开源工具,它通过先进的算法来增强图像的分辨率,使低分辨率图像变得更加清晰。 030 AI开源项目图片修复# 医学成像# 图像处理# 图像超分辨率
新蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。 030 AI开源项目图像生成
新OminiControl Art AI艺术创作的高效工具 基于OminiControl框架开发的AI艺术创作工具,它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,能够高效生成高质量的艺术图像。 030 AI开源项目图像生成# AI工具# 图像生成# 数字艺术
新NiuTrans.LMT 打破语言壁垒的多语种翻译开源大模型 NiuTrans.LMT 是东北大学开源的多语言翻译大模型,凭借双中心架构与三层语言覆盖设计,支持 60 种语言、234 个翻译方向,在低资源语言翻译领域实现重大突破,兼顾翻译效率与准确性,为跨文化交互提供高效开源解决方案。 030 AI 翻译AI开源项目
新dots.ocr 多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具,它通过单一视觉 - 语言模型实现布局检测和内容识别的统一,同时保持良好的阅读顺序,具有出色的性能和高效的处理速度。 030 AI 办公AI开源项目# :文档解析# 多语言支持# 数据提取
新Excel MCP Server 无需安装 Excel 即可操作 Excel 文件的服务器工具 能够让您在无需安装 Microsoft Excel 的情况下,通过 AI 代理对 Excel 文件进行创建、读取、修改、格式化、生成图表和透视表等操作。 030 AI开源项目Excel# AI 集成# Excel 操作# 工具
新Office-PowerPoint-MCP-Server 高效管理 PPT 的智能工具 基于 Model Context Protocol(MCP)的服务器工具,使用 python-pptx 操作 PowerPoint 演示文稿,支持通过 MCP 协议创建、编辑和操作 PowerPoint 文件。 030 AI开源项目PPT
新AlphaFold3 革命性的AI蛋白质结构预测工具 AlphaFold3是由谷歌DeepMind团队开发的AI模型,能够预测蛋白质、核酸(DNA和RNA)、小分子、离子及修饰残基等生物分子的三维结构。 030 AI开源项目AI热门工具