新腾讯开源翻译模型 Hunyuan-MT-7B Hunyuan-MT-7B 是腾讯开源的一款轻量级翻译模型,支持 33 种语言互译,在国际机器翻译比赛中拿下 30 个第一名。 040 AI 翻译AI开源项目# 人工智能# 开源模型# 机器翻译
新TabPedia 表格理解大模型 TabPedia是一个新型的大型视觉-语言模型,由中国科学技术大学和字节跳动公司联合开发。该模型通过概念协同机制,能够无缝集成多种视觉表格理解(VTU)任务,如表格检测、表格结构识别、表格查询和表格问题回答。 040 AI开源项目Excel
新百度PaddleOCR-VL文档解析模型 PaddleOCR-VL 是百度 2025 年 10 月开源的全球最强文档解析模型,仅用 0.9B 参数即可在复杂版面、手写、表格、公式、图表等全场景实现 SOTA 级“看懂+读懂”。 040 AI 办公AI开源项目
新Baichuan-M2-32B 医疗领域的人工智能推理模型 Baichuan-M2-32B 是一款由 Baichuan AI 开发的医疗增强型推理模型,专为医学推理任务设计,具备强大的医疗知识、推理能力和患者交互能力。 030 AI开源项目生物医药
新Brain2Qwerty Meta AI 推出的脑机接口模型 Meta AI 推出的一款非侵入性脑机接口(BCI)模型,能够通过脑电图(EEG)或脑磁图(MEG)信号解码打字内容。 030 AI开源项目脑机接口# 医疗康复# 脑机接口# 语言研究
新Kosong 月之暗面开源的异步编排 AI 代理框架 Kosong 是 Moonshot AI 开源的 Python 框架,用异步编排+插件化设计,让开发者 5 分钟拼出可切换任意大模型的智能体。 030 AI应用开发AI开源项目
新昆仑万维 Skywork R1V4-Lite 集成视觉推理与工具调用的轻量级多模态智能体 Skywork R1V4-Lite 是昆仑万维(Skywork AI)推出的轻量级多模态智能体,聚焦视觉 - 语言推理,具备图像理解、工具调用、多步推理与深度研究能力,无需复杂提示词即可通过图像输入自动完成任务。 030 AI开源项目多模态大模型
新字节跳动X-Portrait2肖像动画技术 一项由字节跳动和清华大学联合开发的肖像动画技术,它能够将静态肖像图像和驱动表演视频结合起来,生成具有高度表现力和真实感的角色动画和视频。 030 3D与动画AI开源项目
新DICE-Talk 基于扩散模型的情感化动态头像生成工具 基于扩散模型的情感化动态头像生成方法,能够为说话的肖像生成生动且多样化的情感表达。 030 AI开源项目头像生成# 人工智能# 动态头像生成# 多模态学习
新昆仑万维 SkyReels - V3 昆仑万维 SkyReels - V3 是一款由 Skywork AI 开源的多模态视频生成模型,在单一建模架构中实现参考图像转视频、视频延长和音频驱动虚拟形象三大核心能力,达成高保真多模态视频生成的行业领先水平。 030 AI开源项目视频生成
新TeleChat3 国产千亿MoE开源大模型 TeleChat3 是中国电信 TeleAI 开源的国产千亿参数 MoE 大模型,支持“思考模式”并在全国产算力上完成 15T tokens 训练,可对标国际顶尖水平。 030 AI开源项目多模态大模型# MoE# 国产化# 开源大模型
新宇树UnifoLM-VLA-0 为人形机器人注入“物理常识”的通用大脑 宇树开源的UnifoLM-VLA-0是一个专为通用人形机器人设计的视觉-语言-动作基础模型,它通过在真实机器人操作数据上进行预训练,使模型获得了对物理世界交互规律的基本理解,标志着机器人大脑从“图文理解”迈向具备“物理常识”的具身智能。 030 AI 机器人AI开源项目