新Google TimesFM 2.0 谷歌开源时间序列预测模型 具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测时间跨度。 040 AI开源项目AI数据集# 开源模型# 数据分析# 时间序列预测
新阿里HumanOmniV2 多模态AI新王者 阿里HumanOmniV2是由阿里巴巴通义实验室开发的一款多模态AI系统,能够通过分析视频、音频、文字等多种信息,像人类一样理解复杂的社交情境和人类意图。 040 AI开源项目API 超市# 人工智能# 人机交互# 多模态技术
新MobileAgent 移动设备的智能操作助手 MobileAgent 是一款强大的移动设备操作辅助工具,通过多智能体协作实现复杂任务的自动化操作,提升移动设备的使用效率和便捷性。 040 AI应用开发AI开源项目
新Stable Virtual Camera 让2D图像秒变3D视频 Stability AI 推出的一款 AI 模型,能够将二维图像转换为具有真实深度和透视感的沉浸式三维视频。 040 3D与动画AI开源项目# 人工智能# 内容创作# 创意工具
新腾讯混元Hunyuan3D 2.0 高分辨率 3D 资产生成工具 一款用于生成高分辨率纹理化 3D 资产的大型 3D 合成系统,能够高效地创建高质量的 3D 模型和纹理。 040 3D与动画AI开源项目# 3D 建模工具# 人工智能工具# 影视制作工具
新SpatialLM 让三维空间理解更智能 专注于三维空间理解的大语言模型,能够将三维点云数据转化为结构化的三维场景理解输出,广泛应用于机器人导航、建筑设计等领域。 040 3D与动画AI开源项目# 三维建模# 人工智能# 大语言模型
新AuraSR高清修复放大 AuraSR 是基于 GAN 的 Super-Resolution 模型,通过图像条件化增强技术,提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现,并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量,适用于图像处理领域。 040 AI开源项目图像编辑
新腾讯开源翻译模型 Hunyuan-MT-7B Hunyuan-MT-7B 是腾讯开源的一款轻量级翻译模型,支持 33 种语言互译,在国际机器翻译比赛中拿下 30 个第一名。 040 AI 翻译AI开源项目# 人工智能# 开源模型# 机器翻译
新TabPedia 表格理解大模型 TabPedia是一个新型的大型视觉-语言模型,由中国科学技术大学和字节跳动公司联合开发。该模型通过概念协同机制,能够无缝集成多种视觉表格理解(VTU)任务,如表格检测、表格结构识别、表格查询和表格问题回答。 040 AI开源项目Excel
新百度PaddleOCR-VL文档解析模型 PaddleOCR-VL 是百度 2025 年 10 月开源的全球最强文档解析模型,仅用 0.9B 参数即可在复杂版面、手写、表格、公式、图表等全场景实现 SOTA 级“看懂+读懂”。 040 AI 办公AI开源项目
新Baichuan-M2-32B 医疗领域的人工智能推理模型 Baichuan-M2-32B 是一款由 Baichuan AI 开发的医疗增强型推理模型,专为医学推理任务设计,具备强大的医疗知识、推理能力和患者交互能力。 030 AI开源项目生物医药