新WebAgent 自主搜索AI智能体 WebAgent是由阿里云通义实验室开源的自主搜索AI智能体项目,旨在模拟人类在网络环境中的感知、决策和行动循环,通过自主搜索和多步推理处理复杂、模糊的网络任务。
新LingBot-World 蚂蚁灵波开源世界模型 LingBot-World 是蚂蚁灵波科技开源的一款顶尖世界模型,它以可扩展数据引擎为驱动,能提供高保真、高动态且可实时交互的模拟环境,在视频质量、长时序一致性等多方面表现突出,适配多领域应用。
新昆仑万维 SkyReels - V3 昆仑万维 SkyReels - V3 是一款由 Skywork AI 开源的多模态视频生成模型,在单一建模架构中实现参考图像转视频、视频延长和音频驱动虚拟形象三大核心能力,达成高保真多模态视频生成的行业领先水平。
新Revisit-Anything 视觉位置识别技术 Revisit-Anything 可以帮助用户高效地管理和回顾各种内容。它能够对文本、图像、代码等多种类型的文件进行分类和标记,方便用户快速找到所需内容。同时,该工具还支持搜索功能,用户可以通过关键词快速定位到特定的文件或信息。
新蚂蚁集团LingBot-VLA 开启双臂机器人“大模型操控”新时代 正 LingBot-VLA是蚂蚁集团推出的一个专注于现实世界复杂操控任务的视觉-语言-动作基础模型,它通过海量真实机器人数据进行训练,实现了用自然语言指令直接操控多种不同形态的双臂机器人。