LingBot-World 蚂蚁灵波开源世界模型 LingBot-World 是蚂蚁灵波科技开源的一款顶尖世界模型,它以可扩展数据引擎为驱动,能提供高保真、高动态且可实时交互的模拟环境,在视频质量、长时序一致性等多方面表现突出,适配多领域应用。 0700 3D与动画AI开源项目
Step-DeepResearch 高性价比端到端深度研究代理模型 Step-DeepResearch 是阶跃星辰推出的一款高性价比、端到端深度研究代理模型,专为开放式研究场景中的自主信息探索和专业报告生成设计,能通过动态循环的推理、行动与反思,高效完成复杂研究任务。 0680 AI开源项目多模态大模型# AI 代理模型# 产品调研工具# 信息检索整合工具
Qwen2-VL Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。 0680 AI开源项目多模态大模型
清华开源TurboDiffusion AI视频生成速度暴增200倍,消费级显卡也能秒出大片! TurboDiffusion是清华大学TSAIL实验室联合生数科技开源的高效AI视频扩散模型框架,可将视频生成速度提升100至200倍,同时保持高质量输出。 0670 AI开源项目视频生成
阿里HumanOmniV2 多模态AI新王者 阿里HumanOmniV2是由阿里巴巴通义实验室开发的一款多模态AI系统,能够通过分析视频、音频、文字等多种信息,像人类一样理解复杂的社交情境和人类意图。 0670 AI开源项目API 超市# 人工智能# 人机交互# 多模态技术
MaskGCT 零样本语音合成的创新突破 趣丸科技与香港中文大学(深圳)联合研发的开源文本转语音(TTS)模型,能够实现零样本语音合成,无需显式对齐信息和音素级时长预测,支持多种语言和情感控制。 0670 AI开源项目AI短剧
Excel MCP Server 无需安装 Excel 即可操作 Excel 文件的服务器工具 能够让您在无需安装 Microsoft Excel 的情况下,通过 AI 代理对 Excel 文件进行创建、读取、修改、格式化、生成图表和透视表等操作。 0670 AI开源项目Excel# AI 集成# Excel 操作# 工具
OceanGPT(沧渊) 海洋领域的开源大模型 中国首个海洋领域的开源大模型,由浙江大学海洋精准感知技术全国重点实验室牵头研发,具备海洋专业知识问答、多模态数据处理以及海洋机器人操控等能力。 0660 AI开源项目世界模型
EX-4D 极端视角4D视频合成工具 EX-4D是一种先进的4D视频合成工具,能够将单目视频转化为可在极端视角下自由控制的4D视频体验,生成高质量且物理一致的结果。 0660 3D与动画AI开源项目# 人工智能# 图形学# 视频合成工具
DeepFakeDefenders DeepFakeDefenders是一个用于检测和防御深度伪造(DeepFake)技术的开源工具,通过集成先进的深度学习模型来识别图像中的伪造痕迹。 0650 AI开源项目伪造检测
TeleChat3 国产千亿MoE开源大模型 TeleChat3 是中国电信 TeleAI 开源的国产千亿参数 MoE 大模型,支持“思考模式”并在全国产算力上完成 15T tokens 训练,可对标国际顶尖水平。 0650 AI开源项目多模态大模型# MoE# 国产化# 开源大模型