AI开源项目

共 101 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

Brain2Qwerty

Meta AI 推出的脑机接口模型 Meta AI 推出的一款非侵入性脑机接口（BCI）模型，能够通过脑电图（EEG）或脑磁图（MEG）信号解码打字内容。

0810

AI开源项目脑机接口 # 医疗康复 # 脑机接口 # 语言研究

NVIDIA

Blackwell 架构 NVIDIA 推出的最新一代高性能计算架构，专为加速人工智能和高性能计算而设计。

0810

AI 机器人 AI 自动驾驶 # 人工智能 # 数据中心 # 机密计算

智谱

CogVLM2 CogVLM2是一个强大的视觉大模型，由THUDM（清华大学自然语言处理实验室）开发，具有出色的视觉和语言理解能力。

0810

AI开源项目世界模型

昆仑万维 Skywork R1V4-Lite

昆仑万维 Skywork R1V4-Lite

集成视觉推理与工具调用的轻量级多模态智能体 Skywork R1V4-Lite 是昆仑万维（Skywork AI）推出的轻量级多模态智能体，聚焦视觉 - 语言推理，具备图像理解、工具调用、多步推理与深度研究能力，无需复杂提示词即可通过图像输入自动完成任务。

0800

AI开源项目多模态大模型

SenseNova-SI

商汤空间智能大模型商汤开源的2B/8B多模态模型，在空间理解基准上超越GPT-5，为自动驾驶、机器人提供“看懂世界”的通用引擎。

0780

AI 机器人 AI开源项目

Kimi

Linear 架构 Kimi Linear 是月之暗面推出的全新注意力架构，用 KDA 技术把 KV 缓存砍掉 75%、推理速度直接翻 6 倍，让长文本大模型“既省内存又飙车”。

0770

AI开放平台 AI开源项目 # AI加速框架 # KV缓存压缩 # RNN记忆

NiuTrans.LMT

打破语言壁垒的多语种翻译开源大模型 NiuTrans.LMT 是东北大学开源的多语言翻译大模型，凭借双中心架构与三层语言覆盖设计，支持 60 种语言、234 个翻译方向，在低资源语言翻译领域实现重大突破，兼顾翻译效率与准确性，为跨文化交互提供高效开源解决方案。

0770

AI 翻译 AI开源项目

腾讯Youtu-agent框架

腾讯Youtu-agent框架

Youtu-agent是由腾讯优图实验室推出的开源智能体框架，旨在帮助用户构建、运行和评估自主智能体。

0760

AI开源项目超级智能体

字节跳动X-Portrait2肖像动画技术

字节跳动X-Portrait2肖像动画技术

一项由字节跳动和清华大学联合开发的肖像动画技术，它能够将静态肖像图像和驱动表演视频结合起来，生成具有高度表现力和真实感的角色动画和视频。

0760

3D与动画 AI开源项目

Kimi-Audio

开源音频基础模型开源的音频基础模型，擅长音频理解、生成和对话，适用于多种音频处理任务。

0750

AI开源项目文字转语音（配音播报）# 对话系统 # 开源工具 # 语音识别

Kosong

月之暗面开源的异步编排 AI 代理框架 Kosong 是 Moonshot AI 开源的 Python 框架，用异步编排+插件化设计，让开发者 5 分钟拼出可切换任意大模型的智能体。

0730

AI应用开发 AI开源项目

昆仑万维 Matrix-Game 2.0

昆仑万维 Matrix-Game 2.0

开启开源世界模型新纪元 Matrix - Game 2.0 是昆仑万维发布的开源世界模型，旨在推动人工智能在复杂环境中的决策能力，为研究人员和开发者提供强大的工具和平台，助力人工智能技术的创新与发展。

0730

AI 自动驾驶 AI开源项目 # ：人工智能 # 决策支持 # 多智能体

Step-Audio

阶跃开源的130B语音模型一款强大的开源语音交互模型，能够实现语音识别、对话生成、情感克隆和多语言支持，为用户提供高质量的实时语音交互体验。

0710

AI开源项目变声克隆

Google TimesFM 2.0

Google TimesFM 2.0

谷歌开源时间序列预测模型具备强大的预测能力，可处理长达2048个时间点的单变量时间序列，支持任意预测时间跨度。

0700

AI开源项目 AI数据集 # 开源模型 # 数据分析 # 时间序列预测

HunyuanWorld-Voyager

HunyuanWorld-Voyager

从一张照片走进3D世界 HunyuanWorld-Voyager是由腾讯混元团队开源的3D生成工具，能通过单张照片或文字描述快速生成360°沉浸式3D场景，为用户带来全新的视觉体验。

0700

3D与动画 AI开源项目