Sketch2Sound AI音频工具 哼唱和模仿创建音效 一个可控音频生成模型,能够根据一组可解释的时变控制信号(响度、亮度、音高)和文本提示来创造高质量的声音。 0650 AI开源项目变声克隆# 声音模仿# 文本到音频转换# 音乐制作辅助工具。
阶跃星辰Step-Audio2mini 最强开源端到端语音大模型 阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型,能够实现语音理解、音频推理与生成的统一建模。 0650 AI开源项目文字转语音(配音播报)
PramaLLC背景消除网络BEN2 高效精准的图像与视频背景移除工具 一款深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。 0650 AI 抠图AI开源项目# 人工智能# 前景分割# 图像处理
Qwen3 阿里巴巴新一代混合推理大模型 阿里巴巴推出的最新一代混合推理大模型,支持119种语言,具备强大的推理、编码和智能体能力,广泛应用于自然语言理解、复杂推理、代码生成等场景。 0640 AI开源项目AI热门工具
Anthropic Agent Skills 开源知识库 Anthropic Agent Skills 是 Anthropic 推出的开源知识库,为 Claude 模型提供可动态加载的示范性技能与最佳实践,涵盖多领域实用技能集,支持开发者直接使用或按规范自定义技能,通过按需加载指令集降低 Token 消耗、提升特定任务处理效率。 0640 AI开源项目AI数据集
腾讯混元Hunyuan3D 2.0 高分辨率 3D 资产生成工具 一款用于生成高分辨率纹理化 3D 资产的大型 3D 合成系统,能够高效地创建高质量的 3D 模型和纹理。 0640 3D与动画AI开源项目# 3D 建模工具# 人工智能工具# 影视制作工具
🔥医疗AI黑科技!Google Med-Gemma 你的私人健康数据科学家 Google 推出的 MedGemma 是目前最强大的开源医疗 AI 模型之一,专为医疗健康领域的 AI 开发而设计。 0640 AI开源项目医疗健康# 临床支持# 医学图像分析# 医学研究
无偏水印(Unbiased Watermark) 该研究介绍了针对大型语言模型的无偏水印技术,表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架,确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法,而不会牺牲质量。 0640 AI开源项目字幕水印
AuraSR高清修复放大 AuraSR 是基于 GAN 的 Super-Resolution 模型,通过图像条件化增强技术,提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现,并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量,适用于图像处理领域。 0640 AI开源项目图像编辑
DeepMCPAgent 一键建神级AI代理的开源工具 DeepMCPAgent是一个开源的MCP驱动代理框架,具备动态MCP工具发现机制和模型无关设计架构,主要应用于AI代理开发场景。 0630 AI应用开发AI开源项目
SpatialLM 让三维空间理解更智能 专注于三维空间理解的大语言模型,能够将三维点云数据转化为结构化的三维场景理解输出,广泛应用于机器人导航、建筑设计等领域。 0630 3D与动画AI开源项目# 三维建模# 人工智能# 大语言模型