Step-DeepResearch 高性价比端到端深度研究代理模型 Step-DeepResearch 是阶跃星辰推出的一款高性价比、端到端深度研究代理模型,专为开放式研究场景中的自主信息探索和专业报告生成设计,能通过动态循环的推理、行动与反思,高效完成复杂研究任务。 0310 AI开源项目多模态大模型# AI 代理模型# 产品调研工具# 信息检索整合工具
阶跃星辰Step-Audio2mini 最强开源端到端语音大模型 阶跃星辰发布的Step-Audio2mini是一款开源的端到端语音大模型,能够实现语音理解、音频推理与生成的统一建模。 0310 AI开源项目文字转语音(配音播报)
DeepFakeDefenders DeepFakeDefenders是一个用于检测和防御深度伪造(DeepFake)技术的开源工具,通过集成先进的深度学习模型来识别图像中的伪造痕迹。 0300 AI开源项目伪造检测
清华开源TurboDiffusion AI视频生成速度暴增200倍,消费级显卡也能秒出大片! TurboDiffusion是清华大学TSAIL实验室联合生数科技开源的高效AI视频扩散模型框架,可将视频生成速度提升100至200倍,同时保持高质量输出。 0300 AI开源项目视频生成
🔥医疗AI黑科技!Google Med-Gemma 你的私人健康数据科学家 Google 推出的 MedGemma 是目前最强大的开源医疗 AI 模型之一,专为医疗健康领域的 AI 开发而设计。 0300 AI开源项目医疗健康# 临床支持# 医学图像分析# 医学研究
Qwen2-VL Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。 0300 AI开源项目多模态大模型
AuraSR高清修复放大 AuraSR 是基于 GAN 的 Super-Resolution 模型,通过图像条件化增强技术,提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现,并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量,适用于图像处理领域。 0300 AI开源项目图像编辑
PramaLLC背景消除网络BEN2 高效精准的图像与视频背景移除工具 一款深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。 0300 AI 抠图AI开源项目# 人工智能# 前景分割# 图像处理
dots.ocr 多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具,它通过单一视觉 - 语言模型实现布局检测和内容识别的统一,同时保持良好的阅读顺序,具有出色的性能和高效的处理速度。 0300 AI 办公AI开源项目# :文档解析# 多语言支持# 数据提取
Excel MCP Server 无需安装 Excel 即可操作 Excel 文件的服务器工具 能够让您在无需安装 Microsoft Excel 的情况下,通过 AI 代理对 Excel 文件进行创建、读取、修改、格式化、生成图表和透视表等操作。 0300 AI开源项目Excel# AI 集成# Excel 操作# 工具