新Mistral Voxtral 开源音频模型的新突破 Voxtral 是 Mistral 推出的首个开源音频模型,旨在为企业和开发者提供高性价比的语音智能解决方案。 040 客服文字转语音(配音播报)# 人工智能# 开源模型# 自然语言处理
新Google TimesFM 2.0 谷歌开源时间序列预测模型 具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测时间跨度。 040 AI开源项目AI数据集# 开源模型# 数据分析# 时间序列预测
新阶跃星辰(阶跃视频) Step-Video-TI2V 图生视频的创新之作 能够根据文本描述和图像输入生成最长 102 帧的视频,具备运动幅度可控和镜头运动可控等核心特点。 040 3D与动画AI热门工具# 人工智能# 动画制作# 开源模型
新腾讯开源翻译模型 Hunyuan-MT-7B Hunyuan-MT-7B 是腾讯开源的一款轻量级翻译模型,支持 33 种语言互译,在国际机器翻译比赛中拿下 30 个第一名。 040 AI 翻译AI开源项目# 人工智能# 开源模型# 机器翻译
新DeepSeek-R1 开源推理模型的革命性突破 DeepSeek推出的第一代推理模型,性能与OpenAI的o1正式版相当,且开源了模型权重与训练框架。 030 AI应用开发AI开放平台# 人工智能# 开源模型# 强化学习
新腾讯混元图生视频模型 让静态图片动起来的AI视频生成工具 腾讯混元团队推出的开源AI视频生成工具,用户只需上传一张图片并输入简短描述,即可将静态图片转化为动态的短视频。 030 AI热门工具视频生成# 人工智能# 创意工具# 开源模型
新阿里Qwen-Image-Layered 分层图像编辑模型 Qwen-Image-Layered 是阿里通义千问开源的 AI 模型,可把单张照片一键拆成带透明通道的独立图层,让“零 PS 基础”的用户也能像专业设计师一样精准改图。 030 AI开源项目图像编辑# AI 抠图# 图像编辑# 图层分离