新Qwen2-VL Qwen2-VL是一个基于自然语言处理(NLP)技术的语音到文本(Voice-to-Text)和文本到语音(Text-to-Speech, TTS)转换工具,旨在提供高质量的语音转换服务。 060 AI开源项目多模态大模型
新谷歌 Veo 3.1 视频生成模型 原生音频加持的精细化 AI 电影工具 Veo 3.1 是谷歌最新发布的视频生成模型,在 8 秒到 60 秒的可控时长内一次性输出 1080P 画面与同步音轨,并支持插入删除对象、首尾帧过渡、角色一致性等电影级精细编辑。 030 AI热门工具创作与影视
新Stable Artisan Stability AI 推出了 Stable Artisan,这是一款支持使用 Developer Platform API 创建高质量媒体的 AI 工具,包含 Stable Diffusion 3 等高级模型,能够生成和编辑图像,并支持多种图像处理功能,以及用文字或图像创作精细视频。 030 3D与动画AI热门工具
新OpenAI GPT Image 1.5 GPT Image 1.5 是 OpenAI 最新发布的图像生成与编辑模型,可在 ChatGPT 内一句话出图、改图,效果更精准、文字更清晰、安全合规更严格。 030 AI热门工具图像生成
新蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。 030 AI开源项目图像生成
新天工AI全球官网 集搜索、写作、对话、文档分析、图片生成、PPT制作等多功能于一体的全能型人工智能助手,能够为用户提供高效、便捷的智能服务。 040 PPT图像生成# 人工智能# 内容创作# 办公工具
新元石科技问小白 国产AI智能助手新标杆 问小白是由元石科技推出的AI智能助手,基于自研的元石大模型和DeepSeek-R1 671B满血版模型构建。它能够快速响应用户的各种需求,提供智能搜索、文本创作、逻辑推理、灵感辅助、高效阅读和资料整理等全方位服务。 030 多模态大模型学生
新百度文心ERNIE-5.0-Preview-1022模型 ERNIE-5.0-Preview-1022 是百度最新发布的文心大模型预览版,在 LMArena 文本榜全球并列第二、国内第一,以创意写作、长文本理解与指令遵循三大能力为核心卖点。 030 多模态大模型总结摘要
新Gemini 2.0 Pro 谷歌的高性能多模态 AI 模型 高性能多模态 AI 模型,专为专业领域优化,具备强大的代码生成、多模态交互和深度推理能力。 040 AI热门工具图像生成# 人工智能# 代码生成# 内容创作