蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。
Vidu Q2 开启 AI 视频生成的“演技时代” Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
阿里 Qwen-Image-Edit-2511 新一代图像编辑模型,人物一致性大幅提升 Qwen-Image-Edit-2511 是阿里 Qwen 团队开源的图像编辑大模型,能在任意创意操作中精准保持人物面部特征,并支持多人、多物体、光影等复杂场景的高保真编辑。
Runway Gen-3 Alpha RunwayML推出了Gen-3 Alpha,这是一款用于高保真、可控视频生成的新型模型。它是Runway基于为大规模多模态训练而构建的新基础设施训练的首批模型之一,与Gen-2相比,在保真度、一致性和动作上都有显著提升,是构建通用世界模型的重要一步。