
蚂蚁集团
Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。
基于扩散模型的情感化动态头像生成工具 基于扩散模型的情感化动态头像生成方法,能够为说话的肖像生成生动且多样化的情感表达。







