新蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。
新Stability AI Stable Audio 2.5 专业级AI音频生成工具 Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,可在几秒内生成高质量、多段落结构的音乐,支持文本转音频、音频修复等多种创作方式。
新腾讯混元开源端到端视频音效生成模型HunyuanVideo-Foley HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型,能够根据输入的视频内容和文字描述,自动生成与画面高度匹配的高质量音效,为视频创作带来沉浸式体验。