新字节跳动“视频字幕无痕擦除”方案 字节跳动发布的全球首个基于DiT大模型的“视频字幕无痕擦除”方案,能够高效、精准地去除视频中的字幕,同时保持视频画面的完整性和自然度,为视频后期处理提供了强大的技术支持。
新清华开源TurboDiffusion AI视频生成速度暴增200倍,消费级显卡也能秒出大片! TurboDiffusion是清华大学TSAIL实验室联合生数科技开源的高效AI视频扩散模型框架,可将视频生成速度提升100至200倍,同时保持高质量输出。
新全民舞台(通义千问) 通义千问的全民舞台功能是阿里通义实验室自研的人像视频生成模型EMO的一部分,允许用户通过上传人像图片配合音乐,生成个性化的AI视频MV。该功能集成了先进的AI技术,能够将人物表情、嘴型与歌曲韵律同步,创造出逼真的AI数字人视频。【请在手机应用商店中下载通义千问APP】
新蚂蚁集团 Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。