字节跳动“视频字幕无痕擦除”方案 字节跳动发布的全球首个基于DiT大模型的“视频字幕无痕擦除”方案,能够高效、精准地去除视频中的字幕,同时保持视频画面的完整性和自然度,为视频后期处理提供了强大的技术支持。
Moki 美图秀秀AI短片、广告生成工具 Moki是由美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。它基于美图自研的奇想智能大模型(MiracleVision),提供智能剪辑、自动配乐、音效添加和字幕生成等功能。
昆仑万维 Skywork R1V4-Lite 集成视觉推理与工具调用的轻量级多模态智能体 Skywork R1V4-Lite 是昆仑万维(Skywork AI)推出的轻量级多模态智能体,聚焦视觉 - 语言推理,具备图像理解、工具调用、多步推理与深度研究能力,无需复杂提示词即可通过图像输入自动完成任务。
TRELLIS.2-4B 微软开源的高精度图像到 3D 生成工具 TRELLIS.2-4B 是微软开源的一款基于流匹配 Transformer 的大型 3D 生成模型,能够以单张图片为输入,快速生成具备高保真度、复杂拓扑结构和 PBR 材质的 3D 资产,适用于多种高精度 3D 建模场景。