新Google AI Studio Nano Banana 多模态图像生成与编辑工具 Nano Banana 是谷歌推出的 Gemini 2.5 Flash Image 多模态模型,擅长以极高一致性完成文本生成图像、图像编辑与多图融合任务,适合个人创作与商业设计。
新Vidu Q2 开启 AI 视频生成的“演技时代” Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
新TabPedia 表格理解大模型 TabPedia是一个新型的大型视觉-语言模型,由中国科学技术大学和字节跳动公司联合开发。该模型通过概念协同机制,能够无缝集成多种视觉表格理解(VTU)任务,如表格检测、表格结构识别、表格查询和表格问题回答。
新ChatTTS 文本转语音 ChatTTS是一款基于深度学习技术的文本到语音(TTS)转换工具,专为对话场景设计,能够生成自然、流畅的语音输出。ChatTTS支持多种语言,包括中文和英文,并提供了丰富的音色和细粒度控制选项。