多模态大模型

共 65 篇网址

测试用网址目录常用工具提示词 AI热门工具人声分离创作与影视编曲制作音乐生成音乐素材变声克隆文字转语音（配音播报）语音大模型多模态大模型 AI搜索工具学生教师文本生成编程代码图像生成 AI 小助手 AI 翻译总结摘要文档论文聊天对话辅助写作 AI开源项目生物医药科研视频生成 AI游戏娱乐休闲 API 超市对口型模特生成编辑转换 AI 会议 AI 办公 Excel PPT 公文写作思维导图 AI应用开发 AI开放平台网站开发语音转文字（语音识别）智能体创建 AI插件与浏览器 Logo设计室内装饰平面设计建筑设计服装设计超级智能体医疗健康 3D与动画 AI 陪伴虚拟数字人数据分析游戏开发海报插画电商广告 AI 学堂文献资料检测查重企业客服金融法律 AI 课程字幕水印 AI社区协作 AI短剧翻译配音简历|招聘|面试 AI艺术设计图像编辑 AI 抠图图片修复图片压缩图片放大音频编辑直播图片素材素材模板视频素材面部重构头像生成视频下载流量 AI视频工具 AI音频工具虚拟歌手伪造检测 MCP资源平台出行旅游 AI 机器人 AI 自动驾驶体育运动音乐发行 AI音乐平台世界模型 AI算力平台 AI数据集提示词 Prompt 脑机接口 ✂️ AI图像编辑 ✍️ AI写作辅助

排序

发布更新浏览点赞

OpenAI

GPT Image 1.5 GPT Image 1.5 是 OpenAI 最新发布的图像生成与编辑模型，可在 ChatGPT 内一句话出图、改图，效果更精准、文字更清晰、安全合规更严格。

0700

AI热门工具图像生成

蚂蚁集团

Ming-flash-omni 2.0 全模态大模型 Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型，基于 Ling-2.0 MoE 架构打造，实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级，部分指标超越 Gemini 2.5 Pro，为多模态应用开发提供高效统一入口。

0600

AI开源项目图像生成

科大讯飞星火同传语音大模型

国内首个具备端到端语音同传能力的大模型，其同传速度与精度直逼人类专家。

0870

AI 会议 AI 办公 # 人工智能 # 翻译工具 # 自然语言处理

天工AI全球官网

集搜索、写作、对话、文档分析、图片生成、PPT制作等多功能于一体的全能型人工智能助手，能够为用户提供高效、便捷的智能服务。

0670

PPT 图像生成 # 人工智能 # 内容创作 # 办公工具

元石科技问小白

国产AI智能助手新标杆问小白是由元石科技推出的AI智能助手，基于自研的元石大模型和DeepSeek-R1 671B满血版模型构建。它能够快速响应用户的各种需求，提供智能搜索、文本创作、逻辑推理、灵感辅助、高效阅读和资料整理等全方位服务。

0680

多模态大模型学生

百度文心ERNIE-5.0-Preview-1022模型

百度文心ERNIE-5.0-Preview-1022模型

ERNIE-5.0-Preview-1022 是百度最新发布的文心大模型预览版，在 LMArena 文本榜全球并列第二、国内第一，以创意写作、长文本理解与指令遵循三大能力为核心卖点。

0580

多模态大模型总结摘要

昆仑万维天工大模型o1版

一款具备强大中文逻辑推理能力的AI模型，能够处理复杂的数学、代码和逻辑推理任务。

0910

AI开放平台 AI搜索工具 # 人工智能 # 决策支持 # 编程辅助

Gemini 2.0 Pro

谷歌的高性能多模态 AI 模型高性能多模态 AI 模型，专为专业领域优化，具备强大的代码生成、多模态交互和深度推理能力。

0630

AI热门工具图像生成 # 人工智能 # 代码生成 # 内容创作

OpenAI

o1 OpenAI O1是OpenAI公司推出的一款先进的人工智能模型，旨在通过自然语言处理技术，为用户提供高效、智能的文本生成和处理服务。

0680

AI热门工具多模态大模型

Monica（莫妮卡）

Monica是一个基于大型语言模型的助手，可以帮助回答各种问题和提供信息。

0630

AI 小助手 AI插件与浏览器

GPT5

下一代人工智能助手 GPT-5是OpenAI推出的下一代大型语言模型，具有更强的自然语言理解和生成能力，能够进行多语言文本生成、对话理解、代码编写、逻辑推理等。

0700

AI热门工具图像生成 # 人工智能 # 企业应用 # 多模态交互

Qwen2.5-Omni

全方位多模态旗舰模型阿里开源的Qwen系列旗舰级端到端多模态大模型，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输出。

0640

AI热门工具图像生成

Chatgpt

4 Trubo ChatGPT 4 Turbo 是 OpenAI 推出的最新版本的大型语言模型，它基于 GPT-4 架构，并进行了优化，使其能够生成更长的文本，并具有更强的上下文理解能力。

0650

AI热门工具多模态大模型

GPT-4o

mini GPT-4o mini是OpenAI推出的一款成本效益极高的小型模型，旨在通过降低智能技术的成本，使其更广泛地应用于各种领域。该模型在MMLU（Massive Multitask Language Understanding）基准测试中获得了82%的分数，并在LMSYS leaderboard的聊天偏好任务中超越了GPT-41，展现了其强大的性能。GPT-4o mini的定价为每百万输入令牌15美分，每百万输出令牌60美分，相比之前的尖端模型，其价格降低了一个数量级，且比GPT-3.5 Turbo便宜了超过60%。

0640

AI热门工具图像生成

马斯克Grok

AI网页版 Grok AI是由xAI公司推出的一款具有先进推理能力的网页版AI工具，支持推理、编程、视觉生成和创意创作等功能。

0590

AI 小助手 AI开放平台