GPT-4o 多模态能力实测:图像理解 + 语音对话 简介 OpenAI 发布的 GPT-4o 是首个真正意义上的多模态大模型,实现了文本、图像、语音的无缝融合。 多模态能力测试 图像理解能力 测试场景 | 场景 | 准确率 | 响应速度 | |------|--------|----------|...