我们对涵盖广泛领域和任务的查询进行采样,以了解 GPT-4V 的功能,包括开放世界视觉理解(open-world visual understanding)、视觉描述(visual description)、多模态知识(multimodal knowledge)、常识(commonsense)、场景文本理解(scene text understandin)、文档推理(document reasoning)、编码(coding)、时间推理(temporal reasonin)、抽象推理(abstract reasoning)、情感理解(emotion understanding) , 还有很多。GPT-4V 在许多实验领域表现出了令人印象深刻的人类水平的能力。