芝麻交易所gate官网 消息,4 月 13 日,马斯克旗下人工智能公司 xAI 宣布推出首个多模态 AI 模型 Grok-1.5V。除了强大的文本处理能力,Grok 还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。
在多个领域的基准测试中,Grok-1.5V 的表现均可与现有的前沿多模态模型相媲美。尤其在 xAI 新推出的 RealWorldQA 基准测试中,Grok 在现实世界空间理解能力上超越了同类模型。RealWorldQA 数据集包含 700 多张图像,旨在评估多模态模型对物理世界的基本理解能力。
Grok-1.5 将很快向早期测试人员和现有用户开放。