真正实现自动化的企业的目标是开发一种通用人工智能,可以部署到其整个机器人集群中,就像单个操作系统可以在不同的计算机上运行一样。
在仓库地面上行驶的轮式机器人、在校园周边巡逻的四足机器人以及用于盘点库存的无人机,它们运行在完全不同的软件栈上。每一种新的硬件都需要各自专属的导航、感知和任务执行算法。这种各自为政的方法导致开发成本高昂、集成复杂、模型训练效率低下,从而大幅推高了总体拥有成本并阻碍了可扩展性。

Galbot与大学研究团队合作,发布了名为 NavFoM(导航基础模型)的系统,声称该系统能够解决碎片化问题。该公司将其描述为“全球首个跨载体、跨任务导航”基础人工智能模型,可用于企业的所有机器人。
该系统的设计不再局限于学习单一的导航任务,而是旨在教会单个人工智能模型如何移动的通用概念。实际上,这意味着同一个核心模型可以部署在“四足机器人、轮式人形机器人、腿式人形机器人、无人机,甚至车辆”等各种设备上。该模型能够解读自然语言指令,执行一系列任务,例如在工厂车间“跟随那个人”或“在停车场找到门口的红色汽车”。
其核心商业价值在于部署效率。该模型旨在“无需预先映射或额外训练数据,即可在以前从未见过的场景中运行”。对于运营经理而言,这种零尝试能力可以省去部署机器人前耗时耗力的激光扫描设施或创建详细数字孪生模型等步骤。然而,其价值的真正考验在于试点项目。运营负责人应在动态环境中(例如繁忙的收货码头)而非静态走廊中验证这一说法。
这种统一的方法还支持人工智能交叉学习,即一种机器人类型学习到的行为可以指导更广泛的机器人集群中的其他机器人。加尔博特建议,来自自动驾驶系统的“道路预测”知识可以用于指导繁忙仓库通道中轮式机器人的路径规划。
采用基础导航模型并非简单的硬件更换。企业 IT 和运营领导者必须考虑其背后的技术需求。
该系统的智能建立在庞大的数据集之上,据报道,该数据集包含八百万个导航数据点和四百万个问答样本。对于首席数据官而言,这凸显了实体运营中的竞争优势将越来越依赖于数据。虽然 Galbot 提供了基础,但企业能否利用自身专有的视觉和空间数据对其进行微调,将决定其最终性能并构建竞争优势。
计算负载也是一个关键因素。NavFoM 是一个拥有 70 亿个参数的模型。虽然 Galbot 声称其“BATS 策略”(预算感知令牌采样)能够通过模拟人类注意力实现实时响应,但这仍然需要在机器人自身配备强大的计算硬件。
为了提升训练性能,该公司开发了一种“视觉特征缓存”机制。据报道,该方法可将训练速度提升2.9倍,并将平均GPU内存成本降低1.8倍,从而使大规模训练成为可能。
这项技术改变了企业领导者的采购思路。对于首席信息官和首席技术官而言,他们不应再将“安全机器人”视为一个黑盒设备进行采购,而应关注能够驱动整个机器人集群的底层人工智能模型。
在筛选潜在供应商时,关键问题在于他们的平台是单一用途的解决方案,还是可以跨不同硬件扩展的通用基础架构。理论上,统一模型的长期总拥有成本应该低于管理十几个不同系统的成本。
Galbot 已开始构建这一平台概念,并开发了诸如用于远程跟随的 TrackVLA++ 和用于路线规划的 UrbanVLA 等专用应用程序。这种方法表明,人们正在转变对机器人的认知,不再将其视为“局部功能”,而是将其视为“智能基础设施”的一部分。
为应对这一变化而制定数据战略和采购政策的领导者,将更有能力有效地扩大其人工智能和机器人车队的规模。

