大型企业正在重新思考如何在云端运行人工智能工作负载。优步就是最新的例子之一,它正在扩大对AWS芯片的使用,以支持其人工智能系统。
此次变革的核心是AWS设计的芯片,例如Graviton和Trainium。路透社报道称,优步正在加大对这些硬件的使用,以支持其网约车和外卖平台的AI模型和后端系统。优步的AI模型负责匹配乘客和司机、预估行程时间、设定价格以及管理外卖路线等核心功能。这些任务依赖于海量数据和持续更新,而这可能会推高云成本。
定制芯片提供了一种应对价格压力的途径。AWS 表示,与传统的基于 x86 的实例相比,Graviton 可以提高性价比,而 Trainium 则旨在降低训练成本。这些硬件或许能够帮助像 Uber 这样的公司运行更多 AI 任务,而无需大幅增加支出。

定制芯片如何改变云使用
对优步而言,探索替代硬件的决定与其规模密切相关。该公司业务遍及数十个国家,每天处理数百万笔交易。对于如此庞大的网络而言,即使是微小的效率提升也意义重大。
据路透社报道,Uber正在使用AWS芯片来提升训练和推理的工作负载。训练是指人工智能模型如何从数据中学习,而推理是指这些模型如何在实际系统中做出决策。这两个阶段都可能耗费大量成本,但推理通常在生产环境中持续运行,因此效率尤为重要。
Trainium 等芯片专为高吞吐量机器学习任务而设计,有助于最大限度地减少模型训练所需的时间和成本。基于 ARM 架构的 Graviton 则常用于需要更低功耗和更佳成本控制的通用工作负载。它们共同为企业在云端运行 AI 系统提供了更多选择。
平衡成本和灵活性
云战略也在发生变化。企业在工作负载的构建方式上扮演着更加积极的角色,从选择实例类型到针对特定芯片调整模型,再到平衡成本与性能。
然而,这种方法也会增加复杂性。开发人员需要针对基于 ARM 的处理器或专用 AI 芯片调整软件,并且可能需要与云服务提供商更紧密地协调。
Uber此举正值人工智能工作负载在众多行业迅速扩展之际。从金融到零售,各公司都在利用机器学习来执行欺诈检测、需求预测和客户支持等任务。随着这些系统的发展,管理其运行成本的需求也日益增长。
定制芯片是其中一种应对方案。像AWS这样的云服务提供商正在构建自己的处理器,这使他们能够更好地控制定价和性能。但这同时也引发了关于灵活性的问题。围绕特定云芯片构建系统的公司可能会发现,在不同云服务提供商之间迁移工作负载会更加困难。
Uber 使用 AWS 芯片的做法表明了这些权衡取舍在实践中是如何体现的。该公司并没有放弃云计算,而是使用了更专业的云硬件。路透社没有详细说明 Uber 部署的具体规模,但表示这些芯片支持平台中重要的 AI 驱动功能。
不断上涨的云成本迫使越来越多的公司重新思考其工作负载的运行方式。定制芯片或许无法取代通用计算,但它们正逐渐成为整体解决方案的一部分。
Uber 的举措反映了企业使用云方式的更广泛转变。企业越来越注重更高效地运行工作负载。企业需要在成本和灵活性之间取得平衡,而定制芯片可能会发挥更大的作用。

