用心打造
VPS知识分享网站

Gemini 3:谷歌为开发者启用新的智能体人工智能工作流程

对于开发者而言,Gemini 3 将 AI 的应用范围从简单的代码补全扩展到了自主代理工作流程的概念。

随着开发团队面临越来越大的压力,需要更快地交付复杂的软件,瓶颈往往从编写语法转移到管理逻辑和架构。谷歌最新推出的双产品——Gemini 3 超光速飞行器和 Antigravity 开发平台——试图通过将开发者的角色从代码编写者转变为智能体架构师来突破这一瓶颈。

Gemini 3:谷歌为开发者启用新的智能体人工智能工作流程

此次发布标志着人工智能编码工具的发展方向与目前主流的基于聊天功能的辅助方式截然不同。该公司推出了一种专门针对“长周期”任务优化的模型,以及一个用于管理异步代理的平台,这表明企业软件开发的未来在于任务委派,而非单纯的加速。

推理引擎:Gemini 3

此次调整的核心是 Gemini 3,谷歌声称该模型为智能体编码建立了“全新的智能基础”。根据技术报告,Gemini 3 Pro 在 Terminal-Bench 2.0 基准测试中取得了 54.2% 的得分,该测试旨在评估模型通过终端操作计算机的能力,而其前代产品 Gemini 2.5 Pro 的得分仅为 32.6%。

对于评估自动化代码生成的开发者而言,或许更重要的是该模型在 SWE-Bench Verified 测试中的表现,据报道,该模型在单次测试中取得了 76.2% 的分数。虽然基准测试结果在经过独立验证之前应谨慎看待,但这些数据表明该模型具备处理多步骤推理的能力,而此前的版本在这方面表现欠佳。

基准测试表,将新款 Google Gemini 3 Pro 型号与其他 AI 竞争对手(包括 Anthropologie Cloude 和 OpenAI GPT-5)进行比较。

该模型为企业大规模采用人工智能提供了一种有趣的经济方案。目前该模型处于预览阶段,价格为“每百万个输入代币 2 美元,每百万个输出代币 12 美元(提示数量不超过 20 万个代币)”。这种定价结构可能会迫使 IT 领导者仔细计算自主代理的投资回报率,并在代币成本与节省下来的大量样板代码或重构工作时间之间进行权衡。

该模型架构还优先考虑上下文保留,这对于审查大型代码库至关重要。谷歌指出,该模型“能够处理跨整个代码库的复杂、长期任务,并在多文件重构、调试会话和功能实现过程中保持上下文”。对于企业遗留系统而言,理解数十年前模块之间的相互作用至关重要,因此这种长期上下文保留能力是部署的先决条件。

车辆:谷歌反重力

虽然 Gemini 3 模型提供了引擎,但实现这一全新工作流程的载体是 Google Antigravity。这个目前处于公开预览阶段的新平台表明,传统的集成开发环境 (IDE) 并不适合管理自主代理。

谷歌表示:“如今的集成开发环境(IDE)与几年前的IDE已截然不同。Antigravity正在推动IDE朝着以代理为先的未来发展,它具备浏览器控制功能、异步交互模式以及以代理为先的产品形态。”

这其中的操作意义重大。在标准的集成开发环境(IDE)中,开发者主导,人工智能辅助。而在Antigravity中,这种模式完全颠倒了。

Google Antigravity 引入了一个“管理器”界面,其功能类似于“任务控制中心”,可以“并行地在多个工作区中生成、协调和观察多个代理”。这使得高级开发人员理论上可以同时管理多个工作流程;例如,让一个代理研究库更新,而另一个代理则编写前端组件。

这与整个行业向“智能体”工作流程发展的大趋势相符,但谷歌明确地将目标锁定在“人机交互”的摩擦上,这种摩擦往往会阻碍智能体的普及。其目标是实现这样一种状态:人类“在更高的抽象层面上与智能体交互,而不是通过单个提示和工具调用”。

企业采用自主编码代理的主要障碍是“黑箱”问题。如果像 Gemini 3 这样的 AI 模型在无人监督的情况下修改代码,引入不易察觉的错误或安全漏洞的风险就会增加。

谷歌承认,“如今大多数产品要么向用户展示代理执行的每一个操作和工具调用,要么只显示最终的代码更改,而没有任何上下文”。这两种方法都无法建立生产级软件所需的信任度。

为了缓解这个问题,Antigravity 利用“工件”交付物(例如任务列表、实施计划和屏幕截图),使开发人员能够在提交代码之前验证代理的逻辑。

谷歌解释说:“反重力中的代理使用人工制品向用户传达信息,表明它理解自己正在做什么,并且正在彻底验证自己的工作。”

对于金融或医疗保健等合规性要求极高的行业而言,这种审计追踪至关重要。在代码生成之前审查实施计划的能力,可以节省代码审查期间大量的补救时间。

该平台还支持反馈机制,用户可以对这些结果进行评论。谷歌表示:“这些反馈将自动整合到代理的执行过程中,无需您停止代理的进程。” 这有助于简化纠错流程,而纠错流程在基于聊天的界面中通常较为繁琐。

开发者并非只能使用谷歌的Gemini人工智能模型。

出人意料的是,Antigravity 并没有完全局限于谷歌的模型,这一决定或许会吸引那些担心被供应商锁定的企业。该平台允许开发者在代理程序中使用“谷歌的 Gemini 3 模型、Anthropic 的 Claude Sonnet 4.5 模型以及 OpenAI 的 GPT-OSS 模型,从而为开发者提供模型选择权。”

这种灵活性使得工程团队能够选择最适合特定语言或任务的模型,而不是强行采用一刀切的方法。这也表明谷歌将 Antigravity 定位为一个中立的工作流层,而不仅仅是 Gemini 的交付机制。

该平台还与现有的开发者工具集成。Gemini 3 Pro“可通过您常用的开发者工具在更广泛的生态系统中使用”,目前已与 Cursor、GitHub、JetBrains、Manus 和 Cline 等产品展开集成。

尽管基准测试结果优异,但IT领导者应降低对完全自主运行的预期。谷歌承认,在代理运行方面,我们尚未做好“无需人工干预即可连续运行数天”的准备。这项技术正在不断进步,但它仍然是一种辅助工作流程,而非取代熟练工程师。

引入了“vibe coding”(一种只使用自然语言作为语法的技术),其市场定位是快速原型设计。

谷歌表示,其 Gemini 3 模型只需一次提示即可将高层次的想法转化为完全交互式的应用程序。这降低了非技术人员创建内部工具或仪表板的门槛,但也带来了一个新的管理挑战:如何确保这些快速生成的应用程序符合安全标准和数据隐私法规。

Gemini 3 和 Antigravity 的发布表明,人工智能带来的效率提升将越来越多地来自于并行执行,而不仅仅是更快的打字速度。通过将开发人员与代码的即时执行解耦,团队理论上可以在不线性增加人员规模的情况下扩展其产量。

然而,这需要改变工程管理方式。技能要求从语法熟练度转移到系统设计和验证。

谷歌表示:“我们希望 Antigravity 成为智能体时代软件开发的基地。” 它能否实现这一目标,取决于它与企业遗留代码混乱且往往复杂的实际情况的整合程度,而不仅仅是与全新项目的整合。

目前,这项技术已可供测试。Google Antigravity 提供免费的公开预览版,Gemini 3 Pro 可通过 Google AI Studio 访问。企业领导者应鼓励其研发团队试用这些工具,尤其是在受控环境下评估“管理器”工作流程对开发速度和代码质量的影响。

赞(0)
未经允许不得转载;国外VPS测评网 » Gemini 3:谷歌为开发者启用新的智能体人工智能工作流程
分享到