infrastructure

代理推理需要路由层

Cloudflare 的统一人工智能平台指出了一个实际的代理运行时问题：真实的工作流程将调用多个模型，并且需要成本、延迟和可靠性控制。

#cloudflare #ai-gateway #model-routing #inference #agent-runtime

发布日期 2026-05-02T09:05:00.000Z

更新日期 2026-05-06 09:23:47

作者 Polygonface Desk

返回 infrastructure

代理推理需要路由层

Cloudflare 的 AI Platform 更新提醒我们，代理基础架构不仅仅涉及内存、工具和沙箱。它还与推理路由有关。

前提很简单：真实的代理工作流程通常需要多个模型。支持代理可能会使用廉价的模型进行分类，使用更强的推理模型进行规划，并使用较轻的模型执行子任务。编码工作流程可能会调用一个模型进行搜索，调用另一个模型进行编辑，调用另一个模型进行审查。

一旦发生这种情况，模型访问就成为操作层。团队需要提供者选择、重试行为、延迟控制、支出报告以及在正确模型发生变化时的干净切换方式。

为什么单一供应商思维会被打破

普通的聊天机器人可以通过一次提示和一次模型调用来生存。代理可以跨任务链接多个调用。这意味着一个缓慢的提供程序可能会加剧延迟，而一个失败的请求可能会触发一系列下游故障。

Cloudflare 将 AI Gateway 和 Workers AI 定位为跨提供商的统一端点，具有模型访问、集中支出可见性、重试、日志记录控制和基于元数据的报告。

成本控制角度

由于工作呈链条式扩展，代理经济学很快就会变得丑陋。用户感觉简单的任务可能涉及规划、检索、工具调用、验证和最终综合。如果没有路由和可观察性，团队就无法判断哪个工作流程正在消耗预算或延迟在哪里累积。

Polygonface 读

代理运行时堆栈需要路由层，就像 Web 系统需要负载均衡器和可观察性一样。模型质量仍然很重要，但生产可靠性将取决于团队跨工作流程的路由、监控和预算推断的效果。

来源

Cloudflare：Cloudflare 的 AI 平台：为代理设计的推理层

代理推理需要路由层

Cloudflare 的 AI Platform 更新提醒我们，代理基础架构不仅仅涉及内存、工具和沙箱。它还与推理路由有关。

一旦发生这种情况，模型访问就成为操作层。团队需要提供者选择、重试行为、延迟控制、支出报告以及在正确模型发生变化时的干净切换方式。

为什么单一供应商思维会被打破

Cloudflare 将 AI Gateway 和 Workers AI 定位为跨提供商的统一端点，具有模型访问、集中支出可见性、重试、日志记录控制和基于元数据的报告。

成本控制角度

Polygonface 读

来源

Cloudflare：Cloudflare 的 AI 平台：为代理设计的推理层

agentic / workflows

财务代理将模板转变为受监管的工作流程

Anthropic 的金融服务代理展示了下一个企业模式：域模板、办公套件上下文以及受监管工作的托管执行。

2026年5月6日 Polygonface Desk

#anthropic #financial-services #claude-cowork

governance

Frontier Firms 需要运营模型，而不是人工智能访问

Microsoft 的 Frontier Firm 框架非常有用，因为它将对话从工具访问转移到跨人员、代理和治理的工作设计。

2026年5月6日 Polygonface Desk

#microsoft #frontier-firm #copilot-cowork

governance

代理治理成为控制平面市场

Microsoft 的 Agent 365 推送使企业方向变得明确：座席正在成为库存、身份、策略和审计对象，而不仅仅是聊天功能。

2026年5月6日 Polygonface Desk

#agent-governance #microsoft-agent-365 #enterprise-ai

infrastructure

代理商开始配置自己的云

Cloudflare 和 Stripe 的配置流程显示代理超越了代码生成，进入了帐户创建、支付、域、令牌和生产部署。

2026年5月5日 Polygonface Desk

#cloudflare #stripe-projects #mcp

代理推理需要路由层

代理推理需要路由层

为什么单一供应商思维会被打破

成本控制角度

Polygonface 读

来源

代理推理需要路由层

为什么单一供应商思维会被打破

成本控制角度

Polygonface 读

来源

来自编辑台的更多文章。

财务代理将模板转变为受监管的工作流程

Frontier Firms 需要运营模型，而不是人工智能访问

代理治理成为控制平面市场

代理商开始配置自己的云