Codex 上游跟随策略（Follow, Not Fork）

Status: Active Updated: 2026-03-01

文档定位

本文档用于设计与演进讨论，可能包含“目标态/候选方案”。
当前已落地行为以代码与 docs/quality/verification-status.md 为准。
若文档与代码冲突，请在同一 PR 同步修正文档。

背景

ForgeOps 的长期目标是做 AI 研发控制平面，不是重造上游运行时。 Codex 已在以下能力上持续快速演进：

Prompt 组装与上下文管理
技能加载/注入与隐式识别
MCP 加载、路由、审批与鉴权
沙箱与执行安全策略
长会话压缩、恢复与运行时稳定性

在这些能力上，个人项目很难长期追平上游演进速度。

目标

建立明确边界：ForgeOps 跟随 Codex 上游节奏，聚焦控制平面高杠杆能力，避免维护分叉。

原则

Follow，不 Fork

不在 ForgeOps 内复刻 Codex 的运行时核心机制。
上游已有能力优先通过配置、适配与策略接入，不做本地重实现。

控制平面优先

ForgeOps 聚焦 run/step/session 编排、质量闸门、证据链、恢复与审计。
回合内智能（prompt 细节、技能注入、MCP 内核）交由 Codex。

适配器隔离

运行时差异通过 Runtime Adapter 吸收。
禁止在业务编排层直接依赖某个 runtime 的私有协议细节。

责任边界

ForgeOps 负责：

任务编排：workflow、依赖、重试、并发、恢复
治理策略：platform/invariants/docs gate
证据沉淀：events/artifacts/sessions
运营闭环：失败模式 -> 规则/技能/脚本升级

Codex 负责：

turn 内 prompt 组装与策略注入
技能发现、加载、缓存、显式/隐式触发
MCP 生命周期与工具调用路由
沙箱/审批策略执行与长会话压缩恢复

决策规则（新增能力时）

先回答三个问题：

这是 turn 内问题还是 turn 间问题？

turn 内：优先使用 Codex 原生能力。
turn 间：优先在 ForgeOps 控制平面实现。

是否已有上游稳定能力？

有：接入/配置，不重造。
无：先以 adapter 扩展实现，避免渗透到编排核心。

是否可逆？

必须具备 feature flag 或降级路径。
2-4 周无指标收益则回滚。

禁止项

在 ForgeOps 中新增与 Codex 重叠的 skills loader/sandbox manager/MCP router。
为规避上游限制而在控制平面硬编码 runtime 私有行为。
将实验性上游接口直接写入默认主路径，且无降级开关。

运行节奏建议

周期性跟踪

每周检查上游变更摘要，评估是否影响兼容层。

升级策略

小步跟随，优先兼容层改造，不做破坏性重构。

风险控制

关键能力保持 smoke 验证：
- run create -> execute -> gates -> observe
- session resume/fallback
- skills resolve + step prompt injection

PR 检查清单（建议）

[ ] 该变更属于控制平面职责，未复刻上游运行时内核。
[ ] 与 Runtime Adapter 边界一致，无跨层耦合。
[ ] 有可逆开关或降级路径。
[ ] 更新了 docs/00-index.md 与 AGENTS.md 索引（如新增文档/能力）。