Oh My OpenCode:多模型协作的 AI 编程新范式

151 次阅读

Oh My OpenCode:多模型协作的 AI 编程新范式

你有没有想过,为什么我们非得被一个 AI 模型绑死?Claude 很强,GPT 也不错,Gemini 在前端方面表现出色——但单打独斗总有局限。Oh My OpenCode 给出了一个不一样的答案:让多个 AI 模型像真正的开发团队一样协作。

这东西到底是什么?

Oh My OpenCode(简称 OmO)是一个多模型智能体编排框架,专为 OpenCode 设计。它的核心理念很简单:不同的任务交给最擅长的模型去做。

Claude 负责整体协调,GPT 处理深度推理,Gemini 搞定前端视觉,Haiku 跑快速任务。这些模型不是各干各的,而是在一个统一的架构下自动协作。

说白了,这不是在"增强"某个 AI 工具,而是在打破"一个模型包打天下"的思维定式。

核心架构:智能体如何协作

OmO 的架构设计挺有意思。用户请求进来后,会经过这样一个流程:

用户请求

[Intent Gate] — 意图分类,搞清楚你到底想干嘛

[Sisyphus] — 主编排器,负责规划和分发任务

├─→ [Prometheus] — 战略规划(访谈模式)
├─→ [Atlas] — 任务编排和执行
├─→ [Oracle] — 架构咨询
├─→ [Librarian] — 文档和代码搜索
├─→ [Explore] — 快速代码库扫描
└─→ [分类智能体] — 按任务类型特化

这里有个关键设计:Sisyphus 分发任务时,不是指定具体模型,而是指定任务类别——visual-engineeringultrabrainquickdeep。系统会自动把类别映射到最合适的模型。你不用操心选哪个模型,框架替你搞定。

认识这些智能体

Sisyphus:永不停歇的执行者

名字来自希腊神话里那个每天推石头上山的西西弗斯。这个智能体就是你的主编排器,负责规划、分发任务,并驱动任务完成。它的特点是激进的并行执行——不会半途而废,不会分心,一定要把事情做完。

推荐搭配的模型:

  • Claude Opus 4.6(最佳体验,Sisyphus 的提示词就是为 Claude 优化的)
  • Claude Sonnet 4.6(性价比之选)
  • Kimi K2.5(很多用户专门用这个组合)
  • GLM 5(通过 Z.ai 使用效果不错)

Hephaestus:被逼出来的工匠

这个名字带点讽刺意味。Anthropic 因为这个项目封禁了 OpenCode 使用他们的 API,于是团队干脆做了一个原生的 GPT 智能体。

Hephaestus 跑在 GPT-5.3 Codex 上。给它一个目标,不用给详细步骤,它会自己探索代码库、研究模式、端到端执行。适合深度架构推理、跨多文件的复杂调试、跨领域知识整合这类场景。

Prometheus:战略规划师

Prometheus 会像真正的工程师一样"面试"你。它会问澄清性问题,识别范围和模糊点,在写一行代码之前先建立详细计划。

按 Tab 键进入 Prometheus 模式,或者在 Sisyphus 中输入 @plan "你的任务"

Atlas:任务指挥官

Atlas 负责执行 Prometheus 的计划。它把任务分发给专业子智能体,跨任务积累学习成果,独立验证完成情况。

运行 /start-work 就能让 Atlas 开始执行你的最新计划。

Oracle:架构顾问

只读的高智商顾问,专门处理架构决策和复杂调试。遇到不熟悉的模式、安全问题或多系统权衡时,可以咨询 Oracle。

其他辅助智能体

  • Metis:差距分析器,在计划定稿前捕捉 Prometheus 遗漏的内容
  • Momus:严苛的审核者,从清晰度、验证性、上下文等维度审查计划
  • Explore:快速代码库扫描,用速度优先的模型做模式发现
  • Librarian:文档和开源代码搜索,保持对库 API 和最佳实践的了解
  • Multimodal Looker:视觉和截图分析

两种工作模式

Ultrawork 模式:懒人福音

输入 ultrawork 或者简写 ulw,就这么简单。

智能体会自动搞定一切:探索代码库、研究模式、实现功能、用诊断工具验证。它会一直工作直到完成。这是"全自动"模式,你不用深度思考,因为智能体替你思考。

Prometheus 模式:精确控制

按 Tab 键进入 Prometheus 模式。

Prometheus 会像真正的工程师一样面试你,问澄清性问题,识别范围和模糊点,在动手之前建立详细计划。然后运行 /start-work,Atlas 接管执行。任务分发给专业子智能体,每个完成都独立验证,学习成果跨任务积累。

适合多日项目、关键生产变更、复杂重构,或者你想要有文档记录的决策轨迹时使用。

比纯 Claude Code 强在哪?

Claude Code 本身不错,但它是单智能体、单模型、单打独斗。OmO 把它变成了协调的团队:

并行执行:Claude Code 一次处理一件事,OmO 可以同时启动多个后台智能体——研究、实现、验证并行进行。相当于 5 个工程师同时干活。

哈希锚定编辑:Claude Code 的编辑工具在模型无法精确复现行内容时会失败。OmO 的 LINE#ID 内容哈希在应用前验证每次编辑。Grok Code Fast 1 的成功率从 6.7% 提升到了 68.3%。

意图门控:Claude Code 拿到提示词就跑。OmO 先分类你的真实意图——研究、实现、调查、修复——然后相应路由。误解更少,结果更好。

LSP + AST 工具:工作区级别的重命名、跳转定义、查找引用、预构建诊断、AST 感知的代码重写。这是原生 Claude Code 没有的 IDE 级精度。

技能内嵌 MCP:每个技能带自己的 MCP 服务器,作用域限定在任务内。上下文窗口保持干净,不会被所有工具撑爆。

纪律执行:Todo 执行器把闲置的智能体拉回工作,注释检查器清理 AI 废话,Ralph Loop 持续运行直到 100% 完成。系统不让智能体偷懒。

模型配置

OmO 支持灵活的模型配置。安装时会自动根据你有的 provider 生成最优配置,运行时还有 fallback 链保证可用性。

你也可以手动覆盖:

jsonc
{
  "agents": {
    "sisyphus": {
      "model": "kimi-for-coding/k2p5",
      "ultrawork": { "model": "anthropic/claude-opus-4-6" }
    },
    "librarian": { "model": "zai-coding-plan/glm-4.7" },
    "oracle": { "model": "openai/gpt-5.2" }
  },
  "categories": {
    "visual-engineering": { "model": "google/gemini-3-pro" },
    "quick": { "model": "anthropic/claude-haiku-4-5" },
    "ultrabrain": { "model": "openai/gpt-5.3-codex" }
  }
}

模型家族简介

Claude 系(指令遵循、结构化输出):Claude Opus 4.6、Sonnet 4.6、Haiku 4.5,以及行为类似的 Kimi K2.5、GLM 5

GPT 系(显式推理、原则驱动):GPT-5.3-codex(深度编码主力)、GPT-5.2(高智商,Oracle 默认)、GPT-5-Nano(超便宜快速)

特色模型:Gemini 3 Pro(视觉/前端)、MiniMax M2.5(快速实用)、Grok Code Fast 1(代码搜索优化)

快速上手

安装很简单,把下面这段话粘贴到你的 LLM 智能体会话里:

Install and configure oh-my-opencode by following the instructions here:
https://raw.githubusercontent.com/code-yeongyu/oh-my-opencode/refs/heads/dev/docs/guide/installation.md

安装完成后,输入 ultrawork 就能开始体验。

写在最后

Oh My OpenCode 代表的是一种思路转变:不再依赖单一模型,而是让多个模型各司其职、协同工作。随着 AI 模型越来越专业化,多模型编排和单模型方案之间的差距只会越来越大。

这不是临时的 hack,而是面向未来的架构选择。

感谢阅读,如果觉得有用欢迎分享
返回 AI使用笔记