Oh My OpenCode:多模型协作的 AI 编程新范式
你有没有想过,为什么我们非得被一个 AI 模型绑死?Claude 很强,GPT 也不错,Gemini 在前端方面表现出色——但单打独斗总有局限。Oh My OpenCode 给出了一个不一样的答案:让多个 AI 模型像真正的开发团队一样协作。
这东西到底是什么?
Oh My OpenCode(简称 OmO)是一个多模型智能体编排框架,专为 OpenCode 设计。它的核心理念很简单:不同的任务交给最擅长的模型去做。
Claude 负责整体协调,GPT 处理深度推理,Gemini 搞定前端视觉,Haiku 跑快速任务。这些模型不是各干各的,而是在一个统一的架构下自动协作。
说白了,这不是在"增强"某个 AI 工具,而是在打破"一个模型包打天下"的思维定式。
核心架构:智能体如何协作
OmO 的架构设计挺有意思。用户请求进来后,会经过这样一个流程:
用户请求
↓
[Intent Gate] — 意图分类,搞清楚你到底想干嘛
↓
[Sisyphus] — 主编排器,负责规划和分发任务
↓
├─→ [Prometheus] — 战略规划(访谈模式)
├─→ [Atlas] — 任务编排和执行
├─→ [Oracle] — 架构咨询
├─→ [Librarian] — 文档和代码搜索
├─→ [Explore] — 快速代码库扫描
└─→ [分类智能体] — 按任务类型特化
这里有个关键设计:Sisyphus 分发任务时,不是指定具体模型,而是指定任务类别——visual-engineering、ultrabrain、quick、deep。系统会自动把类别映射到最合适的模型。你不用操心选哪个模型,框架替你搞定。
认识这些智能体
Sisyphus:永不停歇的执行者
名字来自希腊神话里那个每天推石头上山的西西弗斯。这个智能体就是你的主编排器,负责规划、分发任务,并驱动任务完成。它的特点是激进的并行执行——不会半途而废,不会分心,一定要把事情做完。
推荐搭配的模型:
- Claude Opus 4.6(最佳体验,Sisyphus 的提示词就是为 Claude 优化的)
- Claude Sonnet 4.6(性价比之选)
- Kimi K2.5(很多用户专门用这个组合)
- GLM 5(通过 Z.ai 使用效果不错)
Hephaestus:被逼出来的工匠
这个名字带点讽刺意味。Anthropic 因为这个项目封禁了 OpenCode 使用他们的 API,于是团队干脆做了一个原生的 GPT 智能体。
Hephaestus 跑在 GPT-5.3 Codex 上。给它一个目标,不用给详细步骤,它会自己探索代码库、研究模式、端到端执行。适合深度架构推理、跨多文件的复杂调试、跨领域知识整合这类场景。
Prometheus:战略规划师
Prometheus 会像真正的工程师一样"面试"你。它会问澄清性问题,识别范围和模糊点,在写一行代码之前先建立详细计划。
按 Tab 键进入 Prometheus 模式,或者在 Sisyphus 中输入 @plan "你的任务"。
Atlas:任务指挥官
Atlas 负责执行 Prometheus 的计划。它把任务分发给专业子智能体,跨任务积累学习成果,独立验证完成情况。
运行 /start-work 就能让 Atlas 开始执行你的最新计划。
Oracle:架构顾问
只读的高智商顾问,专门处理架构决策和复杂调试。遇到不熟悉的模式、安全问题或多系统权衡时,可以咨询 Oracle。
其他辅助智能体
- Metis:差距分析器,在计划定稿前捕捉 Prometheus 遗漏的内容
- Momus:严苛的审核者,从清晰度、验证性、上下文等维度审查计划
- Explore:快速代码库扫描,用速度优先的模型做模式发现
- Librarian:文档和开源代码搜索,保持对库 API 和最佳实践的了解
- Multimodal Looker:视觉和截图分析
两种工作模式
Ultrawork 模式:懒人福音
输入 ultrawork 或者简写 ulw,就这么简单。
智能体会自动搞定一切:探索代码库、研究模式、实现功能、用诊断工具验证。它会一直工作直到完成。这是"全自动"模式,你不用深度思考,因为智能体替你思考。
Prometheus 模式:精确控制
按 Tab 键进入 Prometheus 模式。
Prometheus 会像真正的工程师一样面试你,问澄清性问题,识别范围和模糊点,在动手之前建立详细计划。然后运行 /start-work,Atlas 接管执行。任务分发给专业子智能体,每个完成都独立验证,学习成果跨任务积累。
适合多日项目、关键生产变更、复杂重构,或者你想要有文档记录的决策轨迹时使用。
比纯 Claude Code 强在哪?
Claude Code 本身不错,但它是单智能体、单模型、单打独斗。OmO 把它变成了协调的团队:
并行执行:Claude Code 一次处理一件事,OmO 可以同时启动多个后台智能体——研究、实现、验证并行进行。相当于 5 个工程师同时干活。
哈希锚定编辑:Claude Code 的编辑工具在模型无法精确复现行内容时会失败。OmO 的 LINE#ID 内容哈希在应用前验证每次编辑。Grok Code Fast 1 的成功率从 6.7% 提升到了 68.3%。
意图门控:Claude Code 拿到提示词就跑。OmO 先分类你的真实意图——研究、实现、调查、修复——然后相应路由。误解更少,结果更好。
LSP + AST 工具:工作区级别的重命名、跳转定义、查找引用、预构建诊断、AST 感知的代码重写。这是原生 Claude Code 没有的 IDE 级精度。
技能内嵌 MCP:每个技能带自己的 MCP 服务器,作用域限定在任务内。上下文窗口保持干净,不会被所有工具撑爆。
纪律执行:Todo 执行器把闲置的智能体拉回工作,注释检查器清理 AI 废话,Ralph Loop 持续运行直到 100% 完成。系统不让智能体偷懒。
模型配置
OmO 支持灵活的模型配置。安装时会自动根据你有的 provider 生成最优配置,运行时还有 fallback 链保证可用性。
你也可以手动覆盖:
{
"agents": {
"sisyphus": {
"model": "kimi-for-coding/k2p5",
"ultrawork": { "model": "anthropic/claude-opus-4-6" }
},
"librarian": { "model": "zai-coding-plan/glm-4.7" },
"oracle": { "model": "openai/gpt-5.2" }
},
"categories": {
"visual-engineering": { "model": "google/gemini-3-pro" },
"quick": { "model": "anthropic/claude-haiku-4-5" },
"ultrabrain": { "model": "openai/gpt-5.3-codex" }
}
}
模型家族简介
Claude 系(指令遵循、结构化输出):Claude Opus 4.6、Sonnet 4.6、Haiku 4.5,以及行为类似的 Kimi K2.5、GLM 5
GPT 系(显式推理、原则驱动):GPT-5.3-codex(深度编码主力)、GPT-5.2(高智商,Oracle 默认)、GPT-5-Nano(超便宜快速)
特色模型:Gemini 3 Pro(视觉/前端)、MiniMax M2.5(快速实用)、Grok Code Fast 1(代码搜索优化)
快速上手
安装很简单,把下面这段话粘贴到你的 LLM 智能体会话里:
Install and configure oh-my-opencode by following the instructions here:
https://raw.githubusercontent.com/code-yeongyu/oh-my-opencode/refs/heads/dev/docs/guide/installation.md
安装完成后,输入 ultrawork 就能开始体验。
写在最后
Oh My OpenCode 代表的是一种思路转变:不再依赖单一模型,而是让多个模型各司其职、协同工作。随着 AI 模型越来越专业化,多模型编排和单模型方案之间的差距只会越来越大。
这不是临时的 hack,而是面向未来的架构选择。