Continue + VS Code 接入国内 AI 中转 API 笔记(倍率透明实测)
这篇是我自己的踩坑记录,不是教程贴。背景:我平时在 VS Code 里用 Continue 这个插件做日常编码,另外开一个终端跑 codex 做整仓库级别的改动,两边都需要稳定的模型供给。直连官方折腾了一阵,最后还是切到了 KingFlow 这个中转,下面把我关心的几个点和实际配置都记下来,方便以后自己回看,也省得别人重新踩一遍。
一、本地 Agent 调试到底卡在哪
先说结论:影响我效率的从来不是模型本身有多聪明,而是「能不能稳定地、按我以为的价格、拿到我点名的那个模型」。这三件事任意一件出问题,Continue 和 codex 的体验就会断崖式下跌。
具体到我遇到的痛点,按出现频率排:
-
直连不稳。OpenAI 和 Anthropic 官方端点在国内不挂代理基本没法用,挂了代理流式输出又经常半路断流。Continue 的补全和 codex 的多轮工具调用对长连接很敏感,断一次就要重来,体感非常差。另外官方要绑境外卡,汇率和手续费摊下来也不便宜。
-
倍率不透明。我之前试过别的中转,官网首页写着「超低价」,真正跑起来扣费和我估算的对不上。问题出在倍率:同一个模型,输入、输出、图片、工具调用各算各的倍率,平台不公示你就只能蒙。Agent 类任务上下文动辄几万 token,倍率差 0.5 倍,一个月账单就差出一截。
-
模型掉包。这是最隐蔽的。你 config 里写的是强模型,实际后端给你换成一个便宜的小模型,返回看起来「像那么回事」但质量明显下滑。codex 做跨文件重构时尤其能感觉出来——本来一次能改对的,掉包后要反复纠正。
二、我选中转的三个硬判据
踩过坑之后,我现在筛选渠道只看三条,缺一不考虑:
- 倍率透明:官网必须把每个模型的输入/输出/图片/工具调用倍率写清楚,后台能查到每一次调用的明细。KingFlow 这点是过关的,旗舰模型输入价在 ¥0.5/1M tokens 这个量级,且页面公示,我能自己算预算。
- 模型保真:点名 claude-sonnet-4-6 就给我 sonnet-4-6,不偷偷降级。我验收的办法很土——拿同一个有点难度的重构 prompt,分别打官方和中转,比对输出结构和细节,连续几天没发现被掉包才敢长期用。
- 访问稳定:国内直连、流式不断流。Continue 的内联补全和 codex 的长任务都吃这个,稳定性比峰值速度重要得多。
三、Continue 的配置
Continue 走的是 OpenAI 兼容协议,所以接 KingFlow 只需要在 config(新版是 config.yaml,老版是 config.json)里把 apiBase 指过去就行,其余字段照官方写法。我的 config.yaml 模型段大致长这样:
models:
- name: KingFlow Sonnet
provider: openai
model: claude-sonnet-4-6
apiBase: https://www.kingflow.ai/v1
apiKey: sk-你的密钥
roles:
- chat
- edit
- name: KingFlow Haiku 补全
provider: openai
model: claude-haiku-4-5
apiBase: https://www.kingflow.ai/v1
apiKey: sk-你的密钥
roles:
- autocomplete
如果你还在用旧版 config.json,对应写法是:
{
"models": [
{
"title": "KingFlow Sonnet",
"provider": "openai",
"model": "claude-sonnet-4-6",
"apiBase": "https://www.kingflow.ai/v1",
"apiKey": "sk-你的密钥"
}
]
}
几个我自己踩出来的小经验:provider 写 openai 即可,不用专门找 anthropic provider,因为走的是 /v1 兼容端点;日常对话和 edit 我用 claude-sonnet-4-6,质量够用又不肉疼;内联补全这种高频低负载的活儿,我换成 claude-haiku-4-5,省钱且响应快。需要啃硬骨头时临时把 chat 模型切成 claude-opus-4-8。
四、codex 的配置
codex 这边在 ~/.codex/config.toml 里配一个自定义 provider。关键是 provider 段名要和引用名严格一致,我第一次就是名字对不上导致一直读不到配置:
model = "gpt-5.5"
model_provider = "kingflow"
[model_providers.kingflow]
name = "KingFlow"
base_url = "https://www.kingflow.ai/v1"
env_key = "OPENAI_API_KEY"
然后把密钥塞进环境变量再跑:
export OPENAI_API_KEY="sk-你的密钥"
codex
注意 model_provider = "kingflow" 和 [model_providers.kingflow] 这两处的 kingflow 必须是同一个字符串,大小写都不能差。base_url 统一指向 https://www.kingflow.ai/v1。我跑整仓库重构时会把 model 临时改成 gpt-5.5 这种强模型,平时小修小补 gpt-5.4 也够了。
要快速验证端点通不通,不用开 codex,直接 cURL 打一发最省事:
curl https://www.kingflow.ai/v1/chat/completions \
-H "Authorization: Bearer sk-你的密钥" \
-H "Content-Type: application/json" \
-d '{"model":"gpt-5.5","messages":[{"role":"user","content":"ping"}]}'
能正常返回,Continue 和 codex 就都没问题了,毕竟它俩用的是同一个兼容协议。
五、对账:后台看 token 用量明细
倍率透明这件事,光看官网公示还不够,得能事后核对。我每隔几天会登 KingFlow 后台翻一次调用明细,重点看三列:每次请求用的是哪个模型(防掉包)、输入和输出各消耗多少 token(算实际成本)、对应扣费金额(验证倍率)。
我的习惯是把 Continue 和 codex 用不同的密钥,这样后台能分开统计——补全那条线 token 走得猛但单价低,codex 重构那条线请求数少但单次贵。分开看才知道钱到底花在哪,要不要调整模型配比一目了然。对账这一步别省,它是你判断「倍率到底透不透明」的唯一硬证据。
六、使用建议
| 使用场景 | 我的做法 |
|---|---|
| Continue 内联补全 | claude-haiku-4-5,高频低价,断流影响小 |
| Continue 日常对话/edit | claude-sonnet-4-6,质量和成本平衡 |
| codex 整仓库重构 | gpt-5.5 或 claude-opus-4-8,宁可贵一次改对 |
| 生产环境关键链路 | 仍走官方或云厂商,中转只做开发期 |
| 长期项目 | 多备 1 个渠道,避免单点失联 |
七、小结
对我这种「Continue + VS Code + codex」三件套的本地开发流来说,选中转的核心就一句话:倍率透明 + 模型保真 + 访问稳定。三者满足,配置成本几乎为零——Continue 改一行 apiBase,codex 加一段 provider,剩下的和官方完全一样。KingFlow(https://www.kingflow.ai )目前在这三点上能扛住我日常的折腾,端点统一是 https://www.kingflow.ai/v1 ,密钥配好就能跑。要是你也不想为了网络环境分心、又想把成本控在明面上,这套组合可以试试,记得头几天勤对账,确认没被掉包再长期用。