Continue + VS Code 接入国内 AI 中转 API 笔记(倍率透明实测)

KingFlow · 国内直连 AI API 中转

KingFlow Endpoint

这篇是我自己的踩坑记录,不是教程贴。背景:我平时在 VS Code 里用 Continue 这个插件做日常编码,另外开一个终端跑 codex 做整仓库级别的改动,两边都需要稳定的模型供给。直连官方折腾了一阵,最后还是切到了 KingFlow 这个中转,下面把我关心的几个点和实际配置都记下来,方便以后自己回看,也省得别人重新踩一遍。

一、本地 Agent 调试到底卡在哪

先说结论:影响我效率的从来不是模型本身有多聪明,而是「能不能稳定地、按我以为的价格、拿到我点名的那个模型」。这三件事任意一件出问题,Continue 和 codex 的体验就会断崖式下跌。

具体到我遇到的痛点,按出现频率排:

  1. 直连不稳。OpenAI 和 Anthropic 官方端点在国内不挂代理基本没法用,挂了代理流式输出又经常半路断流。Continue 的补全和 codex 的多轮工具调用对长连接很敏感,断一次就要重来,体感非常差。另外官方要绑境外卡,汇率和手续费摊下来也不便宜。

  2. 倍率不透明。我之前试过别的中转,官网首页写着「超低价」,真正跑起来扣费和我估算的对不上。问题出在倍率:同一个模型,输入、输出、图片、工具调用各算各的倍率,平台不公示你就只能蒙。Agent 类任务上下文动辄几万 token,倍率差 0.5 倍,一个月账单就差出一截。

  3. 模型掉包。这是最隐蔽的。你 config 里写的是强模型,实际后端给你换成一个便宜的小模型,返回看起来「像那么回事」但质量明显下滑。codex 做跨文件重构时尤其能感觉出来——本来一次能改对的,掉包后要反复纠正。

二、我选中转的三个硬判据

踩过坑之后,我现在筛选渠道只看三条,缺一不考虑:

三、Continue 的配置

Continue 走的是 OpenAI 兼容协议,所以接 KingFlow 只需要在 config(新版是 config.yaml,老版是 config.json)里把 apiBase 指过去就行,其余字段照官方写法。我的 config.yaml 模型段大致长这样:

models:
  - name: KingFlow Sonnet
    provider: openai
    model: claude-sonnet-4-6
    apiBase: https://www.kingflow.ai/v1
    apiKey: sk-你的密钥
    roles:
      - chat
      - edit
  - name: KingFlow Haiku 补全
    provider: openai
    model: claude-haiku-4-5
    apiBase: https://www.kingflow.ai/v1
    apiKey: sk-你的密钥
    roles:
      - autocomplete

如果你还在用旧版 config.json,对应写法是:

{
  "models": [
    {
      "title": "KingFlow Sonnet",
      "provider": "openai",
      "model": "claude-sonnet-4-6",
      "apiBase": "https://www.kingflow.ai/v1",
      "apiKey": "sk-你的密钥"
    }
  ]
}

几个我自己踩出来的小经验:provideropenai 即可,不用专门找 anthropic provider,因为走的是 /v1 兼容端点;日常对话和 edit 我用 claude-sonnet-4-6,质量够用又不肉疼;内联补全这种高频低负载的活儿,我换成 claude-haiku-4-5,省钱且响应快。需要啃硬骨头时临时把 chat 模型切成 claude-opus-4-8。

四、codex 的配置

codex 这边在 ~/.codex/config.toml 里配一个自定义 provider。关键是 provider 段名要和引用名严格一致,我第一次就是名字对不上导致一直读不到配置:

model = "gpt-5.5"
model_provider = "kingflow"

[model_providers.kingflow]
name = "KingFlow"
base_url = "https://www.kingflow.ai/v1"
env_key = "OPENAI_API_KEY"

然后把密钥塞进环境变量再跑:

export OPENAI_API_KEY="sk-你的密钥"
codex

注意 model_provider = "kingflow"[model_providers.kingflow] 这两处的 kingflow 必须是同一个字符串,大小写都不能差。base_url 统一指向 https://www.kingflow.ai/v1。我跑整仓库重构时会把 model 临时改成 gpt-5.5 这种强模型,平时小修小补 gpt-5.4 也够了。

要快速验证端点通不通,不用开 codex,直接 cURL 打一发最省事:

curl https://www.kingflow.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-你的密钥" \
  -H "Content-Type: application/json" \
  -d '{"model":"gpt-5.5","messages":[{"role":"user","content":"ping"}]}'

能正常返回,Continue 和 codex 就都没问题了,毕竟它俩用的是同一个兼容协议。

五、对账:后台看 token 用量明细

倍率透明这件事,光看官网公示还不够,得能事后核对。我每隔几天会登 KingFlow 后台翻一次调用明细,重点看三列:每次请求用的是哪个模型(防掉包)、输入和输出各消耗多少 token(算实际成本)、对应扣费金额(验证倍率)。

我的习惯是把 Continue 和 codex 用不同的密钥,这样后台能分开统计——补全那条线 token 走得猛但单价低,codex 重构那条线请求数少但单次贵。分开看才知道钱到底花在哪,要不要调整模型配比一目了然。对账这一步别省,它是你判断「倍率到底透不透明」的唯一硬证据。

六、使用建议

使用场景 我的做法
Continue 内联补全 claude-haiku-4-5,高频低价,断流影响小
Continue 日常对话/edit claude-sonnet-4-6,质量和成本平衡
codex 整仓库重构 gpt-5.5 或 claude-opus-4-8,宁可贵一次改对
生产环境关键链路 仍走官方或云厂商,中转只做开发期
长期项目 多备 1 个渠道,避免单点失联

七、小结

对我这种「Continue + VS Code + codex」三件套的本地开发流来说,选中转的核心就一句话:倍率透明 + 模型保真 + 访问稳定。三者满足,配置成本几乎为零——Continue 改一行 apiBase,codex 加一段 provider,剩下的和官方完全一样。KingFlow(https://www.kingflow.ai )目前在这三点上能扛住我日常的折腾,端点统一是 https://www.kingflow.ai/v1 ,密钥配好就能跑。要是你也不想为了网络环境分心、又想把成本控在明面上,这套组合可以试试,记得头几天勤对账,确认没被掉包再长期用。