常见问题
AI 应用集成的高频问题与排查路径
汇总四款工具接入 TokenByte 时的常见问题。按主题查阅,找不到答案可通过 控制台 反馈。
通用
401 / 403 鉴权失败
检查 API Key 是否粘贴完整、未在控制台吊销;Authorization header 是否写成 Bearer sk-tb-… 或 x-api-key: sk-tb-…;Base URL 末尾按协议处理 —— OpenAI 兼容需保留 /v1,Anthropic 兼容不带 /v1。
Base URL 应该填哪个?
| 协议 | Base URL |
|---|---|
| OpenAI 兼容 | https://api.tokenbyte.ai/v1 |
| Anthropic 兼容 | https://api.tokenbyte.ai |
模型名称怎么填?
打开 模型广场 或 控制台 · 模型市场,每张模型卡片标题上显示的名称就是你在 API 请求 model 字段里要填的完整值(例如 Claude Sonnet 4.5、gpt-5-codex)。TokenByte 透传上游命名 —— 卡片标题即是模型名,不做任何二次映射。
费用与速率怎么控? 在 控制台 · API 密钥 为每个 Key 单独配置 RPM / TPM 与单次消费上限。自主执行类代理(Cline、Claude Code)容易循环调用,强烈建议给它们专用的 Key 并压低上限兜底。
控制台看不到用量?
用量统计有约 1 分钟延迟;若长期缺失,确认请求是否真的命中 api.tokenbyte.ai(某些工具会默认走官方端点)。
Claude Code
模型选择? TokenByte 会将 Claude Code 的模型请求透传给上游 Anthropic;若要路由到非 Claude 模型,可在控制台配置模型映射规则。
速率被限?
Claude Code 的并发请求通常较高(多工具并行、后台摘要),建议该 Key 的 RPM / TPM 上调或关闭 CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC 以外的非必要流量。
用哪个环境变量?
Claude Code 用 ANTHROPIC_AUTH_TOKEN(不是 ANTHROPIC_API_KEY)。TokenByte Key 同样以 sk-tb- 开头。
Codex CLI
Windows setx 改了没生效?
setx 只影响后续新开的终端,已打开的窗口需关闭重开。VS Code 的集成终端也要重启。
推荐哪个模型?
Codex 专属推理模型 gpt-5-codex;也可在 ~/.codex/config.toml 的 model 字段填任意 TokenByte 支持的 OpenAI 兼容模型 ID。
.codex 文件夹找不到?
Windows 资源管理器默认隐藏以 . 开头的目录,可在 查看 → 显示 → 隐藏的项目 中开启显示,或直接用 mkdir .codex 新建。
env_key 字段是干嘛的?
config.toml 里的 env_key 指定读取哪个系统环境变量作为 API Key 来源。字段名要与系统变量名严格一致,例如都写成 TOKENBYTE_API_KEY。
Kilo Code
模型列表不全? OpenAI Compatible 模式下模型 ID 需手动填写,参考控制台 模型 页面的官方 ID。
官网打不开?
官网域名已迁移至 kilo.ai,旧的 kilocode.ai 会 308 跳转。书签建议直接换成新地址。
Anthropic 下拉能改 Base URL 吗? 不能。Kilo 的 Anthropic 条目直连官方,无法自定义接入点。要通过 TokenByte 访问 Claude,请改走 OpenAI Compatible。
Cline
Base URL 字段消失? API Provider 必须显式切换到 OpenAI Compatible 才会出现 Base URL 字段。Cline 内置的 "Cline" 快捷登录是托管模式,不支持自定义接入点。
上下文超限? 长任务容易触发模型上下文上限。优先选长上下文模型(Claude Sonnet 1M、GPT-5.4);必要时让 Cline 开启 Focus Chain 或 Memory Bank 做自动摘要。
Auto-approve 下的费用如何兜底? 为该 Key 在控制台配置单次消费上限与 RPM/TPM 阈值,避免自主循环造成意外开销。建议测试期关闭 Auto-approve。
Plan / Act 模式能分别用模型吗?
可以。Settings 中打开 Use different models for Plan and Act,Plan 适合用推理型模型(如 claude-opus-4-6)做架构规划,Act 用 gpt-5-codex 快速落地。