GitHub Copilot 按 token 计费计算器:预测你的六月账单
- GitHub Copilot 将于 2026 年 6 月 1 日切换为按 token 计费 —— 该消息已于 4 月 27 日通过 github.blog 公告。计费单位为 AI Credits;1 credit 等于 0.01 美元。
- 代码补全继续免费。只有当对话与代理任务对高级模型的用量超出档位附带额度时,才会产生额外费用。
- 本文按 GitHub 官方公布的费率,提供完整的分模型费率表、精确公式,以及三种用量画像下的六月账单预测。
6 月 1 日到底改了什么
GitHub 当前的计费体系按"高级请求"(Premium Requests)结算 —— 这是一个粒度较粗的固定单位,各模型对应的请求消耗不同,但底层 token 计算对用户完全不透明。6 月 1 日起,这套体系将被废弃。取而代之的是 AI Credits:1 credit 价值 0.01 美元,各模型按每百万 token 消耗的 credit 数计费。
各档位的基础月费保持不变。Copilot Pro 仍为每月 10 美元,Business 19 美元,Enterprise 39 美元。真正变化的是超额逻辑:旧体系下,达到请求上限就直接被截停;新体系下,token 用量持续累加 —— 一旦超出档位附带额度,就按每 credit 0.01 美元计算超额费用。
各档位的附带额度与档位价格一一对应:Pro 附带 1,000 credits(对应 10 美元 token 价值),Business 附带 1,900,Enterprise 附带 3,900。这套数学是有意为之 —— 附带额度恰好等于档位月费,纯 token 用户刚好打平。问题只在于:你的实际使用习惯,会不会把额度顶穿。
代码补全与下一处编辑建议(Next-Edit Suggestions)完全不受影响。它们在所有付费档位上保持免费。计费仅适用于对话交互、调用高级模型的内联编辑,以及代理任务。这正是 GitHub 一直谨慎保留的边界 —— 大多数人对 Copilot 的核心印象就是 Tab 补全,而这一功能的成本不会改变。
费率清单发布在 docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing,以每百万 token、美元计价,分输入(你发送的内容)与输出(模型返回的内容)两栏。Anthropic 系列模型还额外有缓存读取费率与缓存写入费率 —— 下文将详细说明。
有一点公告并未着重强调:截至 2026 年 4 月 28 日,GitHub 公布的每百万 token 费率与各底层提供商官网列出的 API 费率完全一致。GitHub 不在 token 上加价。你为之付费的,是 IDE 集成、Tab 补全,以及附带的 credit 额度 —— 一旦超出,就按未加价的原始 API 费率结算。
分模型费率表 —— 完整版
所有费率均以每百万 token 计、美元计价,引自 docs.github.com/.../models-and-pricing,2026 年 6 月 1 日生效。Cache Write 一栏仅适用于 Anthropic 系列模型 —— OpenAI、Google、xAI 的缓存写入按标准输入费率计费。
| 模型 | 输入 $/M | 缓存读 $/M | 缓存写 $/M | 输出 $/M |
|---|---|---|---|---|
| Anthropic | ||||
| Claude Haiku 4.5anthropic | $1.00 | $0.10 | $1.25 | $5.00 |
| Claude Sonnet 4anthropic | $3.00 | $0.30 | $3.75 | $15.00 |
| Claude Sonnet 4.5anthropic | $3.00 | $0.30 | $3.75 | $15.00 |
| Claude Sonnet 4.6anthropic | $3.00 | $0.30 | $3.75 | $15.00 |
| Claude Opus 4.5anthropic | $5.00 | $0.50 | $6.25 | $25.00 |
| Claude Opus 4.6anthropic | $5.00 | $0.50 | $6.25 | $25.00 |
| Claude Opus 4.7anthropic | $5.00 | $0.50 | $6.25 | $25.00 |
| OpenAI | ||||
| GPT-4.1openai | $2.00 | $0.50 | — | $8.00 |
| GPT-5 miniopenai | $0.25 | $0.025 | — | $2.00 |
| GPT-5.2openai | $1.75 | $0.175 | — | $14.00 |
| GPT-5.4openai | $2.50 | $0.25 | — | $15.00 |
| GPT-5.5openai | $5.00 | $0.50 | — | $30.00 |
| Gemini 2.5 Progoogle | $1.25 | $0.125 | — | $10.00 |
| Gemini 3 Flashgoogle | $0.50 | $0.05 | — | $3.00 |
| xAI | ||||
| Grok Code Fast 1xai | $0.20 | $0.02 | — | $1.50 |
各厂商的输出/输入比并不一致。Anthropic 的 Sonnet 系列是 5:1(输出价为输入的 5 倍),GPT-5 mini 是 8:1,Grok Code Fast 1 是 7.5:1。对于代理任务这类倾向于产出长输出的场景,真正决定账单走向的是输出费率。
计算公式 —— credits 是怎么算出来的
GitHub 的 credit 计算非常直白。每个工作流事件(一次对话回合、一步代理动作、一次代码评审)都会消耗一定数量的输入与输出 token,Anthropic 模型还可能涉及缓存读写。把所有费用相加,再除以单位 credit 价值,就是这次事件消耗的 credit 数。
credits = (
input_tokens × input_$/M
+ output_tokens × output_$/M
+ cached_tokens × cached_$/M
+ cache_write_tokens × cache_write_$/M ← 仅 Anthropic
) ÷ 1,000,000 ÷ $0.01
除以 1,000,000 是把原始 token 数换算为百万 token,再除以 0.01 美元是把 USD 成本换算为 credit 数。其余每一项都是按模型公布费率做的乘法。
实例计算:Claude Sonnet 4 代理任务
以 Claude Sonnet 4 上一次复杂度中等的代理任务为例 —— 打开代码库、写一个新功能、跑一遍审查:
- 50,000 输入 token(读取的文件、指令、之前的对话)
- 20,000 输出 token(生成的代码与解释说明)
- 30,000 缓存 token(从缓存复用的上下文)
- 10,000 缓存写入 token(新写入缓存的上下文)
这一次代理任务消耗 49.65 credits —— 大约占用 Copilot Pro 1,000 credits 月度额度的 5%。一个月跑 20 次,就消耗了 993 credits,几乎用满整个额度;第 21 次起便开始触发超额计费。
注意输出 token 才是大头:0.4965 美元中,有 0.30 美元(占 60%)来自仅 2 万的输出 —— 而输入数量是输出的 2.5 倍。这正是代理任务相对对话更昂贵的根本原因。
账单已经飙升了?
如果你已经看到异常扣款,或者你正在管理一支 Copilot 用量持续上升的团队 —— Septim Rescue 是一次 299 美元的单次审计:找出真正烧掉预算的会话,并给出可执行的整改方案。周五前预约,周一交付。
预约 Septim Rescue →哪些工作流最烧钱
在按 token 计费的体系下,各类 Copilot 用量并不等价。月账单 10 美元与 35 美元之间的差距,主要来自工作流选择,而非单纯的用量大小。
- 代理任务是高消耗类别。一次中等规模的 Claude Sonnet 4 代理任务(5 万输入、2 万输出、3 万缓存)消耗 49.65 credits,如上文所示。每月跑 22 次,仅这一项就吃掉约 1,093 credits。真正的杀手不是某一次大会话,而是"日常使用代理"的开发者很容易月均跑到 20–30 次。
- Sonnet 上的代码评审是隐形累加器。一次代码评审:8,000 输入(diff + 上下文)、2,500 输出(评审意见)、4,000 缓存(文件历史),约 14.6 credits。每月 8 次累计约 117 credits —— 单看不致命,但叠加在代理任务之上就会很快放大。
- 用廉价模型做对话几乎是免费的。每月 150 次 GPT-5 mini 对话(每次 800 输入、400 输出),整月合计约 15 credits,不到 Pro 额度的 2%。如果你用 Copilot 仅限于对话与 Tab 补全,六月这次调整对你毫无影响。
- Opus 上的头脑风暴短小但昂贵。一次 Opus 4.7 头脑风暴(8k 输入、4k 输出)消耗 22 credits。每月 6 次累计 132 credits —— 单次成本不算夸张,但 Opus 通常被选去做复杂、长输出的任务,实际向上限逼近的速度比预期更快。
- 叠加效应。上述模式是相加的。一个开发者如果每天跑 Sonnet 代理、每周做代码评审、偶尔用 Opus 头脑风暴,在第一个月结束之前就会顶满 Pro 额度。
结论很务实:如果你的 Copilot 使用以 Tab 补全和偶尔对话为主,基本看不到账单变化。如果你一直在跑代理任务 —— 尤其是基于 Sonnet 或 Opus 的多步、调工具会话 —— 在 6 月 1 日之前先把账算一遍。
三种用量画像 —— 六月账单预测
下文的预测来自 Septim Meter CLI,基于 docs.github.com/.../models-and-pricing 截至 2026 年 4 月 28 日的费率构建。三个画像均使用 Copilot Pro 档位(每月 10 美元,附带 1,000 credits)。
轻量 —— 每月约 150 次 GPT-5 mini 对话
这类开发者主要用 Copilot 做 Tab 补全和偶尔的简短问答。每月 150 次对话,每次 800 输入 token、400 输出 token,全部走 GPT-5 mini。
| 150 次对话 × GPT-5 mini | 15.00 credits |
| 代码补全 | 0.00 credits(免费) |
| 事件合计 | $0.15 USD 价值 |
| 已使用附带额度 | 15 / 1,000 |
| 超额 | 0 credits |
| 六月账单预测 | $10.00 |
对这类画像而言,六月调整完全不可见。整月对话的 token 价值仅 0.15 美元,被附带额度轻松吸收,还剩 985 credits 富余。账单完全等于 10 美元的基础月费。
中等 —— 对话 + 每周 1 次代理任务 + 偶尔代码评审
这类开发者把对话与每月 4 次的 Claude Sonnet 4 代理任务结合,再加上每月 8 次基于 Sonnet 的代码评审。这是把 Copilot 嵌入日常工作流、但又没有持续运行代理的典型用户。
会话参数:150 次对话(GPT-5 mini,1,200 输入 / 600 输出)、4 次代理任务(Sonnet 4,30k 输入 / 12k 输出 / 18k 缓存读 / 6k 缓存写)、8 次代码评审(Sonnet 4,8k 输入 / 2.5k 输出 / 4k 缓存读)。
| 150 次对话(GPT-5 mini) | 18.00 credits |
| 4 次代理任务(Sonnet 4) | 129.30 credits |
| 8 次代码评审(Sonnet 4) | 44.52 credits |
| 事件合计 | 191.82 credits($1.92 USD 价值) |
| 已使用附带额度 | 191.82 / 1,000 |
| 超额 | 0 credits |
| 六月账单预测 | $10.00 |
中等画像消耗了 19% 的附带额度,完全没有触发超额。即便每周一次代理任务、外加常规代码评审,Pro 档的 1,000 credits 仍有显著缓冲 —— 前提是单次会话规模保持在这一区间。
重度 —— 每日代理任务 + Opus 头脑风暴 + 代码评审
这是把 Copilot 当作主要工程伙伴的开发者:每月 200 次 Sonnet 4 对话、每月 22 次 Sonnet 4 代理任务(基本每日)、6 次 Opus 4.7 头脑风暴、16 次 Sonnet 4 代码评审。这一画像会越过超额阈值。
会话参数:200 次对话(Sonnet 4,2.5k 输入 / 1.5k 输出 / 1k 缓存)、22 次代理任务(Sonnet 4,60k 输入 / 25k 输出 / 35k 缓存读 / 12k 缓存写)、6 次头脑风暴(Opus 4.7,8k 输入 / 4k 输出)、16 次评审(Sonnet 4,12k 输入 / 3.5k 输出 / 6k 缓存读)。
| 200 次对话(Sonnet 4) | 95.00 credits |
| 22 次代理任务(Sonnet 4) | 1,749.42 credits |
| 6 次头脑风暴(Opus 4.7) | 132.00 credits |
| 16 次代码评审(Sonnet 4) | 201.16 credits |
| 事件合计 | 2,177.58 credits($21.78 USD 价值) |
| 附带额度(Pro) | 1,000 credits |
| 超额 credits | 1,177.58 credits |
| 超额费用 | $11.78 |
| 六月账单预测 | $21.78 |
22 次代理任务是绝对主因,占总 credit 消耗的 80%。如果这位开发者把代理频次从每月 22 次降到 10 次(约每周 2–3 次),月账单会从 21.78 美元下降到约 10.36 美元,几乎消除全部超额。
想要交互版本的计算器?
Septim Meter 将于 5 月 12 日发布 —— 29 美元买断制。自由输入会话次数、模型选择与 token 估算,几秒钟内即可获得账单分解,以及与直连 API 的并列对比。完全离线运行,无需注册账户。
发布时通知我 →没人讨论的角度:Copilot 与直连 API 的对比
截至 2026 年 4 月 28 日,GitHub 公布的每百万 token 费率与各底层提供商的官网 API 费率完全一致,token 上没有加价。这意味着"我是不是直接调 Anthropic 更划算?"这道题,其数学异常干净。
以重度用户画像为例:Copilot 内 21.78 美元的 token 价值预测。被消耗掉的 token 价值 —— 2,177.58 credits —— 按官网费率折合 21.78 美元的 API 调用费。直接调用 Anthropic 与 OpenAI,token 部分依然是这 21.78 美元,但不再叠加 10 美元的基础月费。
区别在于:直连 API 没有基础月费。用多少付多少,没有附带额度,也没有套餐费。
对重度用户而言,两边数字完全相同 —— 因为 10 美元基础月费正好被 1,000 credits 附带额度对冲。规律是这样:如果你的 token 价值超过 10 美元,Copilot 与直连 API 总成本一致;如果不到 10 美元,你就在为没用满的部分支付 10 美元基础费,直连 API 更便宜。
但这套对比需要补一个前提:Copilot Pro 不仅仅是 token 通道。它还包括:
- Tab 补全与下一处编辑建议 —— 免费、无限。对大多数开发者而言,这才是值回月费的核心功能。基于 token 的对话与代理任务只是叠加项。
- IDE 集成。GitHub Copilot 已嵌入 VS Code、JetBrains、Neovim 等主流编辑器。直连 API 想要复刻这套体验,需要额外搭建工具链。
- GitHub Copilot Chat 上下文。IDE 集成会自动带上相关文件与仓库上下文。直连 API 则需要你自己管理整套上下文。
对轻量用户而言 —— 整月只产生 0.15 美元的 token 价值 —— Copilot Pro 比纯直连 API 多花 9.85 美元。这笔钱值不值,几乎完全取决于 Tab 补全的使用频率。如果你每天打开 IDE、频繁接受补全建议,10 美元月费很合理;如果你只是偶尔在命令行用 Copilot 做对话,直连 API 明显便宜得多。
对中等用户而言,逻辑类似:1.92 美元 token 价值、10 美元基础月费,其中 8.08 美元是在为 Tab 补全与 IDE 体验买单 —— 对活跃开发者来说仍是合理的取舍。
盈亏平衡点很清晰:每月 10 美元的 token 价值。在此之上,Copilot 与直连 API 的 token 成本一致,而 Copilot 还附送免费补全;在此之下,直连 API 更便宜,但你失去 Tab 补全。
延伸阅读:Anthropic API 定价 2026 —— 成本计算器与分模型拆解 以及 Tokenocalypse —— 失控的代理任务到底要花多少钱。
6 月 1 日之前要做的事
- 到 GitHub 后台核对当前用量。访问 github.com/settings/copilot —— 后台会按类型与模型展示交互明细。重点看会话数与代理任务的大致体量。组织管理员可在 Settings → Billing → GitHub Copilot 查看团队整体用量。
- 用上文公式估算六月账单。把你日常的会话次数,乘以本文的实例数字:中等规模 Sonnet 代理任务约 49.65 credits,代码评审 14–22 credits,廉价模型对话 1–2 credits。相加,再与档位附带额度对照。或者等 5 月 12 日 Septim Meter 上线。
- 预测超出心理预期时,挑一个杠杆。最直接的:把代理任务模型从 Sonnet(每百万输入 3.00 美元)切到 GPT-5 mini(每百万输入 0.25 美元)。对输入密集型的代理任务 —— 大文件加载、长上下文传递 —— 输入费率才是主要驱动因素。GPT-5 mini 把代理输入成本砍掉 12 倍。质量取舍因任务而异,正式切换前先做对比测试。
- 当成本比自动化更重要时,降低代理频率。中等画像(每月 4 次代理)稳稳处于 Pro 额度内;重度画像(22 次)则越界。Pro 档下,Sonnet 代理任务的临界点大致在每月 20 次左右 —— 具体数字取决于单次规模。
- 重度代理用户考虑升级 Pro+。Copilot Pro+ 每月 39 美元,附带 3,900 credits。重度画像 2,177.58 credits 在 Pro+ 上正好等于 39 美元 —— 比 Pro + 超额的 21.78 美元还贵。对这一具体画像,Pro 仍更划算;但对更重度的用户(每天数小时连续代理)来说,Pro+ 可能比累积 Pro 超额便宜。
- 在 GitHub 后台设置消费上限。在 Settings → Billing and plans → Spending limits 中可对 Copilot 设月度上限。设为 0 美元意味着附带额度用尽即冻结访问;设为 20 美元则给你一个上限护栏。这是规避意外账单最稳妥的一步。
- 如果当前账单已经异常飙升,在 6 月 1 日之前联系 GitHub 支持。PRU 体系与 AI Credits 体系的计费机制不同;若现行体系下出现异常扣费,务必在 6 月 1 日的转换时点重置基线之前先解决。
Septim Meter —— 这台计算器
我们将于 5 月 12 日发布 Septim Meter:29 美元买断制,完全离线运行。输入会话次数与 token 估算,即可得到 Copilot 账单预测,以及与直连 API 在所有档位的并列对比。公式与本文一致 —— 无需注册账户,数据不离开本机。
命令行版本已经可用。5 月 12 日的发布版本会增加 HTML 报告输出,以及交互式的"模型切换"对比。如果你想抢先体验,或希望在发布时收到通知:
Septim Meter —— 5 月 12 日发布
29 美元买断制。预测六月 Copilot 账单、与直连 API 对比、选定最便宜路径。基于 GitHub 官方公布的费率构建 —— 费率变动只需一次 JSON 文件更新。
发布时通知我 →