GitHub Copilot 何时切换为按 token 计费?

2026 年 6 月 1 日。GitHub 已于 2026 年 4 月 27 日通过 github.blog 正式公告这一变化。在该日期之前,高级模型用量仍按现行的 PRU(Premium Request Unit,高级请求单位)体系结算。

6 月 1 日之后,Copilot 内最便宜的代理模型是哪一款?

xAI 的 Grok Code Fast 1,输入每百万 token 0.20 美元、输出每百万 token 1.50 美元 —— 输入价约为 Claude Sonnet 4 的 1/15。如果只追求代理吞吐量、对质量要求可妥协,主流厂商中的次优解是 GPT-5 mini(输入每百万 token 0.25 美元、输出每百万 token 2.00 美元)。

6 月 1 日之后我的 Copilot Pro 月费会涨吗?

基础月费不变 —— Pro 仍为每月 10 美元、Business 19 美元、Enterprise 39 美元。各档位均附带等额的 AI Credits(1 credit = 0.01 美元)。只有当 token 用量超出附带额度时,才会按超额部分另行计费。轻量用户与仅使用补全的用户基本不会感知到变化。

可以彻底关闭按用量计费、避免任何超额吗?

可以。在 GitHub 后台 Settings → Billing and plans → Spending limits 中,把消费上限设为 0 美元。这样系统将严格限制在附带额度范围内 —— 一旦用尽,高级模型访问会被冻结到下一个计费周期开始。代码补全功能不受影响,继续免费可用。

在 6 月 1 日之前,如何估算我当前的用量?

访问 github.com/settings/copilot —— 后台会展示你与 Copilot 的交互用量明细。组织管理员还可在 Settings → Billing → GitHub Copilot 中查看团队整体用量。

· github copilot · 计费 · 成本管控 · 2026 年 6 月 ·

GitHub Copilot 按 token 计费计算器:预测你的六月账单

Q: 代码补全会消耗 AI Credits 吗?

不会。代码补全(Tab 建议)与下一处编辑建议(Next-Edit Suggestions)在所有付费档位上均保持免费 —— 包括 Copilot Free、Pro、Pro+、Business 与 Enterprise。只有调用高级模型的对话与代理任务才会消耗 AI Credits。

// 图示各类工作流消耗的 AI Credits —— Copilot Pro 档位、典型月度用量

// 归档 GitHub Copilot · 计费 // 来源 Septim Labs · Septim Meter CLI // 永久链接 /blog/github-copilot-token-billing-calculator-2026.html 引用本文 →

2026 年 4 月 28 日发布 · 作者:Septim Labs · 阅读约 12 分钟

核心要点

GitHub Copilot 将于 2026 年 6 月 1 日切换为按 token 计费 —— 该消息已于 4 月 27 日通过 github.blog 公告。计费单位为 AI Credits;1 credit 等于 0.01 美元。
代码补全继续免费。只有当对话与代理任务对高级模型的用量超出档位附带额度时,才会产生额外费用。
本文按 GitHub 官方公布的费率,提供完整的分模型费率表、精确公式,以及三种用量画像下的六月账单预测。

6 月 1 日到底改了什么

GitHub 当前的计费体系按"高级请求"(Premium Requests)结算 —— 这是一个粒度较粗的固定单位,各模型对应的请求消耗不同,但底层 token 计算对用户完全不透明。6 月 1 日起,这套体系将被废弃。取而代之的是 AI Credits:1 credit 价值 0.01 美元,各模型按每百万 token 消耗的 credit 数计费。

各档位的基础月费保持不变。Copilot Pro 仍为每月 10 美元,Business 19 美元,Enterprise 39 美元。真正变化的是超额逻辑:旧体系下,达到请求上限就直接被截停;新体系下,token 用量持续累加 —— 一旦超出档位附带额度,就按每 credit 0.01 美元计算超额费用。

各档位的附带额度与档位价格一一对应:Pro 附带 1,000 credits(对应 10 美元 token 价值),Business 附带 1,900,Enterprise 附带 3,900。这套数学是有意为之 —— 附带额度恰好等于档位月费,纯 token 用户刚好打平。问题只在于:你的实际使用习惯,会不会把额度顶穿。

代码补全与下一处编辑建议(Next-Edit Suggestions)完全不受影响。它们在所有付费档位上保持免费。计费仅适用于对话交互、调用高级模型的内联编辑,以及代理任务。这正是 GitHub 一直谨慎保留的边界 —— 大多数人对 Copilot 的核心印象就是 Tab 补全,而这一功能的成本不会改变。

费率清单发布在 docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing,以每百万 token、美元计价,分输入(你发送的内容)与输出(模型返回的内容)两栏。Anthropic 系列模型还额外有缓存读取费率与缓存写入费率 —— 下文将详细说明。

有一点公告并未着重强调:截至 2026 年 4 月 28 日,GitHub 公布的每百万 token 费率与各底层提供商官网列出的 API 费率完全一致。GitHub 不在 token 上加价。你为之付费的,是 IDE 集成、Tab 补全,以及附带的 credit 额度 —— 一旦超出,就按未加价的原始 API 费率结算。

分模型费率表 —— 完整版

所有费率均以每百万 token 计、美元计价,引自 docs.github.com/.../models-and-pricing,2026 年 6 月 1 日生效。Cache Write 一栏仅适用于 Anthropic 系列模型 —— OpenAI、Google、xAI 的缓存写入按标准输入费率计费。

模型	输入 $/M	缓存读 $/M	缓存写 $/M	输出 $/M
Anthropic
Claude Haiku 4.5anthropic	$1.00	$0.10	$1.25	$5.00
Claude Sonnet 4anthropic	$3.00	$0.30	$3.75	$15.00
Claude Sonnet 4.5anthropic	$3.00	$0.30	$3.75	$15.00
Claude Sonnet 4.6anthropic	$3.00	$0.30	$3.75	$15.00
Claude Opus 4.5anthropic	$5.00	$0.50	$6.25	$25.00
Claude Opus 4.6anthropic	$5.00	$0.50	$6.25	$25.00
Claude Opus 4.7anthropic	$5.00	$0.50	$6.25	$25.00
OpenAI
GPT-4.1openai	$2.00	$0.50	—	$8.00
GPT-5 miniopenai	$0.25	$0.025	—	$2.00
GPT-5.2openai	$1.75	$0.175	—	$14.00
GPT-5.4openai	$2.50	$0.25	—	$15.00
GPT-5.5openai	$5.00	$0.50	—	$30.00
Google
Gemini 2.5 Progoogle	$1.25	$0.125	—	$10.00
Gemini 3 Flashgoogle	$0.50	$0.05	—	$3.00
xAI
Grok Code Fast 1xai	$0.20	$0.02	—	$1.50

各厂商的输出/输入比并不一致。Anthropic 的 Sonnet 系列是 5:1(输出价为输入的 5 倍),GPT-5 mini 是 8:1,Grok Code Fast 1 是 7.5:1。对于代理任务这类倾向于产出长输出的场景,真正决定账单走向的是输出费率。

计算公式 —— credits 是怎么算出来的

GitHub 的 credit 计算非常直白。每个工作流事件(一次对话回合、一步代理动作、一次代码评审)都会消耗一定数量的输入与输出 token,Anthropic 模型还可能涉及缓存读写。把所有费用相加,再除以单位 credit 价值,就是这次事件消耗的 credit 数。

// credit 计算公式

credits = (
    input_tokens  × input_$/M
  + output_tokens × output_$/M
  + cached_tokens × cached_$/M
  + cache_write_tokens × cache_write_$/M   ← 仅 Anthropic
) ÷ 1,000,000 ÷ $0.01

除以 1,000,000 是把原始 token 数换算为百万 token,再除以 0.01 美元是把 USD 成本换算为 credit 数。其余每一项都是按模型公布费率做的乘法。

实例计算:Claude Sonnet 4 代理任务

以 Claude Sonnet 4 上一次复杂度中等的代理任务为例 —— 打开代码库、写一个新功能、跑一遍审查:

50,000 输入 token(读取的文件、指令、之前的对话)
20,000 输出 token(生成的代码与解释说明)
30,000 缓存 token(从缓存复用的上下文)
10,000 缓存写入 token(新写入缓存的上下文)

50,000 输入 × $3.00/M $0.1500

20,000 输出 × $15.00/M $0.3000

30,000 缓存读 × $0.30/M $0.0090

10,000 缓存写 × $3.75/M $0.0375

USD 总费用 $0.4965

÷ 每 credit $0.01 49.65 credits

这一次代理任务消耗 49.65 credits —— 大约占用 Copilot Pro 1,000 credits 月度额度的 5%。一个月跑 20 次,就消耗了 993 credits,几乎用满整个额度;第 21 次起便开始触发超额计费。

注意输出 token 才是大头:0.4965 美元中,有 0.30 美元(占 60%)来自仅 2 万的输出 —— 而输入数量是输出的 2.5 倍。这正是代理任务相对对话更昂贵的根本原因。

账单已经飙升了?

如果你已经看到异常扣款,或者你正在管理一支 Copilot 用量持续上升的团队 —— Septim Rescue 是一次 299 美元的单次审计:找出真正烧掉预算的会话,并给出可执行的整改方案。周五前预约,周一交付。

预约 Septim Rescue →

哪些工作流最烧钱

在按 token 计费的体系下,各类 Copilot 用量并不等价。月账单 10 美元与 35 美元之间的差距,主要来自工作流选择,而非单纯的用量大小。

代理任务是高消耗类别。一次中等规模的 Claude Sonnet 4 代理任务(5 万输入、2 万输出、3 万缓存)消耗 49.65 credits,如上文所示。每月跑 22 次,仅这一项就吃掉约 1,093 credits。真正的杀手不是某一次大会话,而是"日常使用代理"的开发者很容易月均跑到 20–30 次。
Sonnet 上的代码评审是隐形累加器。一次代码评审:8,000 输入(diff + 上下文)、2,500 输出(评审意见)、4,000 缓存(文件历史),约 14.6 credits。每月 8 次累计约 117 credits —— 单看不致命,但叠加在代理任务之上就会很快放大。
用廉价模型做对话几乎是免费的。每月 150 次 GPT-5 mini 对话(每次 800 输入、400 输出),整月合计约 15 credits,不到 Pro 额度的 2%。如果你用 Copilot 仅限于对话与 Tab 补全,六月这次调整对你毫无影响。
Opus 上的头脑风暴短小但昂贵。一次 Opus 4.7 头脑风暴(8k 输入、4k 输出)消耗 22 credits。每月 6 次累计 132 credits —— 单次成本不算夸张,但 Opus 通常被选去做复杂、长输出的任务,实际向上限逼近的速度比预期更快。
叠加效应。上述模式是相加的。一个开发者如果每天跑 Sonnet 代理、每周做代码评审、偶尔用 Opus 头脑风暴,在第一个月结束之前就会顶满 Pro 额度。

结论很务实:如果你的 Copilot 使用以 Tab 补全和偶尔对话为主,基本看不到账单变化。如果你一直在跑代理任务 —— 尤其是基于 Sonnet 或 Opus 的多步、调工具会话 —— 在 6 月 1 日之前先把账算一遍。

三种用量画像 —— 六月账单预测

下文的预测来自 Septim Meter CLI,基于 docs.github.com/.../models-and-pricing 截至 2026 年 4 月 28 日的费率构建。三个画像均使用 Copilot Pro 档位(每月 10 美元,附带 1,000 credits)。

轻量 —— 每月约 150 次 GPT-5 mini 对话

这类开发者主要用 Copilot 做 Tab 补全和偶尔的简短问答。每月 150 次对话,每次 800 输入 token、400 输出 token,全部走 GPT-5 mini。

150 次对话 × GPT-5 mini	15.00 credits
代码补全	0.00 credits(免费)
事件合计	$0.15 USD 价值
已使用附带额度	15 / 1,000
超额	0 credits
六月账单预测	$10.00

对这类画像而言,六月调整完全不可见。整月对话的 token 价值仅 0.15 美元,被附带额度轻松吸收,还剩 985 credits 富余。账单完全等于 10 美元的基础月费。

中等 —— 对话 + 每周 1 次代理任务 + 偶尔代码评审

这类开发者把对话与每月 4 次的 Claude Sonnet 4 代理任务结合,再加上每月 8 次基于 Sonnet 的代码评审。这是把 Copilot 嵌入日常工作流、但又没有持续运行代理的典型用户。

会话参数:150 次对话(GPT-5 mini,1,200 输入 / 600 输出)、4 次代理任务(Sonnet 4,30k 输入 / 12k 输出 / 18k 缓存读 / 6k 缓存写)、8 次代码评审(Sonnet 4,8k 输入 / 2.5k 输出 / 4k 缓存读)。

150 次对话(GPT-5 mini)	18.00 credits
4 次代理任务(Sonnet 4)	129.30 credits
8 次代码评审(Sonnet 4)	44.52 credits
事件合计	191.82 credits($1.92 USD 价值)
已使用附带额度	191.82 / 1,000
超额	0 credits
六月账单预测	$10.00

中等画像消耗了 19% 的附带额度,完全没有触发超额。即便每周一次代理任务、外加常规代码评审,Pro 档的 1,000 credits 仍有显著缓冲 —— 前提是单次会话规模保持在这一区间。

重度 —— 每日代理任务 + Opus 头脑风暴 + 代码评审

这是把 Copilot 当作主要工程伙伴的开发者:每月 200 次 Sonnet 4 对话、每月 22 次 Sonnet 4 代理任务(基本每日)、6 次 Opus 4.7 头脑风暴、16 次 Sonnet 4 代码评审。这一画像会越过超额阈值。

会话参数:200 次对话(Sonnet 4,2.5k 输入 / 1.5k 输出 / 1k 缓存)、22 次代理任务(Sonnet 4,60k 输入 / 25k 输出 / 35k 缓存读 / 12k 缓存写)、6 次头脑风暴(Opus 4.7,8k 输入 / 4k 输出)、16 次评审(Sonnet 4,12k 输入 / 3.5k 输出 / 6k 缓存读)。

200 次对话(Sonnet 4)	95.00 credits
22 次代理任务(Sonnet 4)	1,749.42 credits
6 次头脑风暴(Opus 4.7)	132.00 credits
16 次代码评审(Sonnet 4)	201.16 credits
事件合计	2,177.58 credits($21.78 USD 价值)
附带额度(Pro)	1,000 credits
超额 credits	1,177.58 credits
超额费用	$11.78
六月账单预测	$21.78

22 次代理任务是绝对主因,占总 credit 消耗的 80%。如果这位开发者把代理频次从每月 22 次降到 10 次(约每周 2–3 次),月账单会从 21.78 美元下降到约 10.36 美元,几乎消除全部超额。

想要交互版本的计算器?

Septim Meter 将于 5 月 12 日发布 —— 29 美元买断制。自由输入会话次数、模型选择与 token 估算,几秒钟内即可获得账单分解,以及与直连 API 的并列对比。完全离线运行,无需注册账户。

发布时通知我 →

没人讨论的角度:Copilot 与直连 API 的对比

截至 2026 年 4 月 28 日,GitHub 公布的每百万 token 费率与各底层提供商的官网 API 费率完全一致,token 上没有加价。这意味着"我是不是直接调 Anthropic 更划算?"这道题,其数学异常干净。

以重度用户画像为例:Copilot 内 21.78 美元的 token 价值预测。被消耗掉的 token 价值 —— 2,177.58 credits —— 按官网费率折合 21.78 美元的 API 调用费。直接调用 Anthropic 与 OpenAI,token 部分依然是这 21.78 美元,但不再叠加 10 美元的基础月费。

区别在于:直连 API 没有基础月费。用多少付多少,没有附带额度,也没有套餐费。

// Copilot Pro · 重度用户

$21.78

$10 基础 + $11.78 超额 · 含免费补全

// 直连 API · 同等 token 量

$21.78

纯 token 费用 · 无补全 · 无 IDE 集成

对重度用户而言,两边数字完全相同 —— 因为 10 美元基础月费正好被 1,000 credits 附带额度对冲。规律是这样:如果你的 token 价值超过 10 美元,Copilot 与直连 API 总成本一致;如果不到 10 美元,你就在为没用满的部分支付 10 美元基础费,直连 API 更便宜。

但这套对比需要补一个前提:Copilot Pro 不仅仅是 token 通道。它还包括:

Tab 补全与下一处编辑建议 —— 免费、无限。对大多数开发者而言,这才是值回月费的核心功能。基于 token 的对话与代理任务只是叠加项。
IDE 集成。GitHub Copilot 已嵌入 VS Code、JetBrains、Neovim 等主流编辑器。直连 API 想要复刻这套体验,需要额外搭建工具链。
GitHub Copilot Chat 上下文。IDE 集成会自动带上相关文件与仓库上下文。直连 API 则需要你自己管理整套上下文。

对轻量用户而言 —— 整月只产生 0.15 美元的 token 价值 —— Copilot Pro 比纯直连 API 多花 9.85 美元。这笔钱值不值,几乎完全取决于 Tab 补全的使用频率。如果你每天打开 IDE、频繁接受补全建议,10 美元月费很合理;如果你只是偶尔在命令行用 Copilot 做对话,直连 API 明显便宜得多。

对中等用户而言,逻辑类似:1.92 美元 token 价值、10 美元基础月费,其中 8.08 美元是在为 Tab 补全与 IDE 体验买单 —— 对活跃开发者来说仍是合理的取舍。

盈亏平衡点很清晰:每月 10 美元的 token 价值。在此之上,Copilot 与直连 API 的 token 成本一致,而 Copilot 还附送免费补全;在此之下,直连 API 更便宜,但你失去 Tab 补全。

延伸阅读:Anthropic API 定价 2026 —— 成本计算器与分模型拆解以及 Tokenocalypse —— 失控的代理任务到底要花多少钱。

6 月 1 日之前要做的事

到 GitHub 后台核对当前用量。访问 github.com/settings/copilot —— 后台会按类型与模型展示交互明细。重点看会话数与代理任务的大致体量。组织管理员可在 Settings → Billing → GitHub Copilot 查看团队整体用量。
用上文公式估算六月账单。把你日常的会话次数,乘以本文的实例数字:中等规模 Sonnet 代理任务约 49.65 credits,代码评审 14–22 credits,廉价模型对话 1–2 credits。相加,再与档位附带额度对照。或者等 5 月 12 日 Septim Meter 上线。
预测超出心理预期时,挑一个杠杆。最直接的:把代理任务模型从 Sonnet(每百万输入 3.00 美元)切到 GPT-5 mini(每百万输入 0.25 美元)。对输入密集型的代理任务 —— 大文件加载、长上下文传递 —— 输入费率才是主要驱动因素。GPT-5 mini 把代理输入成本砍掉 12 倍。质量取舍因任务而异,正式切换前先做对比测试。
当成本比自动化更重要时,降低代理频率。中等画像(每月 4 次代理)稳稳处于 Pro 额度内;重度画像(22 次)则越界。Pro 档下,Sonnet 代理任务的临界点大致在每月 20 次左右 —— 具体数字取决于单次规模。
重度代理用户考虑升级 Pro+。Copilot Pro+ 每月 39 美元,附带 3,900 credits。重度画像 2,177.58 credits 在 Pro+ 上正好等于 39 美元 —— 比 Pro + 超额的 21.78 美元还贵。对这一具体画像,Pro 仍更划算;但对更重度的用户(每天数小时连续代理)来说,Pro+ 可能比累积 Pro 超额便宜。
在 GitHub 后台设置消费上限。在 Settings → Billing and plans → Spending limits 中可对 Copilot 设月度上限。设为 0 美元意味着附带额度用尽即冻结访问;设为 20 美元则给你一个上限护栏。这是规避意外账单最稳妥的一步。
如果当前账单已经异常飙升,在 6 月 1 日之前联系 GitHub 支持。PRU 体系与 AI Credits 体系的计费机制不同;若现行体系下出现异常扣费,务必在 6 月 1 日的转换时点重置基线之前先解决。

Septim Meter —— 这台计算器

我们将于 5 月 12 日发布 Septim Meter:29 美元买断制,完全离线运行。输入会话次数与 token 估算,即可得到 Copilot 账单预测,以及与直连 API 在所有档位的并列对比。公式与本文一致 —— 无需注册账户,数据不离开本机。

命令行版本已经可用。5 月 12 日的发布版本会增加 HTML 报告输出,以及交互式的"模型切换"对比。如果你想抢先体验,或希望在发布时收到通知:

Septim Meter —— 5 月 12 日发布

29 美元买断制。预测六月 Copilot 账单、与直连 API 对比、选定最便宜路径。基于 GitHub 官方公布的费率构建 —— 费率变动只需一次 JSON 文件更新。

发布时通知我 →

常见问题

这次调整何时正式生效?

2026 年 6 月 1 日。GitHub 已于 2026 年 4 月 27 日公告。在此之前,现行的 Premium Request Unit 体系继续生效。6 月 1 日起,所有针对高级模型的按量计费均切换为 AI Credits。

代码补全会消耗 AI Credits 吗?

不会。代码补全(Tab 建议)与下一处编辑建议在 Copilot 的所有付费档位 —— Free、Pro、Pro+、Business、Enterprise —— 上保持免费。无论 6 月 1 日前后,它们都不消耗 AI Credits。计费仅适用于对话、调用高级模型的内联编辑,以及代理任务。

代理任务最便宜的模型是哪一款?

单纯比价:xAI 的 Grok Code Fast 1,每百万输入 0.20 美元、每百万输出 1.50 美元。如果你需要主流厂商、能力覆盖更广的模型,次便宜的是 GPT-5 mini —— 每百万输入 0.25 美元、每百万输出 2.00 美元。Claude Sonnet 4 是大多数 Copilot 用户默认的代理选择,每输入 token 比 GPT-5 mini 贵 12 倍 —— 对输入上下文较大的代理任务而言,这一差距非常显著。

6 月 1 日之后,我的 Pro 月费会涨吗?

基础月费不变。Copilot Pro 仍为每月 10 美元。每个档位附带等额价值的 AI Credits:1,000 credits 等于 10 美元 token 价值。只要 token 用量保持在附带额度内,账单完全一致。只有当月度 token 消耗超出额度时,才会按超出部分另行计费。

可以彻底关闭按量计费、永远不付超额吗?

可以。在 GitHub Settings → Billing and plans → Spending limits 中,把 Copilot 的消费上限设为 0 美元。当附带 credits 用尽时,高级模型访问将冻结至下一个计费周期,期间代码补全继续可用。这是为 Copilot 成本设硬上限最稳妥的做法。

在估算 6 月成本之前,如何掌握当前用量?

访问 github.com/settings/copilot —— 后台会展示交互次数与各模型用量。组织级数据可在 Settings → Billing → GitHub Copilot 中查看。6 月 1 日之前两个视图都不会显示按 token 的明细,但交互次数足以为本文公式提供起算基数。