结论先行

预计可释放约 2700 并发

在当前 9000 并发资源可互借的前提下,按 20% 超额并发、1% 报错率口径,估算可释放约 2759 并发;按 3% 报错率口径约 3235。迁移完成并确认 30% 承载提升后,可释放量可提升到 4200 左右。

当前总池推荐 ≈2700
20% 超额并发、1% 报错率口径下为 2759;3% 口径为 3235。
完整迁移到 kvfp8 后 ≈4200
迁移到 kvfp8-grey 且 30% 承载提升兑现后,1% 口径约 4200。

决策摘要

样本窗口 采用有效流量工作日:5/20、5/21、5/22、5/25;剔除周末 5/23、5/24。
资源口径 当前资源可以在两个 algo 池之间互借,因此主结论采用总量口径;分池数据仅用于观察压力分布。
后续动作 先按保守值释放,迁移完成后用最近完整 7 个有效流量日复算。

估算逻辑

释放并发会降低剩余资源和报错阈值;超过阈值的曲线面积,除以总曲线面积,就是预计报错率。

富裕并发量估算逻辑图
估算方法图解:红色面积代表预计报错量。
富裕并发量估算逻辑实际数字版
实际数字版:当前总池 9000、20% 超额并发、1% 报错率口径。
1

假设释放 X

当前资源 C,释放后剩余资源 R = C - X。

2

计算阈值 T

20% 口径 T = R × 1.2;10% 口径 T = R × 1.1。

3

计算报错面积

每分钟 err = max(demand - T, 0),累计为红色面积。

4

反推最大 X

二分搜索最大的 X,使预计报错率不超过 1% 或 3%。

预计报错率 = sum(max(demand - T, 0)) / sum(demand)

核心结果

当前 9000 总资源可互借,主决策看总量口径;不同超额并发和报错率要求对应不同释放空间。

20% 超额并发|1% 报错率2759
20% 超额并发|3% 报错率3235
10% 超额并发|1% 报错率2192
10% 超额并发|3% 报错率2711
场景超额口径目标报错率可释放并发剩余资源报错阈值超阈值分钟数
当前总池 900020%1%275962417489592
当前总池 900020%3%3235576569181040
当前总池 900010%1%219268087489592
当前总池 900010%3%2711628969181040

资源池约束

当前资源可以互借,因此此处仅展示两个 algo 池的压力拆解,主释放建议仍以总量口径为准。

资源池当前资源20%|1%20%|3%10%|1%10%|3%峰值
claude-code500022772496203022683877
kvfp8-grey4000378702494025654
说明:分池表用于解释流量来源和压力分布;由于资源可互借,不将单池结果作为最终释放上限。

迁移后测算

假设两周后 claude-code 用户迁移到 kvfp8-grey,且 kvfp8-grey 可多承担 30% 流量,则按当前总并发 / 1.3 折算。

20% 超额并发|1% 报错率4200
20% 超额并发|3% 报错率4566
10% 超额并发|1% 报错率3763
10% 超额并发|3% 报错率4162

图表查看

点击图片可以放大查看。AI 解释图用于沟通,确定性阈值图用于核对数字。

当前总池 20% 超额阈值图
当前总池,20% 超额并发报错口径。
当前总池 10% 超额阈值图
当前总池,10% 超额并发报错口径。
当前分资源池曲线图
当前分资源池曲线,用于观察两个 algo 池的压力分布。
迁移后 20% 超额阈值图
迁移后按 30% 承载提升折算,20% 超额并发报错口径。

数据下载

保留所有计算所需的 CSV,便于复核、二次分析或接入其他报告。