结论先行
预计可释放约 2700 并发
在当前 9000 并发资源可互借的前提下,按 20% 超额并发、1% 报错率口径,估算可释放约 2759 并发;按 3% 报错率口径约 3235。迁移完成并确认 30% 承载提升后,可释放量可提升到 4200 左右。
当前总池推荐
≈2700
20% 超额并发、1% 报错率口径下为 2759;3% 口径为 3235。
完整迁移到 kvfp8 后
≈4200
迁移到 kvfp8-grey 且 30% 承载提升兑现后,1% 口径约 4200。
决策摘要
样本窗口
采用有效流量工作日:5/20、5/21、5/22、5/25;剔除周末 5/23、5/24。
资源口径
当前资源可以在两个 algo 池之间互借,因此主结论采用总量口径;分池数据仅用于观察压力分布。
后续动作
先按保守值释放,迁移完成后用最近完整 7 个有效流量日复算。
估算逻辑
释放并发会降低剩余资源和报错阈值;超过阈值的曲线面积,除以总曲线面积,就是预计报错率。
1
假设释放 X
当前资源 C,释放后剩余资源 R = C - X。
2
计算阈值 T
20% 口径 T = R × 1.2;10% 口径 T = R × 1.1。
3
计算报错面积
每分钟 err = max(demand - T, 0),累计为红色面积。
4
反推最大 X
二分搜索最大的 X,使预计报错率不超过 1% 或 3%。
预计报错率 = sum(max(demand - T, 0)) / sum(demand)
核心结果
当前 9000 总资源可互借,主决策看总量口径;不同超额并发和报错率要求对应不同释放空间。
20% 超额并发|1% 报错率2759
20% 超额并发|3% 报错率3235
10% 超额并发|1% 报错率2192
10% 超额并发|3% 报错率2711
| 场景 | 超额口径 | 目标报错率 | 可释放并发 | 剩余资源 | 报错阈值 | 超阈值分钟数 |
|---|---|---|---|---|---|---|
| 当前总池 9000 | 20% | 1% | 2759 | 6241 | 7489 | 592 |
| 当前总池 9000 | 20% | 3% | 3235 | 5765 | 6918 | 1040 |
| 当前总池 9000 | 10% | 1% | 2192 | 6808 | 7489 | 592 |
| 当前总池 9000 | 10% | 3% | 2711 | 6289 | 6918 | 1040 |
资源池约束
当前资源可以互借,因此此处仅展示两个 algo 池的压力拆解,主释放建议仍以总量口径为准。
| 资源池 | 当前资源 | 20%|1% | 20%|3% | 10%|1% | 10%|3% | 峰值 |
|---|---|---|---|---|---|---|
| claude-code | 5000 | 2277 | 2496 | 2030 | 2268 | 3877 |
| kvfp8-grey | 4000 | 378 | 702 | 49 | 402 | 5654 |
说明:分池表用于解释流量来源和压力分布;由于资源可互借,不将单池结果作为最终释放上限。
迁移后测算
假设两周后 claude-code 用户迁移到 kvfp8-grey,且 kvfp8-grey 可多承担 30% 流量,则按当前总并发 / 1.3 折算。
20% 超额并发|1% 报错率4200
20% 超额并发|3% 报错率4566
10% 超额并发|1% 报错率3763
10% 超额并发|3% 报错率4162
图表查看
点击图片可以放大查看。AI 解释图用于沟通,确定性阈值图用于核对数字。
数据下载
保留所有计算所需的 CSV,便于复核、二次分析或接入其他报告。





