在缓存前缀已经如此之大的前提下,一个步骤会追加多少新(未缓存)token?
填充 tab:append_by_prefix(src/05_LLMGeneration.tex)——它是前缀-vs-追加散点图(fig:prefill_append_relationship)的定量配套。对 Claude 和 Codex,每个智能体步骤按其 prefix_tokens 分箱,并在每个箱内报告 newly_append_tokens 的分布:count、avg、p50、p90、p99。
前缀箱采用倍增方式,以 1024-token 为单位:<1k, 1-2k, 2-4k, 4-8k, 8-16k, 16-32k, 32-64k, 64-128k, 128-256k, >256k。prefix_tokens / newly_append_tokens 的核算与 prefix_append_distribution 和 token_length_distribution 所用的相同,因此各处数字彼此对得上。