Skip to content

基准对比模板

Harness A:

  • 完成率
  • 平均重试次数
  • 人工审查前捕获的缺陷

Harness B:

  • 完成率
  • 平均重试次数
  • 人工审查前捕获的缺陷

解读:

  • 哪个 harness 改变了结果?
  • 哪个 harness 改变了获得结果的成本?