Skip to content

Modèle de Comparaison de Benchmark

Harness A :

  • taux d'achèvement
  • tentatives moyennes
  • bugs détectés avant revue humaine

Harness B :

  • taux d'achèvement
  • tentatives moyennes
  • bugs détectés avant revue humaine

Interprétation :

  • Quel harness a changé le résultat ?
  • Quel harness a changé le coût pour obtenir le résultat ?