Modèle de Comparaison de Benchmark
Harness A :
- taux d'achèvement
- tentatives moyennes
- bugs détectés avant revue humaine
Harness B :
- taux d'achèvement
- tentatives moyennes
- bugs détectés avant revue humaine
Interprétation :
- Quel harness a changé le résultat ?
- Quel harness a changé le coût pour obtenir le résultat ?