Mẫu So sánh Benchmark
Harness A:
- tỷ lệ hoàn thành
- số lần thử lại trung bình
- lỗi được bắt trước khi review của con người
Harness B:
- tỷ lệ hoàn thành
- số lần thử lại trung bình
- lỗi được bắt trước khi review của con người
Diễn giải:
- Harness nào thay đổi kết quả?
- Harness nào thay đổi chi phí để đạt được kết quả?