Skip to content

Mẫu So sánh Benchmark

Harness A:

  • tỷ lệ hoàn thành
  • số lần thử lại trung bình
  • lỗi được bắt trước khi review của con người

Harness B:

  • tỷ lệ hoàn thành
  • số lần thử lại trung bình
  • lỗi được bắt trước khi review của con người

Diễn giải:

  • Harness nào thay đổi kết quả?
  • Harness nào thay đổi chi phí để đạt được kết quả?