Skip to content

إجراء التشغيل القياسي: حلقة التغذية الراجعة للمراقبة

استخدم هذا الإجراء عندما يكون التصحيح بطيئًا، أو يستمر الوكلاء في الادعاء بالنجاح بدون أدلة، أو عندما يكون سلوك وقت التشغيل أصعب في الفحص من الكود نفسه.

الهدف

إعطاء الوكيل حلقة تغذية راجعة محلية عبر السجلات والمقاييس والتتبعات وأحمال العمل القابلة للتنفيذ حتى يتمكن من الاستنتاج من التنفيذ، وليس فقط من فحص الكود.

الحد الأدنى من الحزمة

  • التطبيق يُصدر سجلات منظمة
  • التطبيق يُصدر مقاييس وتتبعات عندما يكون ذلك ممكنًا
  • طبقة توزيع أو تجميع محلية
  • واجهات استعلام للسجلات والمقاييس والتتبعات
  • حمل عمل أو رحلة مستخدم قابلة للتكرار لإعادة التشغيل بعد كل تغيير

إجراء التشغيل القياسي للتنفيذ

  1. حدد رحلات وقت التشغيل الذهبية الأهم.
  2. أضف سجلات منظمة لبدء التشغيل والمسار الحرج.
  3. أضف مقاييس لزمن الاستجابة أو عدد الإخفاقات أو عمق الطابور حيث يكون مفيدًا.
  4. أضف تتبعات أو علامات توقيت للتدفقات البطيئة أو متعددة الخطوات.
  5. اجعل الإشارات قابلة للاستعلام من بيئة التطوير المحلية.
  6. أعطِ الوكيل حمل عمل أو سيناريو واحد قابل للتكرار لإعادة تشغيله.
  7. اطلب الحلقة: استعلام -> ربط -> استنتاج -> تنفيذ -> إعادة تشغيل -> إعادة تشغيل -> تحقق.

قائمة فحص جلسة التصحيح

  • ما الذي فشل؟
  • أي إشارة تثبت الفشل؟
  • أي طبقة تملك الفشل؟
  • ما الذي تغير بعد الإصلاح؟
  • هل أُعيد تشغيل التطبيق بنظافة؟
  • هل نجح نفس حمل العمل بعد إعادة التشغيل؟

تعريف الإنجاز

  • يمكن للوكيل شرح نمط فشل من أدلة وقت التشغيل.
  • يمكن إعادة تشغيل نفس حمل العمل بعد كل تغيير.
  • إعادة التشغيل وإعادة تشغيل حمل العمل جزء من حلقة المهام العادية.
  • إشارات الموثوقية موثقة في docs/RELIABILITY.md.