ความสามารถในการสังเกตคือชั้นเอเจนต์ที่หายไป

ทีมส่วนใหญ่จะจัดส่งเวิร์กโฟลว์ของตัวแทนก่อนที่จะจัดส่งเครื่องมือที่จำเป็นในการทำความเข้าใจ

โดยปกติคุณจะพบพร้อมต์ เอาต์พุตโมเดล และบันทึกดิบ สิ่งที่ขาดหายไปคือเนื้อเยื่อเกี่ยวพันระหว่างพวกเขา: เรื่องราวการประหารชีวิต การกระทำใดที่เริ่มทำงานก่อน ข้อมูลใดที่อ่านได้ เครื่องมือใดที่สัมผัส อันไหนลองเรียกใช้เส้นทางอีกครั้ง และสิ่งที่ผู้ปฏิบัติงานต้องซ่อมแซมด้วยมือในที่สุด

เหตุใดบันทึกจึงไม่เพียงพอ

บันทึกจะบอกคุณว่ามีเหตุการณ์เกิดขึ้น พวกเขาไม่จำเป็นต้องบอกคุณว่าเวิร์กโฟลว์ใดระบุเหตุการณ์เหล่านั้นเป็นของหรือว่าเหตุการณ์เหล่านั้นถูกคาดหวังไว้หรือไม่ นี่คือความแตกต่างระหว่างเสียงรบกวนและหลักฐานการวินิจฉัย

เครื่องดนตรีอะไร

  • รหัสเวิร์กโฟลว์และรหัสขั้นตอน
  • ตัวตนของนักแสดง: แบบจำลอง ระบบอัตโนมัติ หรือมนุษย์
  • อินพุตเครื่องมือและเอาต์พุตสรุป
  • ลองนับและเหตุผลการยกระดับอีกครั้ง
  • สถานะเทอร์มินัลด้วยสาเหตุที่เป็นภาษาธรรมดา

ผลตอบแทนจากการดำเนินงาน

เมื่อมองเห็นสิ่งนี้ การสนทนาก็จะเปลี่ยนไป ทีมหยุดโทษโมเดลว่าเป็นหินใหญ่ก้อนเดียว และเริ่มมองเห็นโหมดความล้มเหลวที่เป็นรูปธรรม: บริบทเก่า สมมติฐานที่พัง เงื่อนไขการลองใหม่ที่ไม่ชัดเจน ความเป็นเจ้าของการตรวจสอบที่ไม่ชัดเจน

ชั้นที่หายไปจริง

ความสามารถในการสังเกตไม่ใช่ความสามารถพิเศษ สำหรับระบบเอเจนต์ เป็นชั้นที่เปลี่ยน “AI ทำอะไรแปลกๆ” ให้เป็นปัญหาทางวิศวกรรมที่แก้ไขได้

ความสามารถในการสังเกตคือชั้นเอเจนต์ที่หายไป

ทีมส่วนใหญ่จะจัดส่งเวิร์กโฟลว์ของตัวแทนก่อนที่จะจัดส่งเครื่องมือที่จำเป็นในการทำความเข้าใจ

โดยปกติคุณจะพบพร้อมต์ เอาต์พุตโมเดล และบันทึกดิบ สิ่งที่ขาดหายไปคือเนื้อเยื่อเกี่ยวพันระหว่างพวกเขา: เรื่องราวการประหารชีวิต การกระทำใดที่เริ่มทำงานก่อน ข้อมูลใดที่อ่านได้ เครื่องมือใดที่สัมผัส อันไหนลองเรียกใช้เส้นทางอีกครั้ง และสิ่งที่ผู้ปฏิบัติงานต้องซ่อมแซมด้วยมือในที่สุด

เหตุใดบันทึกจึงไม่เพียงพอ

บันทึกจะบอกคุณว่ามีเหตุการณ์เกิดขึ้น พวกเขาไม่จำเป็นต้องบอกคุณว่าเวิร์กโฟลว์ใดระบุเหตุการณ์เหล่านั้นเป็นของหรือว่าเหตุการณ์เหล่านั้นถูกคาดหวังไว้หรือไม่ นี่คือความแตกต่างระหว่างเสียงรบกวนและหลักฐานการวินิจฉัย

เครื่องดนตรีอะไร

  • รหัสเวิร์กโฟลว์และรหัสขั้นตอน
  • ตัวตนของนักแสดง: แบบจำลอง ระบบอัตโนมัติ หรือมนุษย์
  • อินพุตเครื่องมือและเอาต์พุตสรุป
  • ลองนับและเหตุผลการยกระดับอีกครั้ง
  • สถานะเทอร์มินัลด้วยสาเหตุที่เป็นภาษาธรรมดา

ผลตอบแทนจากการดำเนินงาน

เมื่อมองเห็นสิ่งนี้ การสนทนาก็จะเปลี่ยนไป ทีมหยุดโทษโมเดลว่าเป็นหินใหญ่ก้อนเดียว และเริ่มมองเห็นโหมดความล้มเหลวที่เป็นรูปธรรม: บริบทเก่า สมมติฐานที่พัง เงื่อนไขการลองใหม่ที่ไม่ชัดเจน ความเป็นเจ้าของการตรวจสอบที่ไม่ชัดเจน

ชั้นที่หายไปจริง

ความสามารถในการสังเกตไม่ใช่ความสามารถพิเศษ สำหรับระบบเอเจนต์ เป็นชั้นที่เปลี่ยน “AI ทำอะไรแปลกๆ” ให้เป็นปัญหาทางวิศวกรรมที่แก้ไขได้