การอนุมานของตัวแทนจำเป็นต้องมีเลเยอร์การกำหนดเส้นทาง

การอัปเดตแพลตฟอร์ม AI ของ Cloudflare เป็นการเตือนใจว่าโครงสร้างพื้นฐานของเอเจนต์ไม่ได้เกี่ยวกับหน่วยความจำ เครื่องมือ และแซนด์บ็อกซ์เท่านั้น นอกจากนี้ยังเกี่ยวกับการกำหนดเส้นทางการอนุมานด้วย

สถานที่ตั้งนั้นเรียบง่าย: เวิร์กโฟลว์ตัวแทนจริงมักต้องการแบบจำลองมากกว่าหนึ่งโมเดล ตัวแทนฝ่ายสนับสนุนอาจจัดประเภทด้วยแบบจำลองราคาถูก วางแผนด้วยแบบจำลองการให้เหตุผลที่ชัดเจนกว่า และดำเนินการงานย่อยด้วยแบบจำลองที่เบากว่า เวิร์กโฟลว์การเขียนโค้ดอาจเรียกโมเดลหนึ่งสำหรับการค้นหา อีกโมเดลหนึ่งสำหรับการแก้ไข และอีกโมเดลหนึ่งสำหรับการตรวจสอบ

เมื่อสิ่งนั้นเกิดขึ้น การเข้าถึงโมเดลจะกลายเป็นเลเยอร์ปฏิบัติการ ทีมต้องการตัวเลือกของผู้ให้บริการ พฤติกรรมที่ลองใหม่ การควบคุมเวลาแฝง การรายงานการใช้จ่าย และวิธีที่สะอาดในการสลับเมื่อโมเดลที่เหมาะสมเปลี่ยนแปลง

เหตุใดการคิดของผู้ให้บริการรายเดียวจึงพังทลาย

แชทบอทธรรมดาอาจอยู่รอดได้ในครั้งเดียวและการเรียกโมเดลเดียว ตัวแทนสามารถเชื่อมโยงการโทรจำนวนมากระหว่างงานได้ นั่นหมายความว่าผู้ให้บริการที่ช้ารายหนึ่งสามารถเพิ่มเวลาแฝงได้ และคำขอที่ล้มเหลวหนึ่งคำขอสามารถกระตุ้นให้เกิดความล้มเหลวดาวน์สตรีมอย่างต่อเนื่อง

Cloudflare กำลังวางตำแหน่ง AI Gateway และ Workers AI เป็นจุดสิ้นสุดแบบรวมระหว่างผู้ให้บริการต่างๆ ด้วยการเข้าถึงโมเดล การมองเห็นการใช้จ่ายแบบรวมศูนย์ การลองใหม่ การควบคุมการบันทึก และการรายงานตามข้อมูลเมตา

มุมการควบคุมต้นทุน

เศรษฐศาสตร์แบบตัวแทนอาจดูน่าเกลียดได้อย่างรวดเร็วเนื่องจากงานขยายออกเป็นลูกโซ่ งานที่ให้ความรู้สึกเรียบง่ายสำหรับผู้ใช้อาจเกี่ยวข้องกับการวางแผน การดึงข้อมูล การเรียกเครื่องมือ การตรวจสอบ และการสังเคราะห์ขั้นสุดท้าย หากไม่มีการกำหนดเส้นทางและความสามารถในการสังเกต ทีมจะไม่สามารถบอกได้ว่าเวิร์กโฟลว์ใดที่เผาผลาญงบประมาณ หรือที่ที่เวลาแฝงสะสม

Polygonface อ่านแล้ว

สแต็กรันไทม์ของเอเจนต์ต้องการเลเยอร์การกำหนดเส้นทางในลักษณะเดียวกับที่ระบบเว็บต้องการโหลดบาลานเซอร์และความสามารถในการสังเกต คุณภาพของแบบจำลองยังคงมีความสำคัญ แต่ความน่าเชื่อถือในการผลิตจะขึ้นอยู่กับว่าทีมกำหนดเส้นทาง ตรวจสอบ และการอนุมานงบประมาณในขั้นตอนการทำงานได้ดีเพียงใด

แหล่งที่มา

การอนุมานของตัวแทนจำเป็นต้องมีเลเยอร์การกำหนดเส้นทาง

การอัปเดตแพลตฟอร์ม AI ของ Cloudflare เป็นการเตือนใจว่าโครงสร้างพื้นฐานของเอเจนต์ไม่ได้เกี่ยวกับหน่วยความจำ เครื่องมือ และแซนด์บ็อกซ์เท่านั้น นอกจากนี้ยังเกี่ยวกับการกำหนดเส้นทางการอนุมานด้วย

สถานที่ตั้งนั้นเรียบง่าย: เวิร์กโฟลว์ตัวแทนจริงมักต้องการแบบจำลองมากกว่าหนึ่งโมเดล ตัวแทนฝ่ายสนับสนุนอาจจัดประเภทด้วยแบบจำลองราคาถูก วางแผนด้วยแบบจำลองการให้เหตุผลที่ชัดเจนกว่า และดำเนินการงานย่อยด้วยแบบจำลองที่เบากว่า เวิร์กโฟลว์การเขียนโค้ดอาจเรียกโมเดลหนึ่งสำหรับการค้นหา อีกโมเดลหนึ่งสำหรับการแก้ไข และอีกโมเดลหนึ่งสำหรับการตรวจสอบ

เมื่อสิ่งนั้นเกิดขึ้น การเข้าถึงโมเดลจะกลายเป็นเลเยอร์ปฏิบัติการ ทีมต้องการตัวเลือกของผู้ให้บริการ พฤติกรรมที่ลองใหม่ การควบคุมเวลาแฝง การรายงานการใช้จ่าย และวิธีที่สะอาดในการสลับเมื่อโมเดลที่เหมาะสมเปลี่ยนแปลง

เหตุใดการคิดของผู้ให้บริการรายเดียวจึงพังทลาย

แชทบอทธรรมดาอาจอยู่รอดได้ในครั้งเดียวและการเรียกโมเดลเดียว ตัวแทนสามารถเชื่อมโยงการโทรจำนวนมากระหว่างงานได้ นั่นหมายความว่าผู้ให้บริการที่ช้ารายหนึ่งสามารถเพิ่มเวลาแฝงได้ และคำขอที่ล้มเหลวหนึ่งคำขอสามารถกระตุ้นให้เกิดความล้มเหลวดาวน์สตรีมอย่างต่อเนื่อง

Cloudflare กำลังวางตำแหน่ง AI Gateway และ Workers AI เป็นจุดสิ้นสุดแบบรวมระหว่างผู้ให้บริการต่างๆ ด้วยการเข้าถึงโมเดล การมองเห็นการใช้จ่ายแบบรวมศูนย์ การลองใหม่ การควบคุมการบันทึก และการรายงานตามข้อมูลเมตา

มุมการควบคุมต้นทุน

เศรษฐศาสตร์แบบตัวแทนอาจดูน่าเกลียดได้อย่างรวดเร็วเนื่องจากงานขยายออกเป็นลูกโซ่ งานที่ให้ความรู้สึกเรียบง่ายสำหรับผู้ใช้อาจเกี่ยวข้องกับการวางแผน การดึงข้อมูล การเรียกเครื่องมือ การตรวจสอบ และการสังเคราะห์ขั้นสุดท้าย หากไม่มีการกำหนดเส้นทางและความสามารถในการสังเกต ทีมจะไม่สามารถบอกได้ว่าเวิร์กโฟลว์ใดที่เผาผลาญงบประมาณ หรือที่ที่เวลาแฝงสะสม

Polygonface อ่านแล้ว

สแต็กรันไทม์ของเอเจนต์ต้องการเลเยอร์การกำหนดเส้นทางในลักษณะเดียวกับที่ระบบเว็บต้องการโหลดบาลานเซอร์และความสามารถในการสังเกต คุณภาพของแบบจำลองยังคงมีความสำคัญ แต่ความน่าเชื่อถือในการผลิตจะขึ้นอยู่กับว่าทีมกำหนดเส้นทาง ตรวจสอบ และการอนุมานงบประมาณในขั้นตอนการทำงานได้ดีเพียงใด

แหล่งที่มา