Catatan dari produksi
AgentsCost controlRAG

Agentic RAG tanpa biaya yang membengkak

Agen itu loop, dan loop makan biaya. Bedanya agen yang berguna dengan tagihan yang membengkak ada di guardrail-nya — di tiap langkah.

Jaga tiap tool call

Batasi jumlah iterasi, validasi input dan output tool, dan minta model mempertanggungjawabkan tiap langkahnya. Catat biaya token per run supaya biaya sebuah tugas tak pernah jadi kejutan.

Untuk kasus yang di luar dugaan, tetap libatkan manusia. Otonomi itu diperoleh dari kasus-kasus yang lolos gate, bukan diberikan di awal.