← Semua ageneval + keamanan
AI Audit
Audit otomatis yang mengukur build RAG/LLM Anda pada metrik yang penting dan melakukan red-team untuk berbagai cara sistem itu bisa gagal di produksi.
Apa yang dilakukannya
- Menilai faithfulness, answer relevancy, context precision & recall
- Red-team untuk jailbreak, prompt injection, dan kebocoran PII
- Memetakan temuan ke OWASP LLM Top 10 dan RAGAS
- Menghasilkan verdict gate yang langsung bisa dipasang ke CI