Catatan dari produksi
RAGRetrievalReranking

Hybrid retrieval + reranking, dijelaskan

Vektor dense menangkap makna; vektor sparse (BM25) menangkap istilah yang persis. Sebagian besar pertanyaan di produksi butuh keduanya — itulah kenapa hybrid retrieval mengungguli salah satunya saja di korpus nyata.

Kenapa perlu menambah reranker

Retrieval itu berorientasi recall — tebar jaring selebar mungkin. Reranker cross-encoder lalu menilai ulang kandidat teratas dengan presisi yang jauh lebih tinggi daripada yang sanggup dilakukan retriever tahap pertama. Biasanya inilah akurasi termurah yang bisa Anda beli.

Perhitungkan latensinya: ambil k≈50, rerank jadi 5–8 teratas yang benar-benar dikirim ke model. Ukur context precision sebelum dan sesudahnya — peningkatannya biasanya kelihatan jelas.