← Catatan dari produksi
RAGRetrievalReranking
Hybrid retrieval + reranking, dijelaskan
Vektor dense menangkap makna; vektor sparse (BM25) menangkap istilah yang persis. Sebagian besar pertanyaan di produksi butuh keduanya — itulah kenapa hybrid retrieval mengungguli salah satunya saja di korpus nyata.
Kenapa perlu menambah reranker
Retrieval itu berorientasi recall — tebar jaring selebar mungkin. Reranker cross-encoder lalu menilai ulang kandidat teratas dengan presisi yang jauh lebih tinggi daripada yang sanggup dilakukan retriever tahap pertama. Biasanya inilah akurasi termurah yang bisa Anda beli.
Perhitungkan latensinya: ambil k≈50, rerank jadi 5–8 teratas yang benar-benar dikirim ke model. Ukur context precision sebelum dan sesudahnya — peningkatannya biasanya kelihatan jelas.