Top 5 RAG
04 · Trung cấp → Nâng cao

Corrective RAG (CRAG)

Chấm điểm truy xuất TRƯỚC khi tin nó.

Khi nào dùng

Khi phải GIẢM BỊA mạnh: trả lời tự tin-sai gây hại (y tế, tài chính, pháp lý, hỗ trợ chính thống), hoặc kho tri thức hay thiếu/lỗi-thời nên cần "chấm điểm" độ liên quan rồi viết lại truy vấn / fallback web. Đây là lớp an toàn GẮN THÊM lên bất kỳ RAG nào. ❌ Bỏ qua khi trả lời sai ít tốn kém và bạn cần độ trễ thấp.

Ví dụ thực tế

  • Trợ lý y tế/pháp lý/tài chính: nơi một câu trả lời sai-mà-tự-tin có thể gây hại thật.
  • Chatbot hỗ trợ chính thống của hãng: không được bịa chính sách/điều khoản khi tài liệu thiếu.
  • Q&A trên kho tài liệu hay lỗi thời: grade thấy thiếu → fallback web để lấy thông tin mới.
  • Hệ thống cần dám trả "chưa đủ dữ liệu" thay vì đoán bừa (vd tư vấn tuân thủ/compliance).

Sơ đồ

Sơ đồ minh hoạ luồng xử lý; xem mô tả từng bước ở mục Luồng hoạt động bên dưới.

Luồng hoạt động

  1. 1Query → Retriever → Retrieved Docs
  2. 2Evaluator / Grader chấm độ liên quan
  3. 3IF CORRECT → LLM → Answer
  4. 4IF AMBIGUOUS → Query Rewriter → truy xuất lại
  5. 5IF INCORRECT → Web Search Fallback → LLM → Answer

Hiểu nôm na

Như có một biên tập viên kiểm chứng đứng giữa: trước khi bạn trích một tài liệu, họ chấm xem nó có THẬT liên quan không. Liên quan → cho dùng; mơ hồ → bảo bạn hỏi lại cho rõ; sai bét → bảo đi tìm nguồn khác. Thà nói "chưa đủ dữ liệu" còn hơn để bạn trích bừa rồi nói sai một cách tự tin.

Khái niệm A–Z

Vấn đề kinh điển của RAG: nếu truy xuất ra tài liệu KHÔNG liên quan, LLM vẫn "cố" trả lời → bịa một cách tự tin. Corrective RAG chèn một CHỐT KIỂM TRA: sau khi truy xuất, một Grader (LLM nhẹ hoặc model phân loại) chấm xem tài liệu có THẬT SỰ liên quan không, rồi RẼ NHÁNH: (1) CORRECT → dùng luôn để trả lời; (2) AMBIGUOUS → viết lại câu hỏi (query rewrite) rồi truy xuất lại; (3) INCORRECT → bỏ tài liệu trong corpus, chuyển sang nguồn dự phòng (web search). Triết lý: "đừng tin mù dữ liệu lấy về — chấm điểm nó trước". Đây là cách rẻ và hiệu quả để cắt mạnh hallucination.

Cách hoạt động

Grader: chấm độ liên quan

Bộ chấm trả về nhãn (correct/ambiguous/incorrect) hoặc điểm 0–1 cho từng tài liệu so với query.

  • Có thể là LLM nhẹ với prompt "tài liệu này có chứa thông tin trả lời câu hỏi không?" → yes/no/partly.
  • Hoặc model phân loại nhỏ (rẻ, nhanh) huấn luyện cho relevance.
  • Đặt 2 ngưỡng: trên = correct, dưới = incorrect, ở giữa = ambiguous.

Ba nhánh sửa lỗi

Tùy kết quả chấm mà hệ thống tự "sửa" hướng đi.

  • CORRECT: lọc lấy phần liên quan (knowledge refinement) → trả lời + trích dẫn.
  • AMBIGUOUS: query rewrite (làm rõ/mở rộng) → truy xuất lại; có thể lặp 1–2 lần.
  • INCORRECT: thừa nhận corpus không có → web fallback (hoặc trả "chưa đủ dữ liệu" thay vì bịa).

Nội dung chuyên sâu 5 mô hình RAG

Mở khoá phần Thực hành (code), Mẹo thực chiến, Lưu ý bảo mật, Áp dụng dự án thật, Lỗi thường gặp và Thuật ngữ — dành cho gói Senior trở lên.

Cần đăng nhập + gói Senior trở lên

Đã có tài khoản gói phù hợp? Đăng nhập để mở khoá ngay.

Kiến trúc liên quan

Luyện phỏng vấn AI/RAG thực chiến

Hàng nghìn câu hỏi phỏng vấn IT + lộ trình — học nhanh, đi làm sớm.

Bắt đầu luyện