anonymous · 10:00 27/7/26 · ORA·techanonymous · 10:00 27/7/26 · ORA·techanonymous · 10:00 27/7/26 · ORA·techanonymous · 10:00 27/7/26 · ORA·techanonymous · 10:00 27/7/26 · ORA·techanonymous · 10:00 27/7/26 · ORA·tech

04 · Trung cấp → Nâng cao

Corrective RAG (CRAG)

Chấm điểm truy xuất TRƯỚC khi tin nó.

Khi nào dùng

Khi phải GIẢM BỊA mạnh: trả lời tự tin-sai gây hại (y tế, tài chính, pháp lý, hỗ trợ chính thống), hoặc kho tri thức hay thiếu/lỗi-thời nên cần "chấm điểm" độ liên quan rồi viết lại truy vấn / fallback web. Đây là lớp an toàn GẮN THÊM lên bất kỳ RAG nào. ❌ Bỏ qua khi trả lời sai ít tốn kém và bạn cần độ trễ thấp.

Ví dụ thực tế

Trợ lý y tế/pháp lý/tài chính: nơi một câu trả lời sai-mà-tự-tin có thể gây hại thật.
Chatbot hỗ trợ chính thống của hãng: không được bịa chính sách/điều khoản khi tài liệu thiếu.
Q&A trên kho tài liệu hay lỗi thời: grade thấy thiếu → fallback web để lấy thông tin mới.
Hệ thống cần dám trả "chưa đủ dữ liệu" thay vì đoán bừa (vd tư vấn tuân thủ/compliance).

Sơ đồ

Query → Retriever → Retrieved Docs
                        ▼
                  Grader (chấm độ liên quan)
   ┌────────────────────┼────────────────────┐
 CORRECT            AMBIGUOUS             INCORRECT
   ▼                    ▼                     ▼
 LLM              Query Rewrite           Web Search
 → Answer         → truy xuất lại         Fallback → LLM

Luồng hoạt động

1Query → Retriever → Retrieved Docs
2Evaluator / Grader chấm độ liên quan
3IF CORRECT → LLM → Answer
4IF AMBIGUOUS → Query Rewriter → truy xuất lại
5IF INCORRECT → Web Search Fallback → LLM → Answer

Hiểu nôm na

Như có một biên tập viên kiểm chứng đứng giữa: trước khi bạn trích một tài liệu, họ chấm xem nó có THẬT liên quan không. Liên quan → cho dùng; mơ hồ → bảo bạn hỏi lại cho rõ; sai bét → bảo đi tìm nguồn khác. Thà nói "chưa đủ dữ liệu" còn hơn để bạn trích bừa rồi nói sai một cách tự tin.

Khái niệm A–Z

Vấn đề kinh điển của RAG: nếu truy xuất ra tài liệu KHÔNG liên quan, LLM vẫn "cố" trả lời → bịa một cách tự tin. Corrective RAG chèn một CHỐT KIỂM TRA: sau khi truy xuất, một Grader (LLM nhẹ hoặc model phân loại) chấm xem tài liệu có THẬT SỰ liên quan không, rồi RẼ NHÁNH: (1) CORRECT → dùng luôn để trả lời; (2) AMBIGUOUS → viết lại câu hỏi (query rewrite) rồi truy xuất lại; (3) INCORRECT → bỏ tài liệu trong corpus, chuyển sang nguồn dự phòng (web search). Triết lý: "đừng tin mù dữ liệu lấy về — chấm điểm nó trước". Đây là cách rẻ và hiệu quả để cắt mạnh hallucination.

Cách hoạt động

Grader: chấm độ liên quan

Bộ chấm trả về nhãn (correct/ambiguous/incorrect) hoặc điểm 0–1 cho từng tài liệu so với query.

Có thể là LLM nhẹ với prompt "tài liệu này có chứa thông tin trả lời câu hỏi không?" → yes/no/partly.
Hoặc model phân loại nhỏ (rẻ, nhanh) huấn luyện cho relevance.
Đặt 2 ngưỡng: trên = correct, dưới = incorrect, ở giữa = ambiguous.

Ba nhánh sửa lỗi

Tùy kết quả chấm mà hệ thống tự "sửa" hướng đi.

CORRECT: lọc lấy phần liên quan (knowledge refinement) → trả lời + trích dẫn.
AMBIGUOUS: query rewrite (làm rõ/mở rộng) → truy xuất lại; có thể lặp 1–2 lần.
INCORRECT: thừa nhận corpus không có → web fallback (hoặc trả "chưa đủ dữ liệu" thay vì bịa).

Nội dung chuyên sâu 5 mô hình RAG

Mở khoá phần Thực hành (code), Mẹo thực chiến, Lưu ý bảo mật, Áp dụng dự án thật, Lỗi thường gặp và Thuật ngữ — dành cho gói Senior trở lên.

Cần đăng nhập + gói Senior trở lên

Đăng nhập để xem

Đã có tài khoản gói phù hợp? Đăng nhập để mở khoá ngay.

Kiến trúc liên quan

01Hybrid RAGGắn grader lên pipeline Hybrid sẵn có là cách triển khai phổ biến.03Agentic RAGCRAG như một bước tự-sửa bên trong vòng lặp agent.

Luyện phỏng vấn AI/RAG thực chiến

Hàng nghìn câu hỏi phỏng vấn IT + lộ trình — học nhanh, đi làm sớm.

Bắt đầu luyện