Top 5 kiến trúc RAG phải biết 2026
Mỗi kiến trúc dạy chi tiết A–Z: cách hoạt động, thực hành code, mẹo thực chiến, lưu ý bảo mật và cách áp dụng vào dự án thật.
Hybrid RAG
Senior+Vector dày gặp keyword thưa.
Khi câu hỏi vừa cần hiểu ngữ nghĩa, vừa cần khớp đúng từ khoá/mã/tên riêng (SKU, error code, tên hàm, số version, viết tắt) — và là lựa chọn MẶC ĐỊNH khi vector-only RAG hay bỏ sót kết quả chứa đúng từ khoá. ❌ Chưa cần nếu corpus nhỏ và truy vấn toàn ngôn ngữ tự nhiên: vector thuần đã đủ.
GraphRAG
Senior+Câu trả lời nằm trong MỐI QUAN HỆ.
Khi câu trả lời cần NỐI nhiều mẩu thông tin rải rác qua nhiều tài liệu ("ai làm dự án X dùng công nghệ Y ở công ty Z?"), suy luận theo quan hệ/thực thể (sơ đồ tổ chức, phụ thuộc, trích dẫn, chuỗi cung ứng), hoặc cần cái nhìn tổng thể ("chủ đề chính của toàn bộ tài liệu là gì?"). ❌ Thừa nếu đáp án gói gọn trong một đoạn — chi phí dựng graph không bõ.
Agentic RAG
Senior+Truy xuất là một KẾ HOẠCH, không phải một bước.
Khi câu hỏi cần nhiều nguồn/nhiều bước ("doanh số quý này so với kế hoạch và lý do lệch?"), phải chọn công cụ động (Vector/Web/SQL), cần dữ liệu thời gian thực, hoặc cần THỰC HIỆN hành động (tạo ticket, gọi API) chứ không chỉ đọc. ❌ Đừng dùng cho Q&A một bước: thêm độ trễ, chi phí và điểm dễ hỏng.
Corrective RAG (CRAG)
Senior+Chấm điểm truy xuất TRƯỚC khi tin nó.
Khi phải GIẢM BỊA mạnh: trả lời tự tin-sai gây hại (y tế, tài chính, pháp lý, hỗ trợ chính thống), hoặc kho tri thức hay thiếu/lỗi-thời nên cần "chấm điểm" độ liên quan rồi viết lại truy vấn / fallback web. Đây là lớp an toàn GẮN THÊM lên bất kỳ RAG nào. ❌ Bỏ qua khi trả lời sai ít tốn kém và bạn cần độ trễ thấp.
Multimodal RAG
Senior+Một index cho cả text, ảnh và bảng.
Khi tri thức nằm trong ẢNH/BIỂU ĐỒ/BẢNG/PDF scan/slide/khung video (báo cáo tài chính, sơ đồ kỹ thuật, hoá đơn, ảnh sản phẩm) mà OCR-ra-text làm mất bố cục và ý nghĩa hình ảnh. ❌ Không cần nếu tài liệu vốn là text sạch: pipeline text rẻ hơn và chính xác hơn.
So sánh nhanh
| Kiến trúc | Level | Chi phí | Độ trễ | Dựng index |
|---|---|---|---|---|
| 01Hybrid RAG | Cơ bản → Trung cấp | $ | Thấp | Thấp |
| 02GraphRAG | Trung cấp → Nâng cao | $$$ | Cao | Rất cao |
| 03Agentic RAG | Nâng cao | $$$ | Rất cao | Cao |
| 04Corrective RAG (CRAG) | Trung cấp → Nâng cao | $$ | Cao | Vừa |
| 05Multimodal RAG | Nâng cao | $$ | Vừa | Cao |
Đánh giá định tính, tương đối — phụ thuộc dữ liệu & cách triển khai của bạn. Chi phí/độ trễ là cho 1 truy vấn; "Dựng index" là công sức tạo chỉ mục ban đầu.
Chọn kiến trúc nào?
Cần cả hiểu nghĩa lẫn khớp đúng từ khoá/mã?
→ Hybrid RAG (mặc định nên thử trước)
Câu trả lời cần nối nhiều thực thể/quan hệ (multi-hop)?
→ GraphRAG
Cần nhiều bước, nhiều nguồn, quyết định công cụ động?
→ Agentic RAG
Phải giảm mạnh bịa, miền nhạy cảm (y tế/tài chính)?
→ Corrective RAG (CRAG)
Tri thức nằm trong ảnh/biểu đồ/bảng/PDF scan?
→ Multimodal RAG
Thực tế: bắt đầu Hybrid; CRAG là lớp an toàn gắn thêm; các kiến trúc có thể KẾT HỢP (vd Agentic gọi Hybrid + Graph làm tool).