Top 5 RAG
03 · Nâng cao

Agentic RAG

Truy xuất là một KẾ HOẠCH, không phải một bước.

Khi nào dùng

Khi câu hỏi cần nhiều nguồn/nhiều bước ("doanh số quý này so với kế hoạch và lý do lệch?"), phải chọn công cụ động (Vector/Web/SQL), cần dữ liệu thời gian thực, hoặc cần THỰC HIỆN hành động (tạo ticket, gọi API) chứ không chỉ đọc. ❌ Đừng dùng cho Q&A một bước: thêm độ trễ, chi phí và điểm dễ hỏng.

Ví dụ thực tế

  • Trợ lý phân tích nội bộ (BI): hỏi "doanh số quý này so với kế hoạch?" → agent tự chạy SQL + đọc docs giải thích.
  • Deep-research: tổng hợp một chủ đề từ web + tài liệu nội bộ qua nhiều bước tra cứu.
  • Hỗ trợ kỹ thuật xuyên hệ thống: tra Jira + wiki + log để dựng lại nguyên nhân sự cố.
  • Trợ lý thao tác: không chỉ trả lời mà còn tạo ticket / gọi API sau khi xác nhận với người.

Sơ đồ

Sơ đồ minh hoạ luồng xử lý; xem mô tả từng bước ở mục Luồng hoạt động bên dưới.

Luồng hoạt động

  1. 1Query → Planner Agent (lập kế hoạch)
  2. 2Chọn động trong các Tool: Vector Search · Web Search · SQL Database
  3. 3Reasoner Agent tổng hợp
  4. 4Vòng lặp: agent loops until confident (lặp đến khi đủ tự tin)
  5. 5Final Answer

Hiểu nôm na

Như giao việc cho một trợ lý nghiên cứu giỏi, thay vì tự tra Google một lần. Trợ lý tự nghĩ "nên xem nguồn nào trước", mở từng nguồn, thấy thiếu thì tra tiếp, và chỉ CHỐT câu trả lời khi đã đủ tự tin. Bạn đánh đổi: linh hoạt cao, nhưng phải khoán trần thời gian/chi phí kẻo trợ lý "tra mãi không thôi".

Khái niệm A–Z

RAG cổ điển là một đường thẳng: truy xuất 1 lần → trả lời. Nhiều câu hỏi thật KHÔNG vừa khuôn đó: cần hỏi nhiều nguồn, phân rã câu hỏi, hay tra lại khi kết quả chưa đủ. Agentic RAG biến truy xuất thành VÒNG LẶP do một AGENT điều khiển: Planner Agent quyết định bước tiếp theo (truy vấn gì, gọi tool nào — vector, web, SQL...), thực thi, quan sát kết quả, rồi LẶP cho đến khi Reasoner Agent thấy đủ thông tin để trả lời. Đây là ReAct/agent loop áp vào retrieval: linh hoạt mạnh, nhưng phải kiểm soát chi phí, độ trễ và an toàn (vì agent được quyền hành động).

Cách hoạt động

Vòng lặp Plan → Act → Observe

Khác RAG tuyến tính, agent ra quyết định ở mỗi vòng dựa trên những gì đã thấy.

  • Plan: LLM quyết định bước kế (phân rã câu hỏi, chọn tool, soạn truy vấn con).
  • Act: gọi tool (vector search / web search / SQL / API).
  • Observe: đọc kết quả; nếu thiếu → lặp với truy vấn mới; nếu đủ → chuyển Reasoner tổng hợp + trích dẫn.
  • Điều kiện dừng (BẮT BUỘC): tối đa N vòng + ngân sách token/tiền + "đủ tự tin".

Tool dùng làm "retriever"

Mỗi nguồn là một tool có schema rõ; agent chọn tool theo câu hỏi.

  • Vector Search: kiến thức nội bộ ngữ nghĩa.
  • SQL/DB: số liệu chính xác, tổng hợp (doanh số, tồn kho).
  • Web Search: thông tin mới/ngoài corpus (nhưng phải kiểm chứng + sandbox).
  • Mỗi tool nên trả kèm nguồn để Reasoner trích dẫn được.

Nội dung chuyên sâu 5 mô hình RAG

Mở khoá phần Thực hành (code), Mẹo thực chiến, Lưu ý bảo mật, Áp dụng dự án thật, Lỗi thường gặp và Thuật ngữ — dành cho gói Senior trở lên.

Cần đăng nhập + gói Senior trở lên

Đã có tài khoản gói phù hợp? Đăng nhập để mở khoá ngay.

Kiến trúc liên quan

Luyện phỏng vấn AI/RAG thực chiến

Hàng nghìn câu hỏi phỏng vấn IT + lộ trình — học nhanh, đi làm sớm.

Bắt đầu luyện