Context Selection: Chọn đúng thông tin đưa vào

Chiến lược chọn lọc thông tin quan trọng nhất đưa vào Context Window. Học cách loại bỏ nhiễu để AI tập trung, tránh hiện tượng 'ngộp' ngữ cảnh.

Định nghĩa

Context Selection là chiến lược quyết định thông tin nào được đưa vào Context Window và thông tin nào bị loại bỏ, dựa trên tiêu chí liên quan (relevance) thay vì đầy đủ (completeness). Đây là bước đầu tiên và quan trọng nhất trong quản lý context — chọn sai thì nén hay sắp xếp cũng không cứu vãn được kết quả.

Giải thích chi tiết

Context Window là "RAM", không phải "Ổ cứng"

Nhiều người nhầm tưởng Context Window giống như kho lưu trữ: cứ nhét càng nhiều dữ liệu vào, AI càng "thông minh". Thực tế ngược lại. Context Window giống như RAM của máy tính — nó có giới hạn cứng (128K tokens, 200K tokens...) và chỉ nên chứa dữ liệu cần thiết cho tác vụ hiện tại.

Nhét 50 tài liệu không liên quan vào prompt giống như mở 50 tab Chrome trên máy tính 4GB RAM: hệ thống chậm lại, lag, và dễ "crash" (tạo ra hallucination). Context Selection là nghệ thuật giữ cho RAM sạch — chỉ giữ lại những gì thực sự cần thiết ngay lúc này.

Hiện tượng "Primacy/Recency Bias" trong LLM

Thí nghiệm thực tế với các model hiện đại (GPT-4, Claude 3) cho thấy: khi đưa 20 đoạn văn bản vào cùng một prompt, LLM thường nhớ rõ đoạn đầu tiên (primacy bias) và đoạn cuối cùng (recency bias), nhưng quên đoạn ở giữa (lost in the middle).

Điều này có nghĩa là Context Selection không chỉ là "chọn gì" mà còn là "bỏ gì để chỉ giữ lại cái quan trọng ở đầu hoặc cuối". Nếu thông tin quan trọng nằm chìm giữa 100 đoạn văn bản filler, AI sẽ bỏ qua nó như thể nó không tồn tại.

Ba tiêu chí vàng cho việc chọn lọc

Recency (Gần đây nhất) Trong conversation, 5 lượt trao đổi gần nhất thường quan trọng hơn 50 lượt từ 3 tháng trước. Khách hàng đang hỏi về lỗi hiện tại, không cần biết họ đã hỏi gì vào năm ngoái.
Relevance (Liên quan nhất) Khi hỏi về chính sách hoàn tiền, chỉ cần đoạn điều khoản liên quan, không cần toàn bộ hợp đồng 100 trang. Dùng embedding hoặc keyword matching để chọn đoạn có độ tương đồng ngữ nghĩa cao nhất với câu hỏi.
Diversity (Đa dạng) Tránh chọn 10 tài liệu nói y hệt một ý. Thay vào đó, chọn 3 tài liệu từ 3 góc nhìn khác nhau (ví dụ: technical docs, user feedback, business requirements) để AI có cái nhìn toàn diện mà không bị trùng lặp.

Ví dụ thực tế

Chatbot Hỗ trợ Khách hàng

Before (Chưa chọn lọc): Nhét toàn bộ lịch sử chat 2 năm của khách hàng vào prompt (5000 tokens). AI bị "ngộp", trả lời chậm, và liên tục nhầm lẫn thông tin từ đơn hàng cũ với đơn hàng hiện tại.

After (Đã chọn lọc): Chỉ chọn 10 tin nhắn gần nhất + thông tin profile khách hàng (800 tokens). AI tập trung vào vấn đề hiện tại, trả lời nhanh và chính xác hơn 40%.

Trợ lý Review Code

Before: Mở toàn bộ codebase 10.000 file trong IDE khi dùng Copilot. AI nhìn thấy cả đống file legacy không liên quan, đưa ra suggestion sửa code nhầm chỗ.

After: Dùng dependency graph hoặc static analysis để chọn chỉ 5 file liên quan trực tiếp đến Pull Request hiện tại (imports, exports, function calls). AI chỉ phân tích code trong phạm vi ảnh hưởng, tìm ra bug chính xác hơn.

Nghiên cứu Tài liệu (RAG)

Before: Copy paste 20 paper PDF vào prompt. Do hiện tượng "lost in the middle", AI chỉ tóm tắt 3 paper đầu và 2 paper cuối, bỏ sót paper quan trọng nhất nằm ở vị trí thứ 10.

After: Dùng vector search chọn top 3 paper có embedding gần nhất với câu hỏi người dùng, đặt chúng ở đầu prompt. AI phân tích sâu và trích dẫn chính xác nguồn.

Ứng dụng

Sinh viên nghiên cứu Khi dùng AI ôn thi, đừng photo cả cuốn sách 500 trang vào prompt. Chọn lọc 3 trang ghi chú quan trọng nhất (do chính bạn đánh dấu) hoặc 5 đoạn trích từ sách giáo khoa liên quan trực tiếp đến đề cương. AI sẽ giải thích sâu hơn vì không bị phân tán bởi nội dung irrelevant.

Developer dùng AI Coding Assistant Khi dùng Cursor hay Claude Code, thói quen "mở cả folder project" là sai lầm. Thay vào đó, chỉ mở các file liên quan đến tính năng đang sửa (file đang edit + file test + file dependency trực tiếp). Đóng các file legacy, node_modules, hoặc file config không liên quan. Context sạch → AI viết code chính xác hơn.

Doanh nghiệp triển khai Chatbot nội bộ Thiết lập rule: chỉ truy xuất dữ liệu khách hàng từ 6 tháng gần nhất, hoặc chỉ chọn email có label "Quan trọng" từ hệ thống CRM. Dữ liệu cũ hơn 1 năm có thể summarize thành 3 dòng tiểu sử thay vì đưa nguyên văn 50 email vào. Điều này giảm 60% token cost và tăng độ chính xác của câu trả lời.

So sánh các chiến lược chọn lọc

Chiến lược	Cơ chế	Ưu điểm	Nhược điểm
Naive Truncation	Cắt bỏ giữa, giữ đầu và cuối	Đơn giản, không tốn compute	Mất thông tin quan trọng rơi vào giữa
Semantic Selection	Dùng embedding chọn đoạn liên quan nhất	Chính xác theo ý nghĩa ngữ nghĩa	Tốn thời gian tính toán, phụ thuộc chất lượng embedding model
Hierarchical	Chọn summary/c outline của nhiều tài liệu	Bao quát toàn diện mà không dài dòng	Có thể mất chi tiết fine-grained nếu summary quá sơ sài

Kết luận: Context Selection hiệu quả nhất khi kết hợp cả ba: dùng Semantic để chọn ra top candidates, rồi dùng Naive để cắt bỏ phần thừa, cuối cùng dùng Hierarchical để nén thông tin nếu vẫn còn dài (xem thêm Context Compression).

Context Selection: Chọn đúng thông tin đưa vào

Định nghĩa

Giải thích chi tiết

Context Window là "RAM", không phải "Ổ cứng"

Hiện tượng "Primacy/Recency Bias" trong LLM

Ba tiêu chí vàng cho việc chọn lọc

Ví dụ thực tế

Chatbot Hỗ trợ Khách hàng

Trợ lý Review Code

Nghiên cứu Tài liệu (RAG)

Ứng dụng

So sánh các chiến lược chọn lọc

Bài viết liên quan

Cùng cụm: Context Management

Context Compression: Nén thông tin mà không mất ý

Context Ordering: Thứ tự thông tin ảnh hưởng kết quả

Context Isolation: Tách biệt context tránh nhiễu

Tối ưu Context Window: Chiến lược khi token có hạn

Đọc tiếp

Memory & Conversation: Quản lý bộ nhớ dài hạn

State & Session Management (Level 2)

On this page