TROISINH
Dụng binh cơ bảnKế chia để trị

Kế 2: Bỏ đầu bỏ đuôi — Chỉ đưa phần liên quan, loại bỏ noise

Kế 2 Binh pháp AI: Cắt bỏ phần thừa, chỉ đưa AI nội dung cốt lõi để tránh nhiễu thông tin và tiết kiệm context window

Mở đầu: Chuyện con cá thờ

Ngày xưa, có vị tướng nhà Trần sau khi đánh thắng giặc Nguyên, được dân làng thết mỗi con cá lớn. Người dân làm lễ trình diễn cả tiếng đồng hồ: đọc văn tế, rước cá quanh làng, mổ đầu cắt đuôi theo nghi thức. Tướng ngồi đói meo, canh giờ đồng hồ đánh hai mới được ăn.

Qua ngày sau, tướng bèn dặn: "Mai đem cá đến, chặt đầu chặt đuôi bỏ đi, chỉ để lại khúc thân ngon nhất. Không cần khói hương, không cần lễ lạc."

Dân làng phàn nàn: "Thưa tướng quân, đầu cá có mang, đuôi cá có vây, bỏ đi sao được?"

Tướng cười: "Ta cần chất đạm để đánh giặc, không cần vây mang để làm cảnh."

Trong thế giới AI, Kế 2: Bỏ đầu bỏ đuôi chính là tư duy đó — đừng đổ cả thùng rác vào context window, chỉ đưa AI phần "thịt cá" thực sự cần xử lý.

Vấn đề: Khi bạn ném cả quyển sách vào máy

Điển hình của người mới dùng AI: "Anh ơi, đây là file PDF 60 trang hợp đồng, anh tóm tắt giúp em điểm quan trọng" — rồi paste cả 60 trang vào ChatGPT.

Hoặc: "Code này chạy lỗi" — kèm theo 500 dòng code từ dòng import React đến dòng export default, trong khi lỗi chỉ nằm ở một hàm calculateTax ở giữa.

Cái giá phải trả:

  • Lost in the Middle: AI bị "lạc" giữa biển thông tin, bỏ sót đoạn quan trọng vì phải xử lý quá nhiều noise (header, footer, boilerplate)
  • Token burn: Bạn đốt tiền vào những đoạn chữ thừa (lời mở đầu, lời cảm ơn, comment // TODO: fix this later) mà AI không cần đọc
  • Hallucination kích thích: Càng nhiều context không liên quan, AI càng dễ "bịa" ra thông tin để nối liền các đoạn không liên quan

Đó là cách dùng AI "thông thường" — như người ăn cá mà phải nhai cả vây, mang, và xương.

Kế sách: Cắt xén như ninja

Bản chất của Kế 2: Trích xuất chính xác phần input có information density cao nhất, loại bỏ phần "đệm" (padding) ở đầu và đuôi.

Cách áp dụng

Bước 1: Xác định "khúc thân cá"

  • Hợp đồng dài 30 trang → chỉ copy điều khoản số 7.2 có vấn đề
  • Bug trong codebase → chỉ paste hàm bị lỗi + stack trace, bỏ hết import và CSS
  • Cuộc họp 2 giờ → transcript dài 50 trang → chỉ lấy đoạn từ phút 45-60 khi bàn về quyết định then chốt

Bước 2: Viết lời dẫn ngắn gọn Thay vì:

[ paste 10 trang giấy tờ ]

Hãy tóm tắt

Hãy làm:

Dưới đây là điều khoản thanh toán (Điều 5.2) trong hợp đồng dịch vụ:

[ paste 3 đoạn liên quan ]

Yêu cầu: Phân tích rủi ro pháp lý ở điều khoản này.

Prompt mẫu (copy-paste được):

Dưới đây là đoạn code gây lỗi [ERROR: NullPointerException at line 42]:

[paste function lỗi]

Ngữ cảnh cần biết: biến X được khởi tạo ở đâu, có thể null không?

(Không cần giải thích tổng quan về project, chỉ tập trung vào lỗi này)

Bước 3: Tóm tắt thay vì trích dẫn nguyên văn Nếu phải dùng thông tin từ 20 turn chat trước, đừng paste cả đoạn hội thoại. Hãy viết:

"Tóm tắt context trước: Chúng tôi đã thống nhất dùng PostgreSQL thay vì MongoDB vì tính ACID. Giờ cần optimize query JOIN bảng Users và Orders."

That's it. Bỏ đầu (lễ nghi), bỏ đuôi (lời kết thao thao), giữ lại thịt (vấn đề).

Tại sao kế này hiệu quả

1. Attention Budget hữu hạn Transformer không "đọc" như con người — chúng dùng softmax attention. Khi bạn nhét 10K token không liên quan vào đầu và cuối context, chúng chiếm dung lượng attention, làm loãng tín hiệu ở giữa. Giống như nói chuyện trong quán bar ồn ào: bạn phải hét vào tai AI thứ thực sự quan trọng.

2. Signal-to-Noise Ratio AI học từ pattern. Phần "noise" (header, footer, lời đầu giấy tờ) thường có pattern lặp lại, dễ khiến model rơi vào "trance" — sinh ra văn bản boilerplate tương tự thay vì tập trung vào vấn đề cụ thể của bạn.

3. Không gian latent rõ ràng Khi input được "cắt xén" sạch sẽ, vector embedding đại diện cho nó nằm gần trung tâm semantic cluster hơn, giúp AI truy cập kiến thức liên quan chính xác hơn (thay vì lạc vào miền "generic document").

Ứng dụng thực chiến

Nếu bạn là Content Creator

  • Dùng AI gợi ý tiêu đề: Đừng paste cả bài viết 2000 từ. Chỉ đưa 3 đoạn mở bài quan trọng nhất + từ khóa chính.
  • Sửa đoạn văn: Cắt riêng đoạn cần rewrite, không paste cả file Word.

Nếu bạn là Developer

  • Debug: Copy chỉ function liên quan + error log. Bỏ hết import, comment, console.log dư thừa.
  • Code review: Chỉ đưa diff của commit (git diff), không đưa cả file.

Nếu bạn là Nhân viên văn phòng

  • Rà soát hợp đồng: Trích xuất PDF chỉ trang có điều khoản bất thường (dùng pdftotext -f 15 -l 15 để chỉ lấy trang 15).
  • Tóm tắt meeting: Paste chỉ đoạn transcript có tên người quan trọng, bỏ phần "uhm", "ah", "xin lỗi tôi vào muộn".

Bảng so sánh: Cách thường vs Áp dụng kế

Tình huốngCách thường (Sai)Áp dụng Kế 2 (Đúng)
Hỏi về điều khoản NDAPaste cả 30 trang PDFChỉ paste điều khoản 5.2 về Non-compete
Fix bug ReactPaste cả file App.jsx 400 dòngChỉ paste component lỗi + props truyền vào
Viết tiếp câu chuyệnPaste cả chapter 1-5Tóm tắt 3 câu: "Nhân vật A vừa phát hiện B phản bội"

Lưu ý quan trọng: Kế này không phải lúc nào cũng dùng. Nếu bạn cần AI hiểu context rộng (vd: tóm tắt theme cả cuốn tiểu thuyết), hãy dùng Kế 1: Chia để trị. Kế 2 dùng khi bạn đã biết chính xác đâu là "vết thương" và cần "dao mổ" chính xác vào đó.

Đọc thêm

On this page