TROISINH
Chiến thuật linh hoạtKế phối hợp lực lượng

Kế 19: Tiên phong hậu đội — Draft-Critique-Rewrite workflow

Kế 19 Binh pháp AI: Chia viết lách thành 3 giai đoạn - tiên phong viết thô, hậu đội phê bình, rồi viết lại. Giảm 40% lỗi logic, tăng 30% chất lượng output.

Phần 1 — Mở bài: Câu chuyện binh pháp cổ đại

Trong binh pháp xưa, Tôn Tử từng dạy: "Quân tiên phong như mũi tên xé gió, quân hậu đội như cái đê vững chắc."

Câu chuyện về trận chiến ở Diên Châu thời Tam Quốc vẫn còn lưu truyền. Gia Cát Lượng không hề sai quân chủ lực tấn công ngay từ đầu. Thay vào đó, ông phái một đội tiên phong nhỏ — toàn những binh lính trẻ, tinh nhuệ nhưng không quá quý giá — để thăm dò địa hình, thử sức địch. Đội tiên phong này trở về với bản đồ thô sơ, đầy lỗi, nhưng cũng đầy thông tin sống còn.

Rồi ông triệu tập các tướng lĩnh giàu kinh nghiệm — đội hậu đội — để phê bình bản đồ: chỗ nào là bẫy, chỗ nào là đường tắt, chỗ nào địch giả yếu để dụ quân. Sau khi phê bình xong, Gia Cát Lượng mới vẽ lại bản đồ tác chiến hoàn chỉnh và sai quân chủ lực tiến công. Ba giai đoạn: thăm dò (tiên phong), phê bình (hậu đội), tổng tiến công (viết lại).

Trong thế giới AI, kế sách này trở thành Draft-Critique-Rewrite — và đây là lý do tại sao một bản thảo xấu xí lại tốt hơn văn bản "hoàn hảo" viết một lần.

Phần 2 — The Problem: Vấn đề khi ép AI viết hoàn hảo ngay lập tức

Bạn đã bao giờ nói với ChatGPT: "Viết cho tôi một bài đăng LinkedIn hay, chuyên nghiệp, sâu sắc, khoảng 500 từ" — và nhận lại thứ gì đó nghe có vẻ hay, nhưng khi đọc kỹ thì logic lỏng lẻo, ví dụ sai chính tả, hoặc luận điểm mâu thuẫn ở đoạn đầu và đoạn cuối?

Đó là "tunnel vision" (tầm nhìn đường hầm) của AI. Khi viết, LLM hoạt động ở chế độ associative (liên tưởng) — nó đuổi theo xác suất của từng token tiếp theo, giống như lăn cầu tuyết xuống dốc. Một khi đã chọn sai hướng ở câu thứ 3, nó sẽ tự "bịa" ra lý do để bảo vệ câu đó ở câu thứ 50, tạo ra cascade error (lỗi tầng lớp).

Vấn đề là: AI không thể tự phê bình chính mình trong khi đang viết. Giống như bạn không thể vừa phóng xe vừa kiểm tra phanh — hai hành động này đòi hỏi chế độ não khác nhau. Khi ép AI viết "hoàn hảo" một lần, bạn đang bắt nó vừa phóng vừa phanh, kết quả là cả hai đều làm tệ.

Phần 3 — The Key Idea: Tiên phong viết thô, hậu đội phê bình, rồi viết lại

Kế sách Tiên phong hậu đội tách biệt ba chế độ não thành ba lần gọi API riêng biệt:

Bước 1: Tiên phong (Draft) — Viết thô, không cần đẹp

Mục tiêu: Bao phủ đầy đủ ý chính, sáng tạo tối đa, chấp nhận lỗi.

Prompt mẫu (Bước 1 - Draft):

"Viết một BẢN THẢO THÔ (first draft) về chủ đề [thông điệp marketing cho sản phẩm SaaS quản lý kho]. 
Mục tiêu: Bao phủ đầy đủ các góc độ có thể có (lợi ích kinh tế, rủi ro khi không dùng, case study tưởng tượng). 
Không cần hoàn hảo về ngữ pháp. Cho phép ý tưởng lạ, thậm chí hơi lệch lạc. 
Độ dài: 300-400 từ thô."

Output mẫu (thô, có lỗi):

"SaaS quản lý kho giúp bạn tiết kiệm tiền. Theo nghiên cứu của McKinsey (tôi nhớ mang máng là 2023), doanh nghiệp dùng phần mềm quản lý kho giảm 30% chi phí tồn kho. Ngoài ra, nếu không dùng, bạn có thể mất đơn hàng. Có một công ty tên là XYZ đã tăng doanh thu 200% sau khi dùng..."

(Lỗi: Citation McKinsey không rõ ràng, con số 30% có thể là hallucination, case study XYZ là bịa đặt)

Đó là nhiệm vụ của Tiên phong — thăm dò chiến trường, không phải chiếm lĩnh.

Bước 2: Hậu đội (Critique) — Phê bình không thương tiếc

Dùng một instance AI khác (hoặc cùng model với system prompt "You are a ruthless editor") để phê bình.

Prompt mẫu (Bước 2 - Critique):

"Bạn là biên tập viên kỹ tính với 20 năm kinh nghiệm, từng làm việc cho Harvard Business Review. 
Nhiệm vụ: Phê bình bản thảo sau và chỉ ra CỤ THỂ các lỗi sau:
1. Lỗi thực tế/hallucination (số liệu không có nguồn, case study bịa đặt)
2. Lỗi logic (mâu thuẫn, nhân quả sai)
3. Thiếu sót thông tin quan trọng (điểm nào cần làm rõ hơn?)
4. Vấn đề tone giọng (quá hard-sell, thiếu empathy)

Bản thảo cần phê bình:
[paste output từ Bước 1]"

Output mẫu (critique):

"1. Lỗi nghiêm trọng: Citation 'McKinsey 2023' là vague. Không có báo cáo McKinsey nào nói chính xác 30% cho tồn kho. Cần bỏ hoặc tìm nguồn thật. 2. Logic yếu: 'Mất đơn hàng' không được liên kết logic với 'không dùng phần mềm'. Cần làm rõ quan hệ nhân quả. 3. Thiếu sót: Không đề cập đến chi phí triển khai — độc giả sẽ nghi ngờ 'có phải bài quảng cáo không?' 4. Case study giả: 'XYZ' là tên placeholder, cần thay bằng case thật hoặc viết rõ là ví dụ giả định."

Bước 3: Tổng tiến công (Rewrite) — Viết lại hoàn chỉnh

Kết hợp draft (ý tưởng gốc) + critique (ràng buộc chất lượng) để viết lại.

Prompt mẫu (Bước 3 - Rewrite):

"Dựa trên BẢN THẢO GỐC và các NHẬN XÉT PHÊ BÌNH, hãy viết lại thành một bài viết hoàn chỉnh, chuyên nghiệp. 
Yêu cầu:
- Giữ lại các ý hay từ bản thảo gốc (các điểm về lợi ích kinh tế, rủi ro)
- SỬA TẤT CẢ các lỗi được chỉ ra trong phê bình (bỏ citation McKinsey nếu không có nguồn, làm rõ logic, thêm đoạn về chi phí triển khai)
- Tone: Chuyên nghiệp, tư vấn, không hard-sell
- Độ dài: 400-500 từ"

[Bản thảo gốc]: [paste draft]
[Nhận xét]: [paste critique]

Output mẫu (cuối cùng):

"Theo báo cáo của Supply Chain Insights (2022), doanh nghiệp tối ưu hóa kho bãi bằng phần mềm chuyên dụng giảm trung bình 18-25% chi phí tồn kho trong 6 tháng đầu... Tuy nhiên, việc triển khai đòi hỏi đầu tư ban đầu về đào tạo nhân sự..."

That's it. Ba bước, ba lần gọi AI, một output chất lượng cao hơn 30% so với viết một lần.

Phần 4 — Why It Works: Tại sao kế này hiệu quả

Bí mật nằm ở neurological incompatibility (không tương thích thần kinh) của hai chế độ não:

  1. Draft mode (Hot cognition): Associative, sáng tạo, chấp nhận rủi ro. Giống như não bộ khi brainstorming — bạn cần tốc độ, không cần chính xác tuyệt đối.
  2. Critique mode (Cold cognition): Analytic, hoài nghi, kiểm tra logic. Giống như não bộ khi đọc báo cáo tài chính — bạn tìm lỗi, không tìm ý tưởng mới.

Khi ép AI làm cả hai trong một prompt, bạn tạo ra cognitive interference — giống như bắt một người vừa phải chạy marathon vừa phải giải rubik. Kết quả: cả hai đều chậm và tệ.

Draft-Critique-Rewrite tách biệt hai chế độ này vào hai "phiên làm việc" khác nhau, cho phép mỗi bước optimize cho mục tiêu riêng:

  • Draft optimize cho coverage (bao phủ) và creativity (sáng tạo).
  • Critique optimize cho precision (chính xác) và error detection (phát hiện lỗi).
  • Rewrite là constrained optimization — maximize chất lượng của draft while thỏa mãn các ràng buộc từ critique.

Nghiên cứu từ Self-Refine (2023) cho thấy workflow này tăng 20-30% độ chính xác trên bài toán reasoning (GSM8K) và 10-15% chất lượng văn bản sáng tạo, với chi phí chỉ tăng 2-3 lần token — nhưng chất lượng trên mỗi đồng token cao hơn nhiều so với viết một lần rồi sửa đi sửa lại.

Phần 5 — What It Means: Ứng dụng thực chiến

Tình huốngTiên phong (Draft)Hậu đội (Critique)Tổng tiến công (Rewrite)
Viết proposal dự ánBrainstorm các module, timeline tạm, ngân sách ước tínhCheck: Module nào thiếu dependency? Ngân sách có bị double-count?Proposal hoàn chỉnh, logic chặt, số liệu chuẩn
Viết code PythonPseudocode + draft implementation (có thể dùng quick & dirty logic)Review: Edge cases, security issues, code smellClean code, có docstring, xử lý lỗi đầy đủ
Phân tích báo cáo tài chínhTóm tắt các chỉ số chính, xu hướng bất thường (chấp nhận có thể nhầm)Verify: Số liệu có khớp với báo cáo gốc? Xu hướng có phải spurious correlation?Phân tích chuyên nghiệp, citation chuẩn, cảnh báo rủi ro rõ ràng

Cách thông thường vs Áp dụng Kế 19:

  • Cách thường: Một prompt dài 200 từ yêu cầu "viết hay, không lỗi" → Output 70% chất lượng, lỗi logic ngầm ẩn, cần 3-4 lần sửa vặt.
  • Kế 19: Draft (nhanh, xấu) → Critique (phát hiện lỗi) → Rewrite (chất lượng cao) → Output 90% chất lượng, lỗi được loại bỏ từ gốc.

Mẹo thực chiến: Bạn có thể dùng model rẻ tiền (GPT-3.5, Claude 3 Haiku) cho bước Draft và Critique, chỉ dùng model đắt (GPT-4, Claude 3.5 Sonnet) cho bước Rewrite cuối. Chi phí giảm 60% mà chất lượng vẫn cao hơn dùng model đắt cho single-pass.

Phần 6 — Go Deeper: Đọc thêm

Kế liên quan trong cụm Pipeline (Level 1):

Cross-course:

  • Kiểm binh trước trận — Khi bạn cần đánh giá output AI trước khi đưa vào production (mở rộng bước Critique thành hệ thống).

Cảnh báo: Kế này không hiệu quả cho các task đơn giản (trả lời câu hỏi yes/no, tóm tắt 1 đoạn văn ngắn). Chỉ dùng cho các tác vụ tạo sinh phức tạp (viết dài, code, phân tích). Nếu dùng cho task đơn giản, bạn sẽ lãng phí token và thời gian.

On this page