Kế 34: Tổng tư lệnh vẫn là người — Human approve 10%

Kế 34 Binh pháp AI: Giữ quyền chỉ huy cuối cùng trong tay người. HITL design để AI tự chủ 90%, nhưng 10% quyết định sống còn vẫn cần con người phán xét.

Mở đầu: Tướng ngoài, quân trong

Năm 1285, vua Trần Nhân Tông hỏi Trần Hưng Đạo về cách đánh giặc Nguyên. Hưng Đạo đáp: "Tướng ngoại, quân nội" — tướng chỉ huy bên ngoài, nhưng quyết định chiến lược cuối cùng vẫn thuộc về quân chủ. Các đô thống sứ có quyền điều binh khiển tướng, nhưng khi gặp biến cố động long động trời (crossing the river, burning the ships), họ phải báo về triều đình.

Trong thế giới AI, Kế 34 này nghĩa là: AI là đô thống sứ, con người là vua. Bạn delegate 90% công việc cho AI — nhưng giữ chặt 10% quyết định mang tính chiến lược, không thể đảo ngược, hoặc đòi hỏi trách nhiệm đạo đức. Đây là nguyên tắc Human-in-the-Loop (HITL) — không phải để con người "giám sát" từng dòng code AI viết, mà để con người là tổng tư lệnh dự bị (commander-in-reserve) cho những phút sinh tử.

Vấn đề: Hai cực đoan nguy hiểm

Cực đoan 1: Tự chủ tuyệt đối (Full Auto-Pilot)
Startup fintech ở Singapore từng để AI tự động phê duyệt khoản vay. Thuật toán chạy 6 tháng, tốc độ tăng 400% — cho đến khi nó phê duyệt một khoản vay cho công ty ma với hồ sơ photoshop lộ liễu. Tổn thất: 2 triệu USD. AI không "biết" nó đang bị lừa — nó chỉ thấy pattern khớp 94% với hồ sơ tốt.

Cực đoan 2: Vi mô quản lý (Micro-Management)
Ngược lại, một số doanh nghiệp bắt nhân viên "review từng dòng" AI viết ra. Kết quả? Họ mất nhiều thời gian hơn cả việc tự viết. AI trở thành gánh nặng thay vì lực nhân.

Điểm tối ưu nằm ở đâu?
Ở ranh giới 10%: AI xử lý 90% volume, nhưng 10% biến cố (edge cases) và quyết định chiến lược (strategic decisions) phải chạm vào con người.

Kế sách: Human-in-the-Loop Design

Nguyên tắc "Residual Handler"

Hãy tưởng tượng AI là một thuật toán nén (compression algorithm). Nó nén toàn bộ "trung bình cộng" của thực tế vào weights — nhưng trong quá trình nén, nó vứt bỏ phần đuôi dài (long tail): những tình huống hiếm, lạ, mang tính đạo đức, hoặc Black Swan mà dữ liệu huấn luyện không có.

HITL không phải là lưới an toàn (safety net) — nó là van giải nén (uncompression valve). Con người xử lý phần residual — phần còn sót lại sau khi AI đã xử lý xong 90% case thông thường.

Cách triển khai:

1. Approval Gates (Cửa ải phê duyệt)
Đặt "cửa ải" tại những điểm không thể đảo ngược:

Deploy code production? Cần human approve.
Gửi email cho 10.000 khách hàng? Cần human approve.
Chẩn đoán bệnh ung thư? Cần bác sĩ xác nhận.

2. Active Learning Loop
Khi AI gặp uncertainty cao (entropy spike), nó không đoán — nó hỏi ý kiến người (query human). Mỗi lần người can thiệp tạo ra một data point có nhãn: "Đây là chỗ AI sai." Dần dần, boundary của "10% cần người" sẽ thu hẹp, nhưng không bao giờ biến mất hoàn toàn.

3. Fog-of-War Detection
Chuyển quyền điều khiển khi có "sương mù chiến trường" — tình huống môi trường thay đổi quá nhanh (regime shift), training data không còn áp dụng được. Ví dụ: thị trường tài chính 2008, đại dịch 2020, hoặc một lỗi bảo mật zero-day chưa từng thấy.

That's it. Không phải để người ngồi xem AI làm việc (monitoring), mà để người nắm quyền phủ quyết (veto power) trên những quyết định có hệ quả nghiêm trọng.

Tại sao kế này hiệu quả?

Bất đối xứng thông tin và trách nhiệm
AI là "centroid optimizer" — nó tìm câu trả lời trung bình, an toàn nhất trong training distribution. Con người là "edge case survivor" — giỏi chính xác ở những nơi dữ liệu thưa thớt, nơi "đúng" là phá vỡ pattern lịch sử.

Tacit Knowledge (Tri thức ngầm)
Polanyi từng nói: "Chúng ta biết nhiều hơn những gì chúng ta có thể nói ra". AI không có "sẹo chiến trường" — nó không biết tại sao năm 2019 công ty lại làm một điều chỉnh Non-GAAP đặc biệt do một cuộc đàm phán với SEC. Chỉ có CFO đương nhiệm mới biết điều đó qua trải nghiệm sống.

The Loop as Distillation
Mỗi lần người can thiệp tạo ra một "nhãn dữ liệu" hiếm. Qua thời gian, AI học được những edge case cũ, và ranh giới 10% dịch chuyển ra xa. Đây là mở rộng vùng nén (compression zone) — giống như đế chế mở rộng biên cương, nhưng biên giới luôn cần người canh giữ.

Ứng dụng thực chiến

Tình huống	AI tự chủ (90%)	Human approve (10%)
Code	Viết function, refactor, unit test	Merge vào main branch, deploy production
Content	Viết draft blog, tóm tắt meeting	Publish bài PR khủng hoảng, phát ngôn báo chí
Tài chính	Giao dịch `<$` `10,000`, báo cáo hàng ngày	Giao dịch `>$` `1M`, điều chỉnh sổ sách quý
Y tế	Sàng lọc X-ray bình thường	Chẩn đoán ung thư, phẫu thuật
Tuyển dụng	Sàng lọc CV theo keyword	Quyết định offer vị trí C-level

Nếu bạn là Developer: Dùng AI viết 90% code, nhưng giữ quyền "bấm nút" merge. Cài guardrail: AI không thể tự sửa code ở nhánh production mà không có pull request.

Nếu bạn là Content Manager: AI viết 30 bài SEO mỗi ngày, nhưng bạn duyệt lại 3 bài "nhạy cảm" trước khi đăng.

Nếu bạn là Nhà đầu tư: AI theo dõi danh mục 24/7, nhưng khi biến động > 5% trong 1 phút — hệ thống dừng lại chờ bạn quyết định có bán tháo hay không.

Kế 34: Tổng tư lệnh vẫn là người — Human approve 10%

Mở đầu: Tướng ngoài, quân trong

Vấn đề: Hai cực đoan nguy hiểm

Kế sách: Human-in-the-Loop Design

Nguyên tắc "Residual Handler"

Tại sao kế này hiệu quả?

Ứng dụng thực chiến

Đọc thêm

Kế 33: Vây hãm tự động

Kế 35: Binh pháp toàn cục

Kế 36: Đào hào kiến thức

On this page