Kế 35: Binh pháp toàn cục — Thiết kế AI workflow
Kế 35 Binh pháp AI: Thiết kế workflow agentic để AI tự điều phối, không chỉ thực thi. Chiến lược tổng thể cho doanh nghiệp.
Khi Tôn Tử viết "Binh pháp", ông không chỉ dạy cách đánh một trận, mà dạy cách thiết kế cả một cuộc chiến — từ hậu cần, tình báo, đến phối hợp các cánh quân. Nhiều người dùng AI hiện nay mắc sai lầm "thắng trận, thua chiến": họ tối ưu từng prompt đơn lẻ, nhưng để AI chạy rời rạc như đội quân không chỉ huy.
Binh pháp toàn cục là kỹ thuật thiết kế workflow — không chỉ là nối API với nhau, mà là kiến trúc ra quyết định: AI xử lý phần nào, người giữ phần nào, dữ liệu chảy thế nào, và khi nào hệ thống phải tự điều chỉnh để tồn tại trước biến động.
Workflow là gì? Khác biệt giữa chuỗi công cụ và hệ thống chiến lược
Nhiều team nhầm tưởng workflow là "Prompt 1 → Tool A → Prompt 2". Đó chỉ là chuỗi công cụ. Một workflow chiến lược phải trả lời được ba câu hỏi:
- Cơ chế phân quyền: Khi nào AI tự quyết, khi nào phải xin phép người? (xem Kế 34: Tổng tư lệnh vẫn là người)
- Chuỗi cung ứng tri thức: Dữ liệu chuyên sâu từ đâu đổ vào AI? (xem Kế 36: Đào hào kiến thức)
- Vòng phản hồi: Làm sao để AI càng dùng càng thông minh hơn, thay vì lặp lại sai lầm? (xem Kế 33: Vây hãm tự động)
Workflow tốt là một hệ sinh thái chứ không phải đường ống dẫn nước.
Từ RPA cứng nhắc đến Agentic linh hoạt
Truyền thống tự động hóa (RPA) như đường ray xe lửa: nhanh, nhưng chỉ chạy được khi mọi thứ đúng kịch bản. Một email không đúng format, hệ thống sập.
AI workflow hiện đại là GPS có tư duy: nó nhận diện ý định (intent) thay vì từ khóa, phân tích ngữ cảnh (sentiment, độ khẩn cấp), rồi tự chọn lộ trình — khi gặp "tắc đường" (dữ liệu thiếu, yêu cầu mơ hồ), nó không dừng máy mà tự tìm lối vòng.
Cơ chế này gọi là agentic orchestration: một "tướng chỉ huy" (orchestrator) quan sát tình huống, rồi điều động các "quân chủng" chuyên môn (multi-agent) chứ không phải một AI đa năng làm tất. Khi phát hiện tác vụ liên quan đến bảo mật, orchestrator chuyển cho agent chuyên về compliance; khi là sáng tạo nội dung, nó giao cho agent viết lách với temperature cao.
Phân quyền: Người tổng tư lệnh, AI làm tướng
Lý thuyết "Người trong vòng lặp" (Human-in-the-Loop) không có nghĩa là người phải ngồi bấm nút mỗi 5 giây. Đó là kiến trúc ủy quyền thông minh:
- Giao cách làm (delegate method): Với tác vụ lặp lại, dễ đánh giá (tóm tắt báo cáo, format dữ liệu), AI được quyền tự chạy từ đầu đến cuối.
- Giao kết quả (delegate outcome): Với tác vụ mang tính chiến lược (phê duyệt hợp đồng, quyết định tuyển dụng), AI chỉ được quyền chuẩn bị dữ liệu, quyết định cuối cùng thuộc về người.
Bẫy nguy hiểm nhất là "ảo giác vận tốc": AI chạy nhanh nhưng sai lệch mục tiêu. Ví dụ: agent tự động sửa code để "biên dịch được" (compile) nhưng phá vỡ logic giao dịch ngân hàng — nhanh mà nguy hiểm. Workflow tốt phải có "cửa khẩu" (gate) để phát hiện khi AI đang tối ưu cho chỉ số sai (misaligned incentives).
Kiến trúc chống chịu và thích nghi
Hệ thống AI không nên chỉ "chống đỡ" (robust) khi gặp lỗi, mà phải càng đánh càng mạnh (anti-fragile). Khi một agent trả lời sai, workflow không chỉ sửa lỗi đó, mà phải ghi nhận vào bộ nhớ dài hạn (episodic memory), rồi tự động điều chỉnh prompt hoặc chuyển sang model mạnh hơn cho lần sau.
Cơ chế này kết hợp:
- Lui binh giữ thế (graceful degradation): Khi model yếu hoặc context quá dài, tự động thu nhỏ phạm vi (scope reduction) thay vì ép AI trả lời.
- Tam cố thảo lư (verify-then-trust): Chạy song song 3 phiên bản prompt khác nhau, chọn đáp án nhất quán để tránh "ảo tưởng năng lực" từ một agent đơn lẻ.
Tính toán lương thảo: Chi phí và giá trị
Workflow cần lớp điều phối kinh tế (cost routing): không phải lúc nào cũng gọi GPT-4 đắt tiền. Một hệ thống thông minh sẽ thử Gemini Flash (rẻ) trước, chỉ nâng cấp lên Claude Opus (đắt) khi câu trả lời bị nghi ngờ về độ phức tạp.
Đây là mô hình thác nước chi phí (model cascading): mỗi tầng lọc 80% yêu cầu đơn giản, chỉ đẩy 20% khó xuống tầng đắt hơn. Tính toán đơn giản: nếu chi phí sai lầm (failure cost) nhỏ hơn chi phí API tiết kiệm được, hãy để AI làm; nếu sai lầm gây thiệt hại lớn (hợp đồng pháp lý, y tế), hãy trả giá cho sự chính xác.
Ví dụ thực chiến
Onboarding nhân viên: Từ 3 ngày xuống 5 phút
Một workflow tối ưu cho tuyển dụng không chỉ là "gửi mail tự động". Nó là một mạng lưới agent:
- Agent đọc CV (Retrieval): Trích xuất kỹ năng từ 100+ hồ sơ, so sánh với JD bằng embedding search.
- Agent phỏng vấn sơ bộ (Screening): Chat với ứng viên, đánh giá trình độ tiếng Anh và kỹ thuật qua vài câu hỏi ngắn.
- Agent chuẩn bị tài liệu (Preparation): Tự động tạo hợp đồng, tài khoản công ty, và lịch học dựa trên vị trí tuyển.
- Tổng tư lệnh duyệt (Human gate): HR chỉ việc bấm "Approve" sau khi xem tóm tắt 3 dòng do AI chuẩn bị.
Kết quả: thời gian chờ giảm từ ngày xuống phút, nhưng chất lượng không giảm vì con người vẫn nắm quyết định cuối.
Hệ thống chăm sóc khách hàng với "thang trời"
Workflow CSKH thông minh không phải chatbot trả lời tự động 100%, mà là hệ thống leo thang:
- Tầng 1: AI trả lời FAQ (temperature thấp, RAG từ knowledge base nội bộ).
- Tầng 2: Khi phát hiện sentiment tiêu cực hoặc yêu cầu hoàn tiền, trigger chuyển cho agent "hòa giải" với prompt chuyên sâu về tâm lý khách hàng.
- Tầng 3: Nếu agent hòa giải thất bại 2 lần, tự động chuyển ticket cho người với toàn bộ context cuộc trò chuyện đã được tóm tắt.
Workflow này kết hợp Kế 34 (biết lúc rút quân) và Kế 33 (tự cải thiện qua feedback).
Pipeline nghiên cứu pháp lý 200 trang
Luật sư phân tích hợp đồng dài:
- Reconnaissance: Agent đầu tiên chỉ đọc mục lục, tạo "bản đồ pháo đài" (cấu trúc tài liệu).
- Vây hãm chia đoạn: Chia 200 trang thành 10 cụm, mỗi agent chuyên môn (một agent chuyên điều khoản bảo mật, một agent chuyên phạt vi phạm...) xử lý song song.
- Hội đồng phê bình: Một agent "chủ tọa" tổng hợp kết quả từ 10 agent, phát hiện mâu thuẫn giữa các điều khoản.
- Con người phán quyết: Luật sư xem báo cáo cuối, chỉnh sửa lập trường đàm phán.
Ứng dụng theo đối tượng
Startup: Tốc độ là sinh mệnh
- Chiến lược: Mua (Buy) 90% chức năng chuẩn (auth, payment), tự build 10% là "lõi" khác biệt.
- Workflow: Chạy multi-agent song song để rút ngắn thời gian MVP, chấp nhận chi phí API cao hơn một chút để đổi lấy velocity.
Doanh nghiệp vừa: Hiệu suất và kiểm soát
- Chiến lược: Hybrid — workflow cho phép AI tự xử lý 80% tác vụ lặp (báo cáo, nhập liệu), giữ 20% quyết định chiến lược cho ban lãnh đạo.
- Workflow: Triển khai RAG nội bộ (Kế 36) để AI không bị "đói thông tin" khi xử lý tài liệu chuyên ngành.
Tập đoàn: Tuân thủ và quy mô
- Chiến lược: Human-in-the-loop nghiêm ngặt, audit trail đầy đủ.
- Workflow: Mỗi output AI phải qua "vòng kiểm chứng" — agent thứ hai kiểm tra agent thứ nhất (Kế kiểm gián), rồi mới đến người phê duyệt.
So sánh: RPA truyền thống vs Agentic AI Workflow
| Tiêu chí | RPA (Truyền thống) | Agentic AI Workflow (Kế 35) |
|---|---|---|
| Tư duy | Tuân thủ kịch bản cứng | Tự điều phối theo ngữ cảnh |
| Xử lý ngoại lệ | Dừng máy, cần người can thiệp | Tự giảm scope hoặc chuyển agent khác |
| Cải tiến | Cố định cho đến khi lập trình viên sửa | Tự học từ feedback, anti-fragile |
| Chi phí triển khai | Cao (tích hợp hệ thống cũ) | Thấp hơn (dùng API, ít code) |
| Rủi ro | Lỗi lặp lại đều đặn | Lỗi "sáng tạo" nếu không có guardrail |
Kết luận: RPA là "đường ray", Agentic Workflow là "hệ thống giao thông thông minh". RPA phù hợp khi quy trình 100% rõ ràng và không đổi; Agentic Workflow cần thiết khi dữ liệu có cấu trúc mơ hồ, yêu cầu thay đổi liên tục, và cần sự linh hoạt của con người xen kẽ.
Bài viết liên quan
Cùng cụm "Chiến lược tối thượng"
Kế 33: Vây hãm tự động
Feedback loop agent tự kiểm, tự sửa, tự cải thiện — nền tảng cho workflow linh hoạt
Kế 34: Tổng tư lệnh vẫn là người
Human approve 10% quyết định quan trọng, AI xử lý 90% còn lại — phân quyền chiến lược
Kế 36: Đào hào kiến thức
Xây knowledge base riêng mà đối thủ không có — vũ khí độc quyền trong workflow
Đọc tiếp
- Kế 1: Chia để trị — Quay về khởi đầu của vòng 36 kế, nơi mọi workflow phức tạp đều bắt đầu từ việc chia nhỏ vấn đề.
Kế 34: Tổng tư lệnh vẫn là người — Human approve 10%
Kế 34 Binh pháp AI: Giữ quyền chỉ huy cuối cùng trong tay người. HITL design để AI tự chủ 90%, nhưng 10% quyết định sống còn vẫn cần con người phán xét.
Kế 36: Đào hào kiến thức — Xây knowledge base riêng
Kế 36 Binh pháp AI: Xây dựng knowledge base nội bộ để AI truy cập kiến thức độc quyền, tạo lợi thế cạnh tranh bền vững mà đối thủ không thể copy.