Kế 35: Binh pháp toàn cục — Thiết kế AI workflow

Kế 35 Binh pháp AI: Thiết kế workflow agentic để AI tự điều phối, không chỉ thực thi. Chiến lược tổng thể cho doanh nghiệp.

Khi Tôn Tử viết "Binh pháp", ông không chỉ dạy cách đánh một trận, mà dạy cách thiết kế cả một cuộc chiến — từ hậu cần, tình báo, đến phối hợp các cánh quân. Nhiều người dùng AI hiện nay mắc sai lầm "thắng trận, thua chiến": họ tối ưu từng prompt đơn lẻ, nhưng để AI chạy rời rạc như đội quân không chỉ huy.

Binh pháp toàn cục là kỹ thuật thiết kế workflow — không chỉ là nối API với nhau, mà là kiến trúc ra quyết định: AI xử lý phần nào, người giữ phần nào, dữ liệu chảy thế nào, và khi nào hệ thống phải tự điều chỉnh để tồn tại trước biến động.

Workflow là gì? Khác biệt giữa chuỗi công cụ và hệ thống chiến lược

Nhiều team nhầm tưởng workflow là "Prompt 1 → Tool A → Prompt 2". Đó chỉ là chuỗi công cụ. Một workflow chiến lược phải trả lời được ba câu hỏi:

Cơ chế phân quyền: Khi nào AI tự quyết, khi nào phải xin phép người? (xem Kế 34: Tổng tư lệnh vẫn là người)
Chuỗi cung ứng tri thức: Dữ liệu chuyên sâu từ đâu đổ vào AI? (xem Kế 36: Đào hào kiến thức)
Vòng phản hồi: Làm sao để AI càng dùng càng thông minh hơn, thay vì lặp lại sai lầm? (xem Kế 33: Vây hãm tự động)

Workflow tốt là một hệ sinh thái chứ không phải đường ống dẫn nước.

Từ RPA cứng nhắc đến Agentic linh hoạt

Truyền thống tự động hóa (RPA) như đường ray xe lửa: nhanh, nhưng chỉ chạy được khi mọi thứ đúng kịch bản. Một email không đúng format, hệ thống sập.

AI workflow hiện đại là GPS có tư duy: nó nhận diện ý định (intent) thay vì từ khóa, phân tích ngữ cảnh (sentiment, độ khẩn cấp), rồi tự chọn lộ trình — khi gặp "tắc đường" (dữ liệu thiếu, yêu cầu mơ hồ), nó không dừng máy mà tự tìm lối vòng.

Cơ chế này gọi là agentic orchestration: một "tướng chỉ huy" (orchestrator) quan sát tình huống, rồi điều động các "quân chủng" chuyên môn (multi-agent) chứ không phải một AI đa năng làm tất. Khi phát hiện tác vụ liên quan đến bảo mật, orchestrator chuyển cho agent chuyên về compliance; khi là sáng tạo nội dung, nó giao cho agent viết lách với temperature cao.

Phân quyền: Người tổng tư lệnh, AI làm tướng

Lý thuyết "Người trong vòng lặp" (Human-in-the-Loop) không có nghĩa là người phải ngồi bấm nút mỗi 5 giây. Đó là kiến trúc ủy quyền thông minh:

Giao cách làm (delegate method): Với tác vụ lặp lại, dễ đánh giá (tóm tắt báo cáo, format dữ liệu), AI được quyền tự chạy từ đầu đến cuối.
Giao kết quả (delegate outcome): Với tác vụ mang tính chiến lược (phê duyệt hợp đồng, quyết định tuyển dụng), AI chỉ được quyền chuẩn bị dữ liệu, quyết định cuối cùng thuộc về người.

Bẫy nguy hiểm nhất là "ảo giác vận tốc": AI chạy nhanh nhưng sai lệch mục tiêu. Ví dụ: agent tự động sửa code để "biên dịch được" (compile) nhưng phá vỡ logic giao dịch ngân hàng — nhanh mà nguy hiểm. Workflow tốt phải có "cửa khẩu" (gate) để phát hiện khi AI đang tối ưu cho chỉ số sai (misaligned incentives).

Kiến trúc chống chịu và thích nghi

Hệ thống AI không nên chỉ "chống đỡ" (robust) khi gặp lỗi, mà phải càng đánh càng mạnh (anti-fragile). Khi một agent trả lời sai, workflow không chỉ sửa lỗi đó, mà phải ghi nhận vào bộ nhớ dài hạn (episodic memory), rồi tự động điều chỉnh prompt hoặc chuyển sang model mạnh hơn cho lần sau.

Cơ chế này kết hợp:

Lui binh giữ thế (graceful degradation): Khi model yếu hoặc context quá dài, tự động thu nhỏ phạm vi (scope reduction) thay vì ép AI trả lời.
Tam cố thảo lư (verify-then-trust): Chạy song song 3 phiên bản prompt khác nhau, chọn đáp án nhất quán để tránh "ảo tưởng năng lực" từ một agent đơn lẻ.

Tính toán lương thảo: Chi phí và giá trị

Workflow cần lớp điều phối kinh tế (cost routing): không phải lúc nào cũng gọi GPT-4 đắt tiền. Một hệ thống thông minh sẽ thử Gemini Flash (rẻ) trước, chỉ nâng cấp lên Claude Opus (đắt) khi câu trả lời bị nghi ngờ về độ phức tạp.

Đây là mô hình thác nước chi phí (model cascading): mỗi tầng lọc 80% yêu cầu đơn giản, chỉ đẩy 20% khó xuống tầng đắt hơn. Tính toán đơn giản: nếu chi phí sai lầm (failure cost) nhỏ hơn chi phí API tiết kiệm được, hãy để AI làm; nếu sai lầm gây thiệt hại lớn (hợp đồng pháp lý, y tế), hãy trả giá cho sự chính xác.

Ví dụ thực chiến

Onboarding nhân viên: Từ 3 ngày xuống 5 phút

Một workflow tối ưu cho tuyển dụng không chỉ là "gửi mail tự động". Nó là một mạng lưới agent:

Agent đọc CV (Retrieval): Trích xuất kỹ năng từ 100+ hồ sơ, so sánh với JD bằng embedding search.
Agent phỏng vấn sơ bộ (Screening): Chat với ứng viên, đánh giá trình độ tiếng Anh và kỹ thuật qua vài câu hỏi ngắn.
Agent chuẩn bị tài liệu (Preparation): Tự động tạo hợp đồng, tài khoản công ty, và lịch học dựa trên vị trí tuyển.
Tổng tư lệnh duyệt (Human gate): HR chỉ việc bấm "Approve" sau khi xem tóm tắt 3 dòng do AI chuẩn bị.

Kết quả: thời gian chờ giảm từ ngày xuống phút, nhưng chất lượng không giảm vì con người vẫn nắm quyết định cuối.

Hệ thống chăm sóc khách hàng với "thang trời"

Workflow CSKH thông minh không phải chatbot trả lời tự động 100%, mà là hệ thống leo thang:

Tầng 1: AI trả lời FAQ (temperature thấp, RAG từ knowledge base nội bộ).
Tầng 2: Khi phát hiện sentiment tiêu cực hoặc yêu cầu hoàn tiền, trigger chuyển cho agent "hòa giải" với prompt chuyên sâu về tâm lý khách hàng.
Tầng 3: Nếu agent hòa giải thất bại 2 lần, tự động chuyển ticket cho người với toàn bộ context cuộc trò chuyện đã được tóm tắt.

Workflow này kết hợp Kế 34 (biết lúc rút quân) và Kế 33 (tự cải thiện qua feedback).

Pipeline nghiên cứu pháp lý 200 trang

Luật sư phân tích hợp đồng dài:

Reconnaissance: Agent đầu tiên chỉ đọc mục lục, tạo "bản đồ pháo đài" (cấu trúc tài liệu).
Vây hãm chia đoạn: Chia 200 trang thành 10 cụm, mỗi agent chuyên môn (một agent chuyên điều khoản bảo mật, một agent chuyên phạt vi phạm...) xử lý song song.
Hội đồng phê bình: Một agent "chủ tọa" tổng hợp kết quả từ 10 agent, phát hiện mâu thuẫn giữa các điều khoản.
Con người phán quyết: Luật sư xem báo cáo cuối, chỉnh sửa lập trường đàm phán.

Ứng dụng theo đối tượng

Startup: Tốc độ là sinh mệnh

Chiến lược: Mua (Buy) 90% chức năng chuẩn (auth, payment), tự build 10% là "lõi" khác biệt.
Workflow: Chạy multi-agent song song để rút ngắn thời gian MVP, chấp nhận chi phí API cao hơn một chút để đổi lấy velocity.

Doanh nghiệp vừa: Hiệu suất và kiểm soát

Chiến lược: Hybrid — workflow cho phép AI tự xử lý 80% tác vụ lặp (báo cáo, nhập liệu), giữ 20% quyết định chiến lược cho ban lãnh đạo.
Workflow: Triển khai RAG nội bộ (Kế 36) để AI không bị "đói thông tin" khi xử lý tài liệu chuyên ngành.

Tập đoàn: Tuân thủ và quy mô

Chiến lược: Human-in-the-loop nghiêm ngặt, audit trail đầy đủ.
Workflow: Mỗi output AI phải qua "vòng kiểm chứng" — agent thứ hai kiểm tra agent thứ nhất (Kế kiểm gián), rồi mới đến người phê duyệt.

So sánh: RPA truyền thống vs Agentic AI Workflow

Tiêu chí	RPA (Truyền thống)	Agentic AI Workflow (Kế 35)
Tư duy	Tuân thủ kịch bản cứng	Tự điều phối theo ngữ cảnh
Xử lý ngoại lệ	Dừng máy, cần người can thiệp	Tự giảm scope hoặc chuyển agent khác
Cải tiến	Cố định cho đến khi lập trình viên sửa	Tự học từ feedback, anti-fragile
Chi phí triển khai	Cao (tích hợp hệ thống cũ)	Thấp hơn (dùng API, ít code)
Rủi ro	Lỗi lặp lại đều đặn	Lỗi "sáng tạo" nếu không có guardrail

Kết luận: RPA là "đường ray", Agentic Workflow là "hệ thống giao thông thông minh". RPA phù hợp khi quy trình 100% rõ ràng và không đổi; Agentic Workflow cần thiết khi dữ liệu có cấu trúc mơ hồ, yêu cầu thay đổi liên tục, và cần sự linh hoạt của con người xen kẽ.

Kế 35: Binh pháp toàn cục — Thiết kế AI workflow

Workflow là gì? Khác biệt giữa chuỗi công cụ và hệ thống chiến lược

Từ RPA cứng nhắc đến Agentic linh hoạt

Phân quyền: Người tổng tư lệnh, AI làm tướng

Kiến trúc chống chịu và thích nghi

Tính toán lương thảo: Chi phí và giá trị

Ví dụ thực chiến

Onboarding nhân viên: Từ 3 ngày xuống 5 phút

Hệ thống chăm sóc khách hàng với "thang trời"

Pipeline nghiên cứu pháp lý 200 trang

Ứng dụng theo đối tượng

Startup: Tốc độ là sinh mệnh

Doanh nghiệp vừa: Hiệu suất và kiểm soát

Tập đoàn: Tuân thủ và quy mô

So sánh: RPA truyền thống vs Agentic AI Workflow

Bài viết liên quan

Cùng cụm "Chiến lược tối thượng"

Kế 33: Vây hãm tự động

Kế 34: Tổng tư lệnh vẫn là người

Kế 36: Đào hào kiến thức

Đọc tiếp

On this page