Multi-agent là gì?

Multi-agent là hệ thống nhiều AI Agent phối hợp thông minh để giải quyết vấn đề phức tạp mà đơn lẻ không làm được. Tìm hiểu kiến trúc phân tán và cơ chế consensus cho developer.

Định nghĩa

Multi-agent là hệ thống gồm nhiều AI Agent độc lập hoạt động song song, giao tiếp và phối hợp với nhau để giải quyết những vấn đề phức tạp vượt quá khả năng của một agent đơn lẻ. Khác với việc chạy nhiều instance ChatGPT riêng biệt, multi-agent hình thành một hệ sinh thái nơi các agent chia sẻ thông tin, đàm phán, và ra quyết định tập thể.

Giải thích chi tiết

Kiến trúc phân tán: Từ đơn lẻ đến hệ sinh thái

Trong hệ thống multi-agent, mỗi agent sở hữu local view — tầm nhìn cục bộ về một phần của vấn đề, thay vì toàn bộ bức tranh lớn. Điều này phản ánh thế giới thực: một nhân viên không thể biết hết mọi thứ, nhưng tổ chức vẫn vận hành nhờ giao tiếp.

Có ba kiến trúc chính:

Phân cấp (Hierarchical): Một "agent chủ" (master) phân phối nhiệm vụ cho các "agent con" (workers) và tổng hợp kết quả. Phù hợp khi có một mục tiêu rõ ràng cần phân rã.
Phân tán (Decentralized/P2P): Các agent ngang hàng, tự tổ chức qua giao thức đàm phán. Không có điểm lỗi tập trung, nhưng khó đảm bảo consensus.
Lai ghép (Hybrid): Kết hợp cả hai, thường thấy trong hệ thống IoT hoặc smart city — có trung tâm điều phối nhưng các node cục bộ vẫn tự chủ.

Cơ chế giao tiếp và phối hợp

Agent không "nói chuyện" như người mà trao đổi thông qua Agent Communication Language (ACL) — thường là JSON hoặc XML định dạng đặc biệt chứa: sender, receiver, performative (hành động như "request", "inform", "propose"), và content.

Các mô hình phối hợp phổ biến:

Blackboard Architecture: Một vùng nhớ chung (blackboard) nơi agent đăng tải kết quả trung gian. Agent khác đọc và góp phần. Phù hợp cho bài toán thiết kế hoặc chẩn đoán y khoa phức tạp.
Contract Net Protocol: Agent có nhiệm vụ (manager) thông báo "tender", các agent khác (contractors) đấu thầu (bid) dựa trên năng lực. Manager chọn contractor tốt nhất. Mô phỏng thị trường dịch vụ thực tế.
Consensus Algorithms: Các agent phải thống nhất quyết định trước khi hành động (ví dụ: khóa tài khoản ngân hàng cần 2/3 agent đồng ý), ngăn chặn hành vi độc hại của một agent lỗi.

Tính nổi và sự thông minh tập thể

Đây là điểm khác biệt sâu nhất. Multi-agent thể hiện emergent behavior — hành vi nổi lên từ tương tác mà không được lập trình trực tiếp. Ví dụ: không ai lập trình "đàn chim bay theo hình chữ V", nhưng từng con tuân theo quy tắc đơn giản (giữ khoảng cách, theo con trước) thì hình chữ V xuất hiện.

Tương tự, trong hệ thống giao thông, không có agent nào được code để "giảm ùn tắc toàn thành phố", nhưng từ việc mỗi agent tối ưu luồng xe tại ngã tư của mình và chia sẻ dữ liệu lưu lượng, hiện tượng giảm ùn tắc toàn cục xuất hiện.

Các framework thực hành

Hiện nay developer không cần xây dựng từ đầu:

AutoGen (Microsoft): Cho phép định nghĩa agent với các "skill" khác nhau, tự động quản lý hội thoại nhóm.
CrewAI: Thiết kế theo vai trò (role-based), dễ dàng gán "nhiệm vụ" (task) và quy trình phân cấp.
LangGraph: Xây dựng đồ thị trạng thái (state graph) cho multi-agent, kiểm soát chặt chẽ luồng thông tin giữa các node.

Ví dụ thực tế

Hệ thống giao thông thông minh tại đô thị lớn

Tại TP.HCM, một hệ thống multi-agent có thể bao gồm: agent điều khiển đèn giao thông tại ngã tư X, agent phân tích dữ liệu camera nhận diện lưu lượng xe, agent dự báo thời tiết từ Trung tâm Khí tượng, và agent cảnh sát giao thông di động. Khi camera phát hiện kẹt xe, agent camera không chỉ điều chỉnh đèn ngay tại chỗ mà còn "thông báo" cho agent ngã tư lân cận để họ điều tiết sớm, đồng thời agent thời tiết kiểm tra xem có mưa không để điều chỉnh thời gian đèn dài hơn. Kết quả là tối ưu toàn cục thay vì từng điểm riêng lẻ.

Nền tảng gọi xe đa nền tảng (Grab, Be, Gojek)

Trong mô hình tương lai gần, thay vì mỗi app chạy thuật toán riêng, các agent đại diện cho từng nền tảng có thể tham gia một hệ thống multi-agent chung. Khi khách đặt xe từ A đến B, các agent đàm phán với nhau: agent Grab có tài xế gần nhưng đang bận, agent Be có tài xế xa hơn nhưng đang rảnh, agent Gojek đề xuất giá thấp hơn nhưng thời gian chờ lâu. Hệ thống đạt được consensus về phân phối tài xế tối ưu cho cả ba bên, giảm chi phí và thời gian chờ cho khách hàng thay vì cạnh tranh zero-sum.

Ngân hàng phát hiện gian lận đa chiều

Một giao dịch chuyển tiền bị nghi ngờ được kiểm tra bởi ba agent chuyên biệt: (1) Agent phân tích mẫu giao dịch (số tiền, tần suất), (2) Agent phân tích hành vi thiết bị (IP, vị trí địa lý, thiết bị), (3) Agent kiểm tra danh tính sinh trắc học. Thay vì một AI duy nhất quyết định khóa thẻ (dễ báo động giả), các agent "bỏ phiếu" dựa trên độ tin cậy của từng chỉ số. Chỉ khi 2/3 agent đạt ngưỡng cảnh báo cao, giao dịch mới bị tạm dừng và chuyển cho nhân viên con người xác nhận.

Ứng dụng

Doanh nghiệp và tổ chức lớn

Multi-agent cho phép tự động hóa quy trình xuyên phòng ban mà không cần tích hợp hệ thống legacy phức tạp. Ví dụ: agent thuộc phòng Kế toán tự động trích xuất dữ liệu từ hóa đơn, agent phòng Nhân sự kiểm tra chấm công, agent phòng Pháp chế rà soát hợp đồng — tất cả phối hợp tạo báo cáo tài chính cuối tháng mà không cần họp giao ban hay copy-paste dữ liệu qua email.

Nghiên cứu khoa học và mô phỏng

Các nhà nghiên cứu sử dụng multi-agent để mô phỏng thị trường tài chính, lây lan dịch bệnh, hoặc hành vi giao thông. Mỗi agent đại diện cho một nhà đầu tư, một cá nhân, hoặc một chiếc xe với hành vi riêng biệt. Từ đó quan sát emergent patterns như bong bóng kinh tế, sóng dịch bệnh, hoặc hiện tượng ùn tắc không lường trước được.

Developer xây dựng hệ thống phân tán

Với kiến trúc microservices, thay vì hard-code logic gọi nhau giữa các service, developer có thể gán mỗi service một agent có khả năng tự quyết định khi nào gọi service khác, xử lý lỗi (fault tolerance), và tự cân bằng tải (load balancing) thông qua đàm phán với các agent service khác.

So sánh

Đặc điểm	Single Agent	Multi-Agent System	Workflow AI
Số lượng tác nhân	Một LLM + Tools	Nhiều agent chuyên biệt	Các bước (steps) được định nghĩa trước
Tính linh hoạt	Thích ứng với input đơn lẻ	Thích ứng với môi trường động, nhiều biến số	Cứng nhắc, theo kịch bản cố định
Kiến thức	Toàn cục (global context)	Phân tán (local views), chia sẻ qua giao tiếp	Phân chia theo bước, không có "tri thức" riêng
Ra quyết định	Tập trung tại một điểm	Phân tán, đòi hỏi consensus hoặc đàm phán	Tuần tự, deterministic
Độ phức tạp triển khai	Thấp	Cao (xử lý giao tiếp, đồng bộ, lỗi)	Trung bình
Ứng dụng điển hình	Chatbot, trợ lý cá nhân	Hệ thống logistics, smart city, giao dịch tài chính	Xử lý đơn hàng, phê duyệt tự động

Kết luận: Workflow AI phù hợp khi quy trình đã được chuẩn hóa và lặp lại (deterministic). Single Agent đủ cho nhiệm vụ cá nhân. Multi-agent trở nên cần thiết khi vấn đề vượt quá khả năng của một "bộ não" duy nhất — đòi hỏi chuyên môn hóa sâu và phối hợp liên tục giữa các chuyên gia AI.