Prompt chaining là gì?

Tìm hiểu cách phá vỡ task phức tạp thành chuỗi prompt đơn giản - kỹ thuật cốt lõi để xây dựng AI Agent và hệ thống tự động hóa hiệu quả.

Định nghĩa

Prompt chaining là kỹ thuật phân rã tác vụ phức tạp thành chuỗi các bước tuần tự, trong đó kết quả đầu ra từ prompt trước trở thành đầu vào hoặc ngữ cảnh cho prompt tiếp theo, tạo thành pipeline xử lý dữ liệu có trạng thái giữa người dùng và Large Language Model (LLM).

Giải thích chi tiết

Vấn đề của "một prompt cho tất cả"

Nhiều người mới tiếp cận AI có xu hướng cố gắng nhồi nhét toàn bộ yêu cầu phức tạp vào một prompt duy nhất, kỳ vọng LLM sẽ "làm tất cả trong một lần suy nghĩ". Thực tế, cách làm này dẫn đến ba vấn đề nghiêm trọng: hallucination tăng cao khi model cố gắng đoán các bước trung gian, context window bị quá tải bởi hướng dẫn dài dòng, và việc debug trở nên bất khả thi khi lỗi xuất hiện ở đâu đó trong quá trình xử lý. Prompt chaining giải quyết bằng cách áp dụng nguyên tắc "divide and conquer" — mỗi bước chỉ tập trung vào một sub-task cụ thể, dễ kiểm soát và tối ưu riêng lẻ.

Cơ chế pipeline và trạng thái

Một chuỗi prompt cơ bản hoạt động như finite state machine:

Input Processing: Phân tích và chuẩn hóa yêu cầu ban đầu
Intermediate Steps: Các bước xử lý chuyên biệt (trích xuất thực thể, phân tích logic, tổng hợp dữ liệu)
Output Synthesis: Kết hợp kết quả trung gian thành đầu ra cuối cùng

Trạng thái được truyền qua các bước dưới dạng văn bản thuần túy hoặc cấu trúc dữ liệu như JSON. Khác với context engineering đơn thuần, chaining quản lý luồng dữ liệu động — output của bước 2 có thể quyết định prompt template của bước 3.

Tích hợp Tool use và Function calling

Prompt chaining thực sự phát huy sức mạnh khi kết hợp với tool use trong AI và function calling. Mỗi node trong chuỗi có thể trigger một API call bên ngoài — ví dụ: tìm kiếm web, truy vấn database, hoặc chạy code. Kết quả trả về từ tool được định dạng lại và đưa vào prompt tiếp theo, tạo nên vòng lặp "suy luận-hành động-quan sát" (reasoning-action-observation) cho đến khi hoàn thành mục tiêu.

Quản lý bộ nhớ trong chuỗi dài

Trong hệ thống nhiều bước, việc truyền toàn bộ lịch sử qua từng prompt sẽ nhanh chóng vượt quá giới hạn token. AI memory trong chaining thường sử dụng kỹ thuật summarization: chỉ lưu trữ các insight quan trọng từ các bước trước, hoặc dùng vector retrieval để truy xuất thông tin cần thiết cho bước hiện tại mà không phải mang theo toàn bộ context.

Xử lý lỗi và conditional branching

Ưu điểm lớn nhất của chaining là khả năng dừng lại ở bước trung gian để validation. Nếu output bước 3 không đúng định dạng JSON hoặc thiếu trường bắt buộc, hệ thống có thể retry với prompt sửa lỗi hoặc chuyển sang nhánh xử lý ngoại lệ, thay vì bắt đầu lại từ đầu như single prompt approach.

Ví dụ thực tế

Hệ thống phân tích tài liệu pháp lý

Một công ty luật triển khai pipeline xử lý hợp đồng:

Bước 1: Trích xuất các điều khoản chính và bên liên quan từ văn bản PDF
Bước 2: Kiểm tra từng điều khoản với cơ sở dữ liệu luật hiện hành (function calling đến legal API)
Bước 3: Đánh giá rủi ro từng điều khoản theo thang điểm 1-10
Bước 4: Tổng hợp thành báo cáo rủi ro với đề xuất sửa đổi cụ thể

Nếu bước 2 phát hiện điều khoản vi phạm luật mới ban hành, chuỗi tự động thêm nhánh cảnh báo khẩn cấp vào báo cáo cuối cùng.

Tạo code với kiểm thử tự động

Developer xây dựng agent lập trình:

Bước 1: Sinh code Python từ mô tả yêu cầu bằng tiếng Việt
Bước 2: Sinh unit test dựa trên code vừa tạo
Bước 3: Thực thi test trong sandbox environment (tool use)
Bước 4: Nếu pass hết test → tối ưu hóa và viết docstring; nếu fail → phân tích error log và sửa code (feedback loop về bước 1)

Chuỗi này tạo thành vòng lặp cải tiến liên tục cho đến khi code đạt yêu cầu, thay vì sinh ra code lỗi từ lần đầu.

Chatbot xử lý đơn hàng đa bước

Hệ thống tự động hóa cho sàn thương mại điện tử:

Bước 1: Trích xuất thông tin sản phẩm, số lượng, địa chỉ từ tin nhắn tự nhiên của khách
Bước 2: Kiểm tra tồn kho real-time qua inventory API
Bước 3: Tính toán phí vận chuyển dựa trên địa chỉ và khối lượng
Bước 4: Áp dụng voucher và tính tổng thanh toán
Bước 5: Tạo đơn hàng và gửi xác nhận qua Zalo

Nếu bước 2 báo hết hàng, chuỗi chuyển sang nhánh "đề xuất sản phẩm thay thế" thay vì tiếp tục thanh toán.

Ứng dụng

Lập trình viên xây dựng Agent

Developer sử dụng prompt chaining để kiến trúc hóa AI Agent thay vì để model tự suy luận tự do. Mỗi node trong chuỗi đại diện cho một trạng thái cụ thể: planning, tool execution, reflection, hoặc final answer. Cách tiếp cận này giúp debug hệ thống production khi agent hành động sai — bạn biết chính xác nó "suy nghĩ" gì ở bước nào.

Nhà khoa học dữ liệu

Data scientist áp dụng cho pipeline xử lý dữ liệu phức tạp: cleaning dữ liệu thô → feature extraction bằng domain-specific prompts → statistical analysis → visualization description. Chaining cho phép sử dụng model khác nhau cho từng bước (ví dụ: lightweight model cho extraction, GPT-4 cho synthesis) để tối ưu chi phí và độ chính xác.

Doanh nghiệp tự động hóa

Doanh nghiệp triển khai hệ thống xử lý văn bản nội bộ: nhận diện hóa đơn từ ảnh → trích xuất thông tin → matching với purchase order → phân loại "tự động phê duyệt" hoặc "cần review con người". Prompt chaining tạo audit trail rõ ràng ở mỗi bước, giải quyết vấn đề "black box" của AI trong môi trường enterprise yêu cầu compliance.

Nghiên cứu học thuật

Researchers dùng để phân tích văn bản học thuật dài (luận văn, báo cáo 100+ trang): summarize từng chương → trích xuất methodology → so sánh với literature → đánh giá limitation. Kỹ thuật này vượt quá giới hạn context window bằng cách xử lý tuần tự, chỉ mang theo thông tin tóm tắt cần thiết giữa các bước.

So sánh

Đặc điểm	Single Prompt	Prompt Chaining	AI Agent tự chủ
Kiến trúc	Một lần gọi API	Tuần tự, deterministic	Có vòng lặp và nhánh rẽ động
Kiểm soát	Thấp, khó debug	Cao, dừng ở mỗi node	Cao, nhưng logic phức tạp
Context Window	Dễ bị quá tải	Quản lý chủ động qua state	Cần memory system phức tạp
Tool Integration	Không hoặc đơn giản	Tích hợp cố định theo bước	Tích hợp động, tự quyết định
Phù hợp cho	Q&A đơn giản, creative writing	Pipeline xử lý dữ liệu, automation	Autonomous task completion

Prompt chaining đại diện cho "sweet spot" giữa đơn giản và hiệu quả: đủ cấu trúc để xử lý task phức tạp với độ tin cậy cao, nhưng không phức tạp như hệ thống Agent đầy đủ với planning và self-reflection. Đây là nền tảng để xây dựng các hệ thống RAG production-grade và automation workflow.