Chain-of-Thought: Bắt AI suy nghĩ từng bước

Khám phá Chain-of-Thought prompting - kỹ thuật bắt AI 'nghĩ ra suy nghĩ' để giải bài toán logic, toán học chính xác hơn. Từ magic phrase đến ví dụ thực tế.

Định nghĩa

Chain-of-Thought (CoT) là kỹ thuật yêu cầu AI trình bày quá trình suy luận từng bước trước khi đưa ra câu trả lời cuối cùng. Thay vì hỏi trực tiếp và nhận ngay kết quả, bạn bắt buộc AI phải "nghĩ ra suy nghĩ", tạo ra các bước trung gian giống như cách con người giải toán trên giấy nháp trước khi viết vào bài chính.

Giải thích chi tiết

Tại sao AI cần "nghĩ" từng bước?

Hầu hết người dùng AI đều mắc một sai lầm: cho rằng AI "hiểu" bài toán giống như con người rồi tự động tính toán. Thực tế, AI chỉ là mô hình dự đoán token tiếp theo. Khi bạn hỏi "123 + 456 bằng bao nhiêu?", nó không chạy phép cộng trong đầu — nó chỉ đoán con số tiếp theo dựa trên pattern đã học.

Không có CoT, AI giống như học sinh làm toán trong đầu: với phép tính đơn giản thì ổn, nhưng với bài toán phức tạp, dễ nhầm lẫn. CoT ép AI viết ra từng bước "123 + 400 = 523, 523 + 50 = 573, 573 + 6 = 579", biến bài toán phức tạp thành nhiều bài toán đơn giản nối tiếp nhau.

Cách viết Prompt Chain-of-Thought

Có hai cách để kích hoạt chế độ suy nghĩ từng bước:

Zero-shot CoT: Thêm cụm từ kỳ diệu vào cuối prompt

Hãy suy nghĩ từng bước một.

Hoặc tiếng Anh:

Let's think step by step.

Đây là "vũ khí bí mật" được phát hiện trong nghiên cứu năm 2022 — chỉ cần thêm 4 từ này, độ chính xác của GPT trên bài toán toán học tăng từ 17% lên 78%.

Few-shot CoT: Cung cấp ví dụ mẫu có lời giải chi tiết

Câu hỏi: An có 5 quả táo, bạn cho An thêm 3 quả. An có bao nhiêu quả?
Suy luận: An bắt đầu với 5 quả. Thêm 3 quả nghĩa là 5 + 3 = 8. 
Đáp án: 8 quả.

Câu hỏi: [bài toán thực tế của bạn]
Suy luận:

Khi nào nên dùng, khi nào không?

Nên dùng khi gặp bài toán cần suy luận: toán học, logic, lập trình, phân tích dữ liệu, so sánh lựa chọn phức tạp (mua xe, chọn nhà, quyết định đầu tư).

Không nên dùng với tác vụ sáng tạo hoặc cảm xúc: viết thơ, kể chuyện, tư vấn tâm lý, brainstorm ý tưởng. Trong những trường hợp này, việc "phân tích quá kỹ" sẽ giết chết sự trực giác và cảm xúc của văn bản.

Ví dụ thực tế

Bài toán "gậy bóng" kinh điển

Prompt thường:

Một cây gậy bóng chày và quả bóng có giá tổng cộng 11 đô la. Cây gậy đắt hơn quả bóng 10 đô la. Quả bóng giá bao nhiêu?

AI thường trả lời ngay: "1 đô la" (sai). Thực tế đáp án là 0.5 đô la (gậy 10.5, bóng 0.5, tổng 11).

Prompt với CoT:

Một cây gậy bóng chày và quả bóng có giá tổng cộng 11 đô la. Cây gậy đắt hơn quả bóng 10 đô la. Quả bóng giá bao nhiêu? Hãy suy nghĩ từng bước.

Phản hồi AI:

Gọi giá quả bóng là $x$ . Khi đó giá cây gậy là $x + 10$ . Tổng giá: $x + (x + 10) = 11$ $2x + 10 = 11$ $2x = 1$ $x = 0.5$

Đáp án: Quả bóng giá 0.5 đô la.

Chọn nhà hàng cuối tuần

Tình huống: Bạn muốn đưa bạn gái đi ăn, ngân sách 500 nghìn, phải gần văn phòng (Quận 1), không phải đồ ăn Nhật (bạn dị ứng hải sản), nhưng bạn gái thích không gian yên tĩnh để nói chuyện.

Prompt:

Tôi cần chọn nhà hàng cho buổi tối với các yêu cầu: ngân sách dưới 500 nghìn đồng cho 2 người, khu vực Quận 1, không phục vụ đồ ăn Nhật, không gian yên tĩnh phù hợp trò chuyện. Hãy phân tích từng tiêu chí và đề xuất lựa chọn cụ thể.

Phản hồi AI:

Phân tích ngân sách: 500 nghìn cho 2 người → tối đa 250 nghìn/người. Loại bỏ nhà hàng fine-dining. Phân tích địa điểm: Giới hạn Quận 1 → tập trung vào các nhà hàng trên đường Đồng Khởi, Lê Lợi, Nguyễn Huệ. Phân tích thực đơn: Loại bỏ sushi, sashimi. Ưu tiên Ý, Pháp, hoặc Việt sang trọng. Phân tích không gian: Tránh quán ốc vỉa hè ồn ào, chọn nhà hàng có phòng riêng hoặc nhạc nhẹ.

Đề xuất: Nhà hàng Ý trên tầng thượng khách sạn X, set menu 480 nghìn, view yên tĩnh, không có hải sản trong set cơ bản.

Debug code đơn giản

Prompt:

Đoạn code Python này báo lỗi IndexError. Hãy phân tích từng bước lý do lỗi và cách sửa:
arr = [1, 2, 3]
print(arr[3])

Phản hồi:

Bước 1: Kiểm tra kích thước mảng arr có 3 phần tử, index hợp lệ là 0, 1, 2. Bước 2: Code đang truy cập arr[3], tức là phần tử thứ 4. Bước 3: Vì chỉ có 3 phần tử, index 3 vượt quá giới hạn (out of range). Sửa: Đổi arr[3] thành arr[2] để lấy phần tử cuối cùng, hoặc kiểm tra len(arr) trước khi truy cập.

Ứng dụng

Sinh viên

Giải toán cao cấp, vật lý, hóa học với lời giải chi tiết
Phân tích văn bản, so sánh các trường phái văn học
Lập trình: debug bài tập, giải thích thuật toán

Người đi làm văn phòng

Phân tích báo cáo tài chính: "Doanh thu tăng 20% nhưng lợi nhuận giảm, hãy phân tích các khả năng"
So sánh hợp đồng: liệt kê từng điểm khác biệt giữa hai bản hợp đồng
Quyết định mua sắm: phân tích trade-off giữa các mẫu laptop theo từng tiêu chí

Doanh nghiệp nhỏ

Tính toán chi phí logistics: phân tích từng yếu tố ảnh hưởng đến giá vận chuyển
Chọn nhà cung cấp: đánh giá từng tiêu chí (giá, chất lượng, thời gian giao) một cách riêng biệt

So sánh

Tiêu chí	Prompt thông thường	Chain-of-Thought
Cách dùng	Hỏi trực tiếp, đòi đáp án ngay	Yêu cầu trình bày suy luận trước
Thích hợp cho	Tra cứu thông tin, sáng tạo nội dung	Toán học, logic, phân tích phức tạp
Độ dài phản hồi	Ngắn gọn	Dài hơn (do có phần giải thích)
Độ chính xác	Thấp với bài toán phức tạp	Cao hơn đáng kể (thường tăng 40-60%)
Token sử dụng	Ít	Nhiều hơn (tính phí cao hơn nếu dùng API)

Kết luận: Chain-of-Thought không phải là "cao cấp hơn" prompt thường — nó là công cụ chuyên dụng. Giống như bạn không dùng máy tính Casio để viết thư tay, cũng không nên dùng CoT cho mọi câu hỏi. Hãy dùng CoT khi cần độ chính xác cao và có thể chấp nhận trả lời dài hơn.

Chain-of-Thought: Bắt AI suy nghĩ từng bước

Định nghĩa

Giải thích chi tiết

Tại sao AI cần "nghĩ" từng bước?

Cách viết Prompt Chain-of-Thought

Khi nào nên dùng, khi nào không?

Ví dụ thực tế

Bài toán "gậy bóng" kinh điển

Chọn nhà hàng cuối tuần

Debug code đơn giản

Ứng dụng

Sinh viên

Người đi làm văn phòng

Doanh nghiệp nhỏ

So sánh

Bài viết liên quan

Cùng cụm

Tree-of-Thought

ReAct

Self-Consistency

Meta-Prompting

Đọc tiếp

System Prompt & Thực chiến

Nền tảng Context Engineering

On this page