TROISINH
Prompt EngineeringKỹ thuật Prompt nâng cao

Chain-of-Thought: Bắt AI suy nghĩ từng bước

Khám phá Chain-of-Thought prompting - kỹ thuật bắt AI 'nghĩ ra suy nghĩ' để giải bài toán logic, toán học chính xác hơn. Từ magic phrase đến ví dụ thực tế.

Định nghĩa

Chain-of-Thought (CoT) là kỹ thuật yêu cầu AI trình bày quá trình suy luận từng bước trước khi đưa ra câu trả lời cuối cùng. Thay vì hỏi trực tiếp và nhận ngay kết quả, bạn bắt buộc AI phải "nghĩ ra suy nghĩ", tạo ra các bước trung gian giống như cách con người giải toán trên giấy nháp trước khi viết vào bài chính.

Giải thích chi tiết

Tại sao AI cần "nghĩ" từng bước?

Hầu hết người dùng AI đều mắc một sai lầm: cho rằng AI "hiểu" bài toán giống như con người rồi tự động tính toán. Thực tế, AI chỉ là mô hình dự đoán token tiếp theo. Khi bạn hỏi "123 + 456 bằng bao nhiêu?", nó không chạy phép cộng trong đầu — nó chỉ đoán con số tiếp theo dựa trên pattern đã học.

Không có CoT, AI giống như học sinh làm toán trong đầu: với phép tính đơn giản thì ổn, nhưng với bài toán phức tạp, dễ nhầm lẫn. CoT ép AI viết ra từng bước "123 + 400 = 523, 523 + 50 = 573, 573 + 6 = 579", biến bài toán phức tạp thành nhiều bài toán đơn giản nối tiếp nhau.

Cách viết Prompt Chain-of-Thought

Có hai cách để kích hoạt chế độ suy nghĩ từng bước:

Zero-shot CoT: Thêm cụm từ kỳ diệu vào cuối prompt

Hãy suy nghĩ từng bước một.

Hoặc tiếng Anh:

Let's think step by step.

Đây là "vũ khí bí mật" được phát hiện trong nghiên cứu năm 2022 — chỉ cần thêm 4 từ này, độ chính xác của GPT trên bài toán toán học tăng từ 17% lên 78%.

Few-shot CoT: Cung cấp ví dụ mẫu có lời giải chi tiết

Câu hỏi: An có 5 quả táo, bạn cho An thêm 3 quả. An có bao nhiêu quả?
Suy luận: An bắt đầu với 5 quả. Thêm 3 quả nghĩa là 5 + 3 = 8. 
Đáp án: 8 quả.

Câu hỏi: [bài toán thực tế của bạn]
Suy luận:

Khi nào nên dùng, khi nào không?

Nên dùng khi gặp bài toán cần suy luận: toán học, logic, lập trình, phân tích dữ liệu, so sánh lựa chọn phức tạp (mua xe, chọn nhà, quyết định đầu tư).

Không nên dùng với tác vụ sáng tạo hoặc cảm xúc: viết thơ, kể chuyện, tư vấn tâm lý, brainstorm ý tưởng. Trong những trường hợp này, việc "phân tích quá kỹ" sẽ giết chết sự trực giác và cảm xúc của văn bản.

Ví dụ thực tế

Bài toán "gậy bóng" kinh điển

Prompt thường:

Một cây gậy bóng chày và quả bóng có giá tổng cộng 11 đô la. Cây gậy đắt hơn quả bóng 10 đô la. Quả bóng giá bao nhiêu?

AI thường trả lời ngay: "1 đô la" (sai). Thực tế đáp án là 0.5 đô la (gậy 10.5, bóng 0.5, tổng 11).

Prompt với CoT:

Một cây gậy bóng chày và quả bóng có giá tổng cộng 11 đô la. Cây gậy đắt hơn quả bóng 10 đô la. Quả bóng giá bao nhiêu? Hãy suy nghĩ từng bước.

Phản hồi AI:

Gọi giá quả bóng là xx. Khi đó giá cây gậy là x+10x + 10. Tổng giá: x+(x+10)=11x + (x + 10) = 11 2x+10=112x + 10 = 11 2x=12x = 1 x=0.5x = 0.5

Đáp án: Quả bóng giá 0.5 đô la.

Chọn nhà hàng cuối tuần

Tình huống: Bạn muốn đưa bạn gái đi ăn, ngân sách 500 nghìn, phải gần văn phòng (Quận 1), không phải đồ ăn Nhật (bạn dị ứng hải sản), nhưng bạn gái thích không gian yên tĩnh để nói chuyện.

Prompt:

Tôi cần chọn nhà hàng cho buổi tối với các yêu cầu: ngân sách dưới 500 nghìn đồng cho 2 người, khu vực Quận 1, không phục vụ đồ ăn Nhật, không gian yên tĩnh phù hợp trò chuyện. Hãy phân tích từng tiêu chí và đề xuất lựa chọn cụ thể.

Phản hồi AI:

Phân tích ngân sách: 500 nghìn cho 2 người → tối đa 250 nghìn/người. Loại bỏ nhà hàng fine-dining. Phân tích địa điểm: Giới hạn Quận 1 → tập trung vào các nhà hàng trên đường Đồng Khởi, Lê Lợi, Nguyễn Huệ. Phân tích thực đơn: Loại bỏ sushi, sashimi. Ưu tiên Ý, Pháp, hoặc Việt sang trọng. Phân tích không gian: Tránh quán ốc vỉa hè ồn ào, chọn nhà hàng có phòng riêng hoặc nhạc nhẹ.

Đề xuất: Nhà hàng Ý trên tầng thượng khách sạn X, set menu 480 nghìn, view yên tĩnh, không có hải sản trong set cơ bản.

Debug code đơn giản

Prompt:

Đoạn code Python này báo lỗi IndexError. Hãy phân tích từng bước lý do lỗi và cách sửa:

arr = [1, 2, 3]
print(arr[3])

Phản hồi:

Bước 1: Kiểm tra kích thước mảng arr có 3 phần tử, index hợp lệ là 0, 1, 2. Bước 2: Code đang truy cập arr[3], tức là phần tử thứ 4. Bước 3: Vì chỉ có 3 phần tử, index 3 vượt quá giới hạn (out of range). Sửa: Đổi arr[3] thành arr[2] để lấy phần tử cuối cùng, hoặc kiểm tra len(arr) trước khi truy cập.

Ứng dụng

Sinh viên

  • Giải toán cao cấp, vật lý, hóa học với lời giải chi tiết
  • Phân tích văn bản, so sánh các trường phái văn học
  • Lập trình: debug bài tập, giải thích thuật toán

Người đi làm văn phòng

  • Phân tích báo cáo tài chính: "Doanh thu tăng 20% nhưng lợi nhuận giảm, hãy phân tích các khả năng"
  • So sánh hợp đồng: liệt kê từng điểm khác biệt giữa hai bản hợp đồng
  • Quyết định mua sắm: phân tích trade-off giữa các mẫu laptop theo từng tiêu chí

Doanh nghiệp nhỏ

  • Tính toán chi phí logistics: phân tích từng yếu tố ảnh hưởng đến giá vận chuyển
  • Chọn nhà cung cấp: đánh giá từng tiêu chí (giá, chất lượng, thời gian giao) một cách riêng biệt

So sánh

Tiêu chíPrompt thông thườngChain-of-Thought
Cách dùngHỏi trực tiếp, đòi đáp án ngayYêu cầu trình bày suy luận trước
Thích hợp choTra cứu thông tin, sáng tạo nội dungToán học, logic, phân tích phức tạp
Độ dài phản hồiNgắn gọnDài hơn (do có phần giải thích)
Độ chính xácThấp với bài toán phức tạpCao hơn đáng kể (thường tăng 40-60%)
Token sử dụngÍtNhiều hơn (tính phí cao hơn nếu dùng API)

Kết luận: Chain-of-Thought không phải là "cao cấp hơn" prompt thường — nó là công cụ chuyên dụng. Giống như bạn không dùng máy tính Casio để viết thư tay, cũng không nên dùng CoT cho mọi câu hỏi. Hãy dùng CoT khi cần độ chính xác cao và có thể chấp nhận trả lời dài hơn.

Bài viết liên quan

Cùng cụm

Tree-of-Thought

Khám phá nhiều hướng suy luận song song thay vì một đường thẳng — khi bạn cần AI "thử nghiệm" nhiều phương án khác nhau

ReAct

Kết hợp suy luận (Reasoning) và hành động (Action) — cho phép AI tìm kiếm thông tin và suy luận xen kẽ

Self-Consistency

Chạy cùng bài toán nhiều lần với CoT, sau đó chọn đáp án đúng nhất bằng cách voting

Meta-Prompting

Dùng chính AI để viết và tối ưu prompt — khi bạn muốn "tự động hóa" việc viết prompt CoT

Đọc tiếp

System Prompt & Thực chiến

Kết hợp Chain-of-Thought với System Prompt để tạo "personality" cho AI trong quá trình suy luận

Nền tảng Context Engineering

Chuyển sang Level 1 — hiểu cách AI thực sự "nhớ" thông tin, mở rộng từ Prompt Engineering sang Context Engineering

On this page