Khám phá Chain-of-Thought prompting - kỹ thuật bắt AI 'nghĩ ra suy nghĩ' để giải bài toán logic, toán học chính xác hơn. Từ magic phrase đến ví dụ thực tế.
Chain-of-Thought (CoT) là kỹ thuật yêu cầu AI trình bày quá trình suy luận từng bước trước khi đưa ra câu trả lời cuối cùng. Thay vì hỏi trực tiếp và nhận ngay kết quả, bạn bắt buộc AI phải "nghĩ ra suy nghĩ", tạo ra các bước trung gian giống như cách con người giải toán trên giấy nháp trước khi viết vào bài chính.
Hầu hết người dùng AI đều mắc một sai lầm: cho rằng AI "hiểu" bài toán giống như con người rồi tự động tính toán. Thực tế, AI chỉ là mô hình dự đoán token tiếp theo. Khi bạn hỏi "123 + 456 bằng bao nhiêu?", nó không chạy phép cộng trong đầu — nó chỉ đoán con số tiếp theo dựa trên pattern đã học.
Không có CoT, AI giống như học sinh làm toán trong đầu: với phép tính đơn giản thì ổn, nhưng với bài toán phức tạp, dễ nhầm lẫn. CoT ép AI viết ra từng bước "123 + 400 = 523, 523 + 50 = 573, 573 + 6 = 579", biến bài toán phức tạp thành nhiều bài toán đơn giản nối tiếp nhau.
Có hai cách để kích hoạt chế độ suy nghĩ từng bước:
Zero-shot CoT: Thêm cụm từ kỳ diệu vào cuối prompt
Hãy suy nghĩ từng bước một.
Hoặc tiếng Anh:
Let's think step by step.
Đây là "vũ khí bí mật" được phát hiện trong nghiên cứu năm 2022 — chỉ cần thêm 4 từ này, độ chính xác của GPT trên bài toán toán học tăng từ 17% lên 78%.
Few-shot CoT: Cung cấp ví dụ mẫu có lời giải chi tiết
Câu hỏi: An có 5 quả táo, bạn cho An thêm 3 quả. An có bao nhiêu quả?Suy luận: An bắt đầu với 5 quả. Thêm 3 quả nghĩa là 5 + 3 = 8. Đáp án: 8 quả.Câu hỏi: [bài toán thực tế của bạn]Suy luận:
Nên dùng khi gặp bài toán cần suy luận: toán học, logic, lập trình, phân tích dữ liệu, so sánh lựa chọn phức tạp (mua xe, chọn nhà, quyết định đầu tư).
Không nên dùng với tác vụ sáng tạo hoặc cảm xúc: viết thơ, kể chuyện, tư vấn tâm lý, brainstorm ý tưởng. Trong những trường hợp này, việc "phân tích quá kỹ" sẽ giết chết sự trực giác và cảm xúc của văn bản.
Tình huống: Bạn muốn đưa bạn gái đi ăn, ngân sách 500 nghìn, phải gần văn phòng (Quận 1), không phải đồ ăn Nhật (bạn dị ứng hải sản), nhưng bạn gái thích không gian yên tĩnh để nói chuyện.
Prompt:
Tôi cần chọn nhà hàng cho buổi tối với các yêu cầu: ngân sách dưới 500 nghìn đồng cho 2 người, khu vực Quận 1, không phục vụ đồ ăn Nhật, không gian yên tĩnh phù hợp trò chuyện. Hãy phân tích từng tiêu chí và đề xuất lựa chọn cụ thể.
Phản hồi AI:
Phân tích ngân sách: 500 nghìn cho 2 người → tối đa 250 nghìn/người. Loại bỏ nhà hàng fine-dining.
Phân tích địa điểm: Giới hạn Quận 1 → tập trung vào các nhà hàng trên đường Đồng Khởi, Lê Lợi, Nguyễn Huệ.
Phân tích thực đơn: Loại bỏ sushi, sashimi. Ưu tiên Ý, Pháp, hoặc Việt sang trọng.
Phân tích không gian: Tránh quán ốc vỉa hè ồn ào, chọn nhà hàng có phòng riêng hoặc nhạc nhẹ.
Đề xuất: Nhà hàng Ý trên tầng thượng khách sạn X, set menu 480 nghìn, view yên tĩnh, không có hải sản trong set cơ bản.
Đoạn code Python này báo lỗi IndexError. Hãy phân tích từng bước lý do lỗi và cách sửa:
arr = [1, 2, 3]print(arr[3])
Phản hồi:
Bước 1: Kiểm tra kích thước mảng arr có 3 phần tử, index hợp lệ là 0, 1, 2.
Bước 2: Code đang truy cập arr[3], tức là phần tử thứ 4.
Bước 3: Vì chỉ có 3 phần tử, index 3 vượt quá giới hạn (out of range).
Sửa: Đổi arr[3] thành arr[2] để lấy phần tử cuối cùng, hoặc kiểm tra len(arr) trước khi truy cập.
Kết luận: Chain-of-Thought không phải là "cao cấp hơn" prompt thường — nó là công cụ chuyên dụng. Giống như bạn không dùng máy tính Casio để viết thư tay, cũng không nên dùng CoT cho mọi câu hỏi. Hãy dùng CoT khi cần độ chính xác cao và có thể chấp nhận trả lời dài hơn.