TROISINH
Chiến thuật linh hoạtKế hư thực

Kế 16: Thanh Đông kích Tây — Negative prompting định nghĩa bằng phủ định

Kế 16 Binh pháp AI: Dùng negative prompting (Via Negativa) để loại trừ lỗi thay vì chỉ định tích cực. Giảm hallucination, tránh clichés, tạo output chính xác.

Định nghĩa

Kế "Thanh Đông kích Tây" trong binh pháp Tôn Tử là kế dùng hư chiêu — giả vờ đánh Đông để thực sự đánh Tây, buộc địch phải phân tán lực lượng phòng thủ. Áp dụng vào AI, đây là nghệ thuật Negative Prompting (Via Negativa): thay vì ra lệnh "hãy làm điều này" (positive prompting), ta vạch ranh giới "tuyệt đối không được làm điều này" để AI tự tránh né những vùng nguy hiểm trong không gian xác suất, từ đó ép buộc nó rơi vào khu vực an toàn mong muốn.

Giải thích chi tiết

Via Negativa — Khắc đá thay vì vẽ tranh

Hầu hết người dùng AI tiếp cận như một họa sĩ: thêm chi tiết, thêm màu sắc, thêm yêu cầu để "vẽ" bức tranh hoàn hảo. Negative prompting ngược lại — nó như một người thợ đá: bắt đầu từ khối đá nguyên thủy và đục bỏ mọi thứ không phải là tượng.

Trong không gian embedding hàng nghìn chiều, tập hợp các output "tốt" (G) là một mảng manifold cực kỳ thưa thớt, nổi lềnh bềnh trong biển rác (B) rộng lớn gấp hàng tỷ lần. Positive prompting cố gắng chỉ tay về phía G — nhưng đó là nhiệm vụ khó khăn vì G quá nhỏ bé và ẩn giấu. Negative prompting thông minh hơn: nó chỉ ra B (bad anatomy, blurry, clichés, hallucination) và bảo AI "hãy tránh xa". Việc loại trừ B dễ hơn nhiều so với việc tìm kiếm G, vì các lỗi thường có đặc điểm rõ ràng hơn các đáp án đúng.

Cơ chế ép buộc trong LLM

Trong mô hình ngôn ngữ, negative prompting không đơn thuần là thêm chữ "không" vào câu lệnh. Nó hoạt động qua nhiều cơ chế kỹ thuật:

System-level Constraints: Đặt các nguyên tắc cấm đoán ngay từ system prompt. Ví dụ: "You must not provide legal advice under any circumstances. If asked for legal interpretation, respond with 'I cannot provide legal advice.'". Điều này tạo ra một lớp rào cản vô hình trước khi model bắt đầu sinh token.

Logit Penalties & Attention Biasing: Kỹ thuật nâng cao (như trong Classifier-Free Guidance của Diffusion model áp dụng cho LLM) thực hiện phép trừ xác suất: P(output) ∝ P(positive) - λ·P(negative). Nếu token "hallucination" có xác suất cao trong positive path, nhưng bị trừ đi một hệ số lớn từ negative constraint, nó sẽ bị đẩy xuống dưới ngưỡng sampling.

Constitutional AI: Phương pháp của Anthropic sử dụng "bộ hiến pháp" gồm các nguyên tắc phủ định để đánh giá output trước khi hiển thị cho người dùng — chính là ứng dụng negative constraint để lọc nhiễu.

Tại sao "Không" mạnh hơn "Có"?

Tâm lý nhận thức: Con người dễ dàng chỉ ra điều sai hơn là định nghĩa điều hoàn hảo. Bạn có thể ngay lập tức nói "câu này sai ngữ pháp" nhưng khó mô tả "câu hoàn hảo trông thế nào". AI cũng vậy — việc tránh né các mode lỗi có tính xác định cao hơn việc săn tìm mode lý tưởng.

Phân phối xác suất: Khi bạn yêu cầu "viết hay", AI phân phối xác suất rộng trên cả biển các khả năng "hay" khác nhau. Nhưng khi bạn cấm "dùng từ 'delve into', 'leverage', 'tapestry'", AI loại bỏ ngay một vùng rõ ràng, làm phân phối còn lại tập trung hơn vào các lựa chọn khả thi.

Hallucination control: Positive prompting "hãy dùng số liệu chính xác" rất mơ hồ. Negative prompting "tuyệt đối không được bịa số liệu; nếu không có dữ liệu, hãy nói 'Không đủ thông tin'" rõ ràng và kiểm soát được.

Ví dụ thực tế

Phân tích tài chính (Tránh bịa số liệu)

Cách thông thường (sai lầm):

Phân tích doanh thu quý 3 của công ty X.

Áp dụng Kế 16 — Negative Prompting:

Phân tích doanh thu dựa trên báo cáo được cung cấp.
Constraints:
- Do not fabricate revenue figures.
- Do not cite external reports not mentioned in context.
- If a data point is missing, explicitly state "Data unavailable" rather than estimating.
- Avoid interpretive adjectives like "strong," "weak," or "concerning" unless supported by explicit trend analysis.

Kết quả: Thay vì AI "tự tin" bịa ra con số 15% tăng trưởng để làm vừa lòng câu hỏi, nó sẽ trả về báo cáo thận trọng với các khoảng trống được đánh dấu rõ ràng, giảm thiểu rủi ro hallucination từ 23% xuống còn 7% (theo nghiên cứu trên LegalBench).

Viết content marketing (Tránh giọng AI đặc trưng)

Negative Prompt mẫu cho bài LinkedIn:

Write a post about remote work culture.
Negative constraints:
- Do not use buzzwords: "delve," "leverage," "game-changer," "synergy," "tapestry," "landscape."
- Do not write in bullet points followed by explanatory paragraphs (the "LinkedIn listicle" format).
- Do not include a call-to-action asking readers to "comment below" or "share thoughts."
- Avoid the opening pattern: "In today's fast-paced world..."

Hiệu quả: Content creator Việt Nam thường nhận xét AI viết có "giọng đều đều ngang phè phè như đang liệt kê kể chuyện". Bằng cách cấm các pattern cliché này, buộc AI phải tìm các cấu trúc văn bản ít phổ biến hơn trong training data — thường là những văn phong tự nhiên, gần gũi hơn.

Code review an toàn (Security)

Prompt cho AI reviewer:

Review the following Python function for security issues.
Hard constraints:
- Do not suggest using regex to parse HTML under any circumstances.
- Do not ignore potential SQL injection vectors in string concatenation.
- Do not propose eval() or exec() as solutions.
- If you identify a race condition, you must not provide a fix that introduces new concurrency hazards.

Logic: Lập trình viên senior biết rõ "cái gì không được làm" (anti-patterns) hơn là "cái gì là giải pháp tốt nhất". Negative constraint đảm bảo AI không đề xuất các "giải pháp" nguy hiểm chỉ vì chúng phổ biến trong training data.

Ứng dụng

Sinh viên & Nghiên cứu khoa học

  • Trích dẫn: "Do not cite papers that are not explicitly listed in the provided bibliography." — Tránh AI bịa ra các nguồn "Smith et al., 2023" không tồn tại.
  • Phương pháp: "Do not suggest methodologies involving human subjects without mentioning IRB approval requirements."

Marketing & Content Creator

  • Tone giọng: "Avoid AI-sounding phrases: 'In the ever-evolving landscape of...', 'It is important to note that...', 'As we navigate the...'" — Tạo ra văn bản khó phát hiện là AI viết (bypass Originality.ai detection).
  • SEO: "Do not engage in keyword stuffing. Do not use exact-match phrases more than twice per 500 words."

Pháp lý & Y tế (High-stakes)

  • Pháp lý: "Do not interpret regulations as personal legal advice. Do not apply statutory law to hypothetical scenarios without 'This is not legal advice' disclaimer."
  • Y tế: "Do not diagnose medical conditions. Do not recommend specific drug dosages. If symptoms are described, only suggest 'Consult a physician.'"

Kỹ thuật & DevOps

  • Infrastructure: "Do not suggest hardcoding API keys. Do not ignore error handling for network timeouts. Do not use 'latest' tag in Docker images."
  • Algorithm: "Do not use bubble sort for large datasets. Do not ignore Big-O complexity in recommendations."

So sánh

Tiêu chíPositive Prompting (Chỉ định tích cực)Negative Prompting (Thanh Đông kích Tây)
Chiến lượcTìm kiếm kim cương trong mỏ đáLoại bỏ đá để để lộ kim cương
Độ khóKhó — không gian "đúng" quá rộngDễ hơn — lỗi thường tập trung, dễ nhận diện
Kiểm soát lỗiKém — AI có thể "sáng tạo" ra lỗi mớiTốt — cấm được pattern là loại được cả lớp lỗi
HallucinationDễ xảy ra khi ép sáng tạoGiảm đáng kể khi cấm fabrication
Độ dài promptCần nhiều ví dụ few-shot để diễn tả "đúng"Ngắn gọn — danh sách cấm thường súc tích
Thích hợp choBrainstorm, creative writing, artKỹ thuật, pháp lý, y tế, code review

Kết luận: Positive prompting giống như dẫn đường bằng ánh đèn pin trong đêm — bạn chỉ soi được điểm đang đến. Negative prompting như xây hàng rào dọc vực thẳm — dù không biết đích đến chính xác, bạn chắc chắn không rơi xuống vực. Trong các tác vụ high-stakes, kết hợp cả hai (chỉ hướng Đông để đánh Tây, nghĩa là dùng positive định hướng tổng thể và negative lọc nhiễu chi tiết) mới là đỉnh cao của nghệ thuật dùng AI.

Bài viết liên quan

Cùng cụm "Kế hư thực" (Level 1)

Đọc tiếp

On this page