Harness Engineering vs Context Engineering: Ranh giới ở đâu?

Phân biệt Context Engineering (đưa thông tin) và Harness Engineering (thiết kế môi trường). Tại sao SWE-agent tăng 64% hiệu suất nhờ thay đổi interface?

Định nghĩa

Context Engineering là nghệ thuật đưa đúng thông tin vào context window của AI. Harness Engineering là thiết kế toàn bộ môi trường — bao gồm tools, permissions, feedback loops và guardrails — mà AI tương tác để hoàn thành nhiệm vụ. Ranh giới nằm ở chỗ: Context là "cái AI nhìn thấy", Harness là "cái AI sống và hành động trong đó".

Giải thích chi tiết

Từ "Nhét dữ liệu" sang "Thiết kế môi trường"

Level 1 (Context) tập trung vào việc nhét thông tin đúng vào đầu AI — RAG, memory management, chunking. Đây là paradigm của "Input preparation": bạn có trách nhiệm đảm bảo AI "biết" mọi thứ cần thiết trước khi suy nghĩ.

Level 2 (Harness) dịch chuyển sang "Environment design". Không chỉ quan tâm AI biết gì, mà là AI dùng kiến thức đó để làm gì trong một hệ sinh thái được thiết kế. Đây là sự chuyển đổi từ "đọc tài liệu" sang "làm việc trong một workspace được trang bị công cụ".

Context là Input, Harness là Environment

Context window giống như RAM — tạm thời, volatile, mất đi khi session kết thúc. Bạn có thể nhét vào đó 100K tokens tài liệu, nhưng khi conversation reset, mọi thứ biến mất.

Harness giống như cả hệ điều hành và workspace — nơi AI có thể thực thi lệnh (bash), lưu trữ kết quả trung gian (checkpoint), và nhận phản hồi từ thế giới thực (test pass/fail). AI không chỉ "đọc" context, nó "tác động lên" harness thông qua Agent-Computer Interface (ACI).

The Interface Hypothesis (SWE-agent)

Paper SWE-agent của Princeton NLP chứng minh điều mà nhiều engineer bỏ qua: Cùng một model (GPT-4), cùng task (sửa bug software), cùng lượng context (code repository), nhưng thay đổi cách trình bày code (file view linh hoạt), search tools (semantic + syntactic), và edit actions (syntax chuẩn hóa) — hiệu suất tăng 64%.

Điều này cho thấy bottleneck không phải model capability hay context completeness, mà là Agent-Computer Interface (ACI) — trái tim của Harness Engineering.

Ví dụ thực tế

Chatbot hỗ trợ khách hàng thông minh

Context Engineering approach: Cho AI đọc lịch sử chat, policy công ty, FAQ, thông tin đơn hàng qua RAG. AI trả lời khách: "Theo chính sách, bạn có thể đổi trả trong vòng 7 ngày kể từ khi nhận hàng."

Harness Engineering approach: Thiết kế một hệ thống nơi AI có thể:

Query database kiểm tra tình trạng đơn hàng thực tế
Tạo ticket đổi trả tự động qua API
Gửi email xác nhận cho khách hàng
Trigger hoàn tiền qua payment gateway (với permission check và xác nhận 2 bước)

Ranh giới rõ rệt: Context cho AI "biết" chính sách là 7 ngày. Harness cho AI "thực hiện" đổi trả ngay trong cuộc hội thoại mà không cần nhân viên can thiệp. Context là tri thức, Harness là hành động.

AI Coding Assistant (SWE-agent)

Context: Đưa toàn bộ code repository vào prompt (hoặc retrieval thông minh qua RAG).

Harness: Thiết kế ACI với:

File viewer: Hiển thị code theo từng khối logic với line numbers thay vì raw text
Search tools: Cho phép tìm kiếm cả theo tên hàm (syntactic) và theo mô tả chức năng (semantic)
Edit interface: Command edit <file> <line_start>:<line_end> <new_code> với validation syntax
Test runner: Feedback loop tức thì — AI chạy test và thấy kết quả pass/fail ngay lập tức

Kết quả thực tế: Cùng GPT-4, nhưng harness tốt giúp AI sửa được nhiều bug hơn 64% so với việc chỉ đưa context code thuần túy vào prompt. Model không đổi, context không đổi, chỉ có cách AI tương tác với môi trường thay đổi.

Ứng dụng

Cho AI Engineer đang transition từ Level 1

Nếu bạn đang optimize RAG pipeline, chunking strategy, hay embedding models, bạn đang ở Context Engineering. Để lên Level 2, hãy bắt đầu hỏi: "Sau khi AI đọc xong tài liệu, nó cần làm gì với thông tin đó?" → Thiết kế tools và actions thay vì chỉ optimize retrieval accuracy.

Cho Tech Lead thiết kế Agent System

Đừng chỉ focus vào "AI có đủ thông minh không?" (model capability) hay "AI có đọc đủ tài liệu không?" (context completeness). Hãy optimize ACI: Tool nào cần thiết? Permission nào cần phân quyền? Feedback loop nào giúp AI biết hành động thành công hay thất bại?

Cho Startup xây dựng AI-native Product

Model (GPT-4, Claude, Gemini) là commodity — ai cũng có thể dùng API. Context (RAG trên dữ liệu riêng của bạn) là competitive advantage ngắn hạn. Harness (cách bạn thiết kế interaction patterns, tool ecosystem, guardrails cụ thể) là IP thực sự và moat dài hạn. Đầu tư vào harness engineering, không phải fine-tune model.

So sánh

Tiêu chí	Context Engineering (Level 1)	Harness Engineering (Level 2)
Focus	Đưa đúng thông tin vào prompt	Thiết kế môi trường tương tác
Scope	Input preparation	System architecture
Key Skills	RAG, Chunking, Embedding, Memory management	Tool design, ACI, Feedback loops, Permission systems
Metrics	Retrieval accuracy, Relevance score	Task completion rate, Error recovery time, Action success
Analogies	RAM, Short-term memory	OS + Workspace + IDE
Bottleneck giải quyết	"AI không biết gì?"	"AI không làm được gì?"
Ví dụ	Cho AI đọc 100 tài liệu về Python	Cho AI có thể chạy `pytest` và đọc kết quả

Kết luận: Context Engineering giải quyết vấn đề "AI biết gì trong đầu". Harness Engineering giải quyết vấn đề "AI làm gì trong thực tế". Bạn có thể có context hoàn hảo nhất — đầy đủ tài liệu, chính xác, relevant — nhưng nếu harness tệ (tools lỗi, permission rối, feedback chậm), AI vẫn thất bại trong việc hoàn thành nhiệm vụ.

Harness Engineering vs Context Engineering: Ranh giới ở đâu?

Định nghĩa

Giải thích chi tiết

Từ "Nhét dữ liệu" sang "Thiết kế môi trường"

Context là Input, Harness là Environment

The Interface Hypothesis (SWE-agent)

Ví dụ thực tế

Chatbot hỗ trợ khách hàng thông minh

AI Coding Assistant (SWE-agent)

Ứng dụng

Cho AI Engineer đang transition từ Level 1

Cho Tech Lead thiết kế Agent System

Cho Startup xây dựng AI-native Product

So sánh

Bài viết liên quan

Cùng cụm "Nền tảng Harness"

Harness Engineering là gì?

Tiến hóa: Prompt → Context → Harness

Agent-Computer Interface (ACI)

Bài học từ SWE-agent: +64% hiệu suất

Đọc tiếp

Tool & Permission Design

Feedback Loops & Quality Gates

Context Engineering thực chiến

On this page