Harness Engineering vs Context Engineering: Ranh giới ở đâu?
Phân biệt Context Engineering (đưa thông tin) và Harness Engineering (thiết kế môi trường). Tại sao SWE-agent tăng 64% hiệu suất nhờ thay đổi interface?
Định nghĩa
Context Engineering là nghệ thuật đưa đúng thông tin vào context window của AI. Harness Engineering là thiết kế toàn bộ môi trường — bao gồm tools, permissions, feedback loops và guardrails — mà AI tương tác để hoàn thành nhiệm vụ. Ranh giới nằm ở chỗ: Context là "cái AI nhìn thấy", Harness là "cái AI sống và hành động trong đó".
Giải thích chi tiết
Từ "Nhét dữ liệu" sang "Thiết kế môi trường"
Level 1 (Context) tập trung vào việc nhét thông tin đúng vào đầu AI — RAG, memory management, chunking. Đây là paradigm của "Input preparation": bạn có trách nhiệm đảm bảo AI "biết" mọi thứ cần thiết trước khi suy nghĩ.
Level 2 (Harness) dịch chuyển sang "Environment design". Không chỉ quan tâm AI biết gì, mà là AI dùng kiến thức đó để làm gì trong một hệ sinh thái được thiết kế. Đây là sự chuyển đổi từ "đọc tài liệu" sang "làm việc trong một workspace được trang bị công cụ".
Context là Input, Harness là Environment
Context window giống như RAM — tạm thời, volatile, mất đi khi session kết thúc. Bạn có thể nhét vào đó 100K tokens tài liệu, nhưng khi conversation reset, mọi thứ biến mất.
Harness giống như cả hệ điều hành và workspace — nơi AI có thể thực thi lệnh (bash), lưu trữ kết quả trung gian (checkpoint), và nhận phản hồi từ thế giới thực (test pass/fail). AI không chỉ "đọc" context, nó "tác động lên" harness thông qua Agent-Computer Interface (ACI).
The Interface Hypothesis (SWE-agent)
Paper SWE-agent của Princeton NLP chứng minh điều mà nhiều engineer bỏ qua: Cùng một model (GPT-4), cùng task (sửa bug software), cùng lượng context (code repository), nhưng thay đổi cách trình bày code (file view linh hoạt), search tools (semantic + syntactic), và edit actions (syntax chuẩn hóa) — hiệu suất tăng 64%.
Điều này cho thấy bottleneck không phải model capability hay context completeness, mà là Agent-Computer Interface (ACI) — trái tim của Harness Engineering.
Ví dụ thực tế
Chatbot hỗ trợ khách hàng thông minh
Context Engineering approach: Cho AI đọc lịch sử chat, policy công ty, FAQ, thông tin đơn hàng qua RAG. AI trả lời khách: "Theo chính sách, bạn có thể đổi trả trong vòng 7 ngày kể từ khi nhận hàng."
Harness Engineering approach: Thiết kế một hệ thống nơi AI có thể:
- Query database kiểm tra tình trạng đơn hàng thực tế
- Tạo ticket đổi trả tự động qua API
- Gửi email xác nhận cho khách hàng
- Trigger hoàn tiền qua payment gateway (với permission check và xác nhận 2 bước)
Ranh giới rõ rệt: Context cho AI "biết" chính sách là 7 ngày. Harness cho AI "thực hiện" đổi trả ngay trong cuộc hội thoại mà không cần nhân viên can thiệp. Context là tri thức, Harness là hành động.
AI Coding Assistant (SWE-agent)
Context: Đưa toàn bộ code repository vào prompt (hoặc retrieval thông minh qua RAG).
Harness: Thiết kế ACI với:
- File viewer: Hiển thị code theo từng khối logic với line numbers thay vì raw text
- Search tools: Cho phép tìm kiếm cả theo tên hàm (syntactic) và theo mô tả chức năng (semantic)
- Edit interface: Command
edit <file> <line_start>:<line_end> <new_code>với validation syntax - Test runner: Feedback loop tức thì — AI chạy test và thấy kết quả pass/fail ngay lập tức
Kết quả thực tế: Cùng GPT-4, nhưng harness tốt giúp AI sửa được nhiều bug hơn 64% so với việc chỉ đưa context code thuần túy vào prompt. Model không đổi, context không đổi, chỉ có cách AI tương tác với môi trường thay đổi.
Ứng dụng
Cho AI Engineer đang transition từ Level 1
Nếu bạn đang optimize RAG pipeline, chunking strategy, hay embedding models, bạn đang ở Context Engineering. Để lên Level 2, hãy bắt đầu hỏi: "Sau khi AI đọc xong tài liệu, nó cần làm gì với thông tin đó?" → Thiết kế tools và actions thay vì chỉ optimize retrieval accuracy.
Cho Tech Lead thiết kế Agent System
Đừng chỉ focus vào "AI có đủ thông minh không?" (model capability) hay "AI có đọc đủ tài liệu không?" (context completeness). Hãy optimize ACI: Tool nào cần thiết? Permission nào cần phân quyền? Feedback loop nào giúp AI biết hành động thành công hay thất bại?
Cho Startup xây dựng AI-native Product
Model (GPT-4, Claude, Gemini) là commodity — ai cũng có thể dùng API. Context (RAG trên dữ liệu riêng của bạn) là competitive advantage ngắn hạn. Harness (cách bạn thiết kế interaction patterns, tool ecosystem, guardrails cụ thể) là IP thực sự và moat dài hạn. Đầu tư vào harness engineering, không phải fine-tune model.
So sánh
| Tiêu chí | Context Engineering (Level 1) | Harness Engineering (Level 2) |
|---|---|---|
| Focus | Đưa đúng thông tin vào prompt | Thiết kế môi trường tương tác |
| Scope | Input preparation | System architecture |
| Key Skills | RAG, Chunking, Embedding, Memory management | Tool design, ACI, Feedback loops, Permission systems |
| Metrics | Retrieval accuracy, Relevance score | Task completion rate, Error recovery time, Action success |
| Analogies | RAM, Short-term memory | OS + Workspace + IDE |
| Bottleneck giải quyết | "AI không biết gì?" | "AI không làm được gì?" |
| Ví dụ | Cho AI đọc 100 tài liệu về Python | Cho AI có thể chạy pytest và đọc kết quả |
Kết luận: Context Engineering giải quyết vấn đề "AI biết gì trong đầu". Harness Engineering giải quyết vấn đề "AI làm gì trong thực tế". Bạn có thể có context hoàn hảo nhất — đầy đủ tài liệu, chính xác, relevant — nhưng nếu harness tệ (tools lỗi, permission rối, feedback chậm), AI vẫn thất bại trong việc hoàn thành nhiệm vụ.
Bài viết liên quan
Cùng cụm "Nền tảng Harness"
Harness Engineering là gì?
Định nghĩa tổng quan về Harness Engineering và tại sao nó quan trọng hơn model
Tiến hóa: Prompt → Context → Harness
Dòng chảy tiến hóa từ viết câu hỏi đến thiết kế cả hệ thống cho AI
Agent-Computer Interface (ACI)
Chi tiết về ACI — trái tim của Harness Engineering, nơi quyết định AI tương tác với máy tính như thế nào
Bài học từ SWE-agent: +64% hiệu suất
Phân tích sâu paper Princeton chứng minh harness quan trọng hơn model
Đọc tiếp
Tool & Permission Design
Khi đã hiểu Harness vs Context, học cách thiết kế tools cụ thể và phân quyền cho agent
Feedback Loops & Quality Gates
Xây dựng feedback loops để AI học từ hành động trong harness và self-correct
Context Engineering thực chiến
Quay lại Level 1 để xem cầu nối từ Context sang Harness — khi nào bạn đã sẵn sàng nhảy level?
Bài học từ SWE-agent: +64% hiệu suất chỉ nhờ thiết kế interface
Phân tích paper SWE-agent Princeton: Cùng GPT-4, chỉ đổi cách AI tương tác với code đã tăng hiệu suất 64%. Bằng chứng cho thấy Harness Engineering quan trọng...
Tool Design cho Agent: Giới hạn kết quả, format output
Cách thiết kế Tool cho Agent AI: tại sao giới hạn 50 kết quả, dùng line numbers, và format output để AI đọc hiểu tốt hơn. Kỹ thuật ACI từ Claude Code và SWE-...