Giới hạn của AI

AI có thể viết code nhưng vẫn thường hallucinate, quên ngữ cảnh dài và mắc lỗi logic. Hiểu rõ giới hạn của LLM giúp bạn dùng AI hiệu quả hơn.

Định nghĩa

Giới hạn của AI (đặc biệt là Large Language Models) là những ràng buộc vốn có từ kiến trúc next-token prediction và quá trình huấn luyện, khiến AI thường xuyên sinh ra thông tin sai lệch, thiếu khả năng lập luận logic sâu và bị cô lập với thế giới thực sau ngày cắt dữ liệu.

Giải thích chi tiết

Giới hạn bộ nhớ ngữ cảnh (Context Window)

Dù ChatGPT hay Claude có vẻ "nhớ" cuộc trò chuyện, thực chất chúng chỉ xử lý một cửa sổ token cố định (thường từ 4K đến 200K token). Khi cuộc trò chuyện vượt quá giới hạn này, AI phải "quên" phần đầu để xử lý phần mới.

Đặc biệt, hiện tượng "lost in the middle" (mất dữ liệu ở giữa) cho thấy AI thường bỏ lỡ thông tin nằm giữa đoạn văn dài, dù chúng nằm trong context window. Điều này giải thích vì sao AI hay bỏ qua yêu cầu sửa đổi thứ 5 trong danh sách 10 yêu cầu của bạn.

Ảo giác và dự đoán sai lệch (Hallucination)

Hallucination không phải lỗi lập trình mà là đặc tính của cơ chế dự đoán token. AI được tối ưu để tạo ra chuỗi từ "có vẻ hợp lý nhất" về mặt thống kê, không phải "đúng nhất" về mặt sự thật.

Khi gặp câu hỏi về chủ đề ít dữ liệu huấn luyện, AI không nói "tôi không biết" mà tự tin dự đoán token tiếp theo, tạo ra thông tin sai lệch nhưng trôi chảy. Đây là lý do AI có thể bịa ra luật pháp, nghiên cứu khoa học không tồn tại, hoặc chi tiết lịch sử hoàn toàn sai.

Ngày cắt kiến thức (Knowledge Cutoff)

LLM là "bản chụp" dữ liệu tại thời điểm huấn luyện. GPT-4 không biết sự kiện sau tháng 4/2024, Claude không biết sau tháng đào tạo của nó. Không có kết nối internet tự nhiên, không có khả năng tra cứu thời gian thực trừ khi được kết nối công cụ tìm kiếm (RAG hoặc function calling).

Suy luận logic và toán học

AI thường trả lời sai các bài toán đòi hỏi nhiều bước suy luận hoặc logic chặt chẽ, dù giải thích nghe có vẻ thuyết phục. Đây là hạn chế của kiến trúc Transformer: chúng xử lý song song (parallel) tất cả token thay vì tuần tự (sequential) như con người suy nghĩ.

Ví dụ, AI thường sai khi tính toán phức tạp hoặc logic đa bước: "Nếu A > B và B > C thì A so với C như thế nào?" – câu hỏi đơn giản với người nhưng AI vẫn có thể lẫn lộn nếu không được prompt cẩn thận.

Thiên kiến và căn chỉnh giá trị (Bias & Alignment)

AI không trung lập. Dữ liệu huấn luyện từ internet chứa đầy thiên kiến về văn hóa, chính trị, giới tính. Các kỹ thuật Alignment (RLHF) giúp AI "lịch sự" hơn nhưng cũng có thể tạo ra thiên kiến mới hoặc từ chối trả lời các chủ đề hợp lệ do quá nhạy cảm với an toàn.

Thiếu hiểu biết ngữ nghĩa thực sự

Theo phân tích trong bài AI có hiểu không hay chỉ dự đoán, AI thành thạo cú pháp (syntax) nhưng không có ngữ nghĩa (semantics) thực sự. Chúng không "hiểu" ý nghĩa đằng sau từ ngữ như con người; chỉ là mô hình thống kê tính toán xác suất liên kết giữa các pattern.

Ví dụ thực tế

Luật Đất đai 2024 và văn bản pháp luật mới

Luật Đất đai 2024 có hiệu lực từ 01/08/2024, nhưng hầu hết LLM được huấn luyện trước thời điểm này. Khi luật sư nhờ AI soạn hợp đồng chuyển nhượng đất, AI có thể áp dụng các quy định cũ đã bãi bỏ (về thời hạn sử dụng đất, điều kiện chuyển nhượng) hoặc bịa ra điều khoản không tồn tại. Tin tưởng hoàn toàn vào bản soạn thảo này sẽ dẫn đến hợp đồng vô hiệu và rủi ro pháp lý nghiêm trọng.

Tính toán thuế thu nhập cá nhân phức tạp

Nhân viên kế toán nhờ AI tính thuế TNCN cho trường hợp đặc biệt: thu nhập từ nhiều nguồn (lương, đầu tư, kinh doanh), giảm trừ gia cảnh phức tạp (nuôi người già, con học đại học). AI có thể áp dụng sai thuế suất, quên điều khoản mới về giảm trừ, hoặc tính sai số liệu do lẫn lộn giữa năm 2023 và 2024. Kết quả là tờ khai thuế sai lệch, dẫn đến phạt chậm nộp hoặc nộp thừa.

Chatbot Shopee/Grab và khuyến mãi thời gian thực

Khi khách hàng hỏi bot hỗ trợ về "flash sale đang diễn ra lúc 14:00 hôm nay" hoặc "voucher GrabBike giảm 50% còn hiệu lực không", AI không truy cập được cơ sở dữ liệu thời gian thực. Thay vì thừa nhận không biết, AI có thể đưa ra thông tin khuyến mãi cũ từ tháng trước hoặc hallucinate mã giảm giá không tồn tại, gây ức chế cho khách hàng khi áp dụng không được.

Ứng dụng

Sinh viên

Dùng AI để brainstorm ý tưởng, cấu trúc bài luận, hoặc giải thích khái niệm cũ – nhưng không dùng để tra cứu sự kiện lịch sử, luật mới, hoặc dữ liệu khoa học mà không verify. Luôn kiểm tra nguồn chính thống khi trích dẫn từ AI. Sử dụng prompt kỹ thuật (chain-of-thought) để giảm lỗi logic khi giải toán.

Người đi làm

Kỹ sư phần mềm: AI viết code phải được review và test trước khi merge; đặc biệt cẩn thận với logic nghiệp vụ phức tạp.
Marketing/Content: Fact-check mọi số liệu, tên người, năm tháng do AI tạo ra; dùng AI cho sáng tạo nội dung, không dùng cho fact-finding.
Tài chính/Pháp lý: Không để AI tự động ra quyết định mà không có giám sát chuyên gia; luôn có "human in the loop" cho hợp đồng và báo cáo thuế.

Doanh nghiệp

Xây dựng hệ thống RAG (Retrieval-Augmented Generation) để bổ sung kiến thức mới cho AI, thay vì dựa vào kiến thức có sẵn của model. Triển khai guardrails để phát hiện hallucination trong chatbot khách hàng. Không thay thế hoàn toàn nhân viên hỗ trợ bằng AI cho các vấn đề pháp lý, y tế, hoặc tài chính quan trọng. Đầu tư vào đào tạo nhân viên hiểu rõ giới hạn để tránh "tin tưởng mù quáng" (automation bias).

So sánh

Biểu hiện bề ngoài	Cơ chế kỹ thuật thực tế	Giới hạn cố hữu
Trả lời lưu loát, tự tin	Dự đoán token dựa trên pattern thống kê trong training data	Có thể tạo ra "sự thật" hoàn toàn sai lệch nhưng nghe hợp lý về mặt ngữ pháp
Nhớ ngữ cảnh cuộc trò chuyện	Lưu trữ token trong context window giới hạn (fixed-size)	Quên thông tin đầu cuộc trò chuyện khi quá dài; bỏ qua dữ liệu ở giữa văn bản dài
Hiểu ngôn ngữ tự nhiên	Tính toán attention weights giữa các token	Không có "ý thức" về ý nghĩa; chỉ là correlation statistics giữa pattern
Biết nhiều thứ đến năm 2024	Dữ liệu huấn luyện có ngày cắt cố định (cutoff date)	Không biết sự kiện sau ngày cắt; không truy cập internet tự nhiên
Thông minh như con người	Pattern matching trên dữ liệu lớn	Thất bại với logic đa bước, toán học chính xác, và các tình huống ngoài phân phối dữ liệu huấn luyện

Kết luận: AI là công cụ mạnh mẽ cho sáng tạo và xử lý ngôn ngữ, nhưng là công cụ nguy hiểm nếu dùng cho tra cứu facts hoặc ra quyết định quan trọng không có giám sát. Hiểu rõ giới hạn giúp bạn đặt AI vào đúng vị trí: trợ lý thông minh, không phải chuyên gia tuyệt đối.