Bảo mật và quyền riêng tư khi dùng AI tool

Cách bảo vệ dữ liệu cá nhân khi dùng ChatGPT, Claude hay Midjourney. Guide thực tế để không bị 'rò rỉ' thông tin nhạy cảm khi làm việc với AI.

Định nghĩa

Khi bạn chat với ChatGPT hay upload ảnh lên Midjourney, dữ liệu đó không chỉ "bay vào không khí" — nó được lưu trữ trên server, có thể được phân tích để cải thiện mô hình, và trong một số trường hợp, con người có thể xem lại để kiểm tra lỗi. Bảo mật khi dùng AI nghĩa là: hiểu rõ dữ liệu nào bạn đang cho AI "xem", và kiểm soát dữ liệu đó đi đâu sau đó.

Giải thích chi tiết

Vì sao AI tool "nhớ" mọi thứ bạn nói?

Khác với Google Search — nơi bạn tìm kiếm và rời đi — các AI tool như Claude hay ChatGPT được thiết kế để có "trí nhớ" cuộc trò chuyện. Điều này giúp bạn hỏi tiếp "câu sau dựa trên câu trước", nhưng cũng nghĩa là nội dung bạn nhập được lưu lại.

Với bản miễn phí, dữ liệu này thường được dùng để huấn luyện lại (training) mô hình, giúp AI thông minh hơn — nhưng đồng nghĩa với việc bạn đang "đóng góp" dữ liệu cho hệ thống. Điều này không khác gì bạn đăng bài lên một diễn đàn công khai: nội dung tồn tại trên server của người khác, và bạn mất quyền kiểm soát tuyệt đối.

Những thứ tuyệt đối không nên cho AI xem

Đừng bao giờ đưa vào prompt: số CCCD, mật khẩu tài khoản ngân hàng, thông tin bệnh án chi tiết có danh tính, tài liệu mật của công ty chưa công bố, hoặc source code chứa API key/private key.

Một quy tắc đơn giản: nếu bạn không đăng nó lên Facebook công khai, thì cũng không nên paste vào ChatGPT miễn phí. AI không phải người bạn tri kỷ trong phòng kín — mà là một dịch vụ cloud có thể bị data breach hoặc dùng dữ liệu để train model.

Các chế độ "kín đáo" trong AI tool hiện đại

Hầu hết các tool hiện nay đều có lựa chọn riêng tư, nhưng chúng thường tắt mặc định:

ChatGPT: Bật "Temporary Chat" (biểu tượng cái nón ở góc trên) để cuộc trò chuyện không lưu vào lịch sử, không dùng cho training. Hoặc vào Settings → Data controls → tắt "Improve the model for everyone".
Claude: Trong Settings có tùy chọn không dùng data để train model. Lưu ý rằng lịch sử chat vẫn được lưu để bạn xem lại, trừ khi bạn xóa thủ công.
Midjourney: Mặc định mọi ảnh tạo ra đều vào public gallery. Muốn giữ bí mật, phải dùng Stealth Mode (chỉ có ở gói Pro).
Google Gemini: Có thể tắt "Gemini Apps Activity" để không lưu lịch sử vào tài khoản Google.

Sự khác biệt: Miễn phí vs Trả phí vs Local

Gói miễn phí thường theo mô hình "đổi data lấy dịch vụ" — bạn dùng free, họ dùng data bạn để cải thiện AI. Gói trả phí (Plus, Pro) và đặc biệt là Enterprise thường cam kết:

Data không dùng để training
Mã hóa đầu cuối (end-to-end encryption)
Tuân thủ GDPR (châu Âu) và các quy định local như Nghị định 13/2023/NĐ-CP (Việt Nam) về bảo vệ dữ liệu cá nhân

Nếu bạn cực kỳ thận trọng, có thể dùng Local AI (chạy trên máy tính riêng như Ollama, LM Studio, hoặc PrivateGPT) — dữ liệu không bao giờ rời khỏi máy bạn, nhưng chất lượng thường yếu hơn so với cloud AI và đòi hỏi máy tính có cấu hình khá mạnh.

Ví dụ thực tế

Copywriter viết case study cho ngân hàng

Bạn cần viết bài PR cho khách hàng ngân hàng, có số liệu doanh thu thật nội bộ. Thay vì paste báo cáo PDF nguyên văn vào ChatGPT:

Sai: "Ngân hàng TMCP ABC có trụ sở tại 123 Lê Lợi, Q1, TP.HCM, mã số thuế [mã số thuế], báo cáo quý 3/2024 lãi 500 tỷ đồng từ dịch vụ thẻ tín dụng..."

Đúng: "Một ngân hàng thương mại cổ phần lớn tại Việt Nam, mã định danh [xxx], báo cáo quý 3/2024 lãi [yyy] tỷ từ dịch vụ thẻ..."

Sau khi AI viết xong, bạn thay [xxx] và [yyy] bằng số thật trên máy tính. Bài viết vẫn đầy đủ thông tin, nhưng dữ liệu nhạy cảm không bao giờ đi qua server của OpenAI.

Sinh viên hỏi về triệu chứng bệnh của người thân

Bạn muốn hỏi Claude về triệu chứng đau ngực, khó thở của bố để hiểu trước khi đi khám (không thay thế bác sĩ, chỉ để chuẩn bị tâm lý).

Rủi ro: "Bố tôi tên Nguyễn Văn A, 55 tuổi, làm giám đốc công ty X ở Hà Nội, số điện thoại [số điện thoại], bị đau ngực trái..."

An toàn: "Một nam giới trung niên (50-60 tuổi), sống ở miền Bắc Việt Nam, có tiền sử hút thuốc, bị đau ngực trái khi gắng sức, kèm khó thở. Triệu chứng này thường gợi ý bệnh lý nào cần khám?"

AI vẫn cho lời khuyên y tế chung chính xác (khám tim mạch, làm ECG...), nhưng không ai có thể link thông tin này với danh tính cụ thể của gia đình bạn nếu data bị leak.

Designer tạo mockup sản phẩm chưa ra mắt

Startup của bạn đang phát triển điện thoại gập với tính năng độc quyền "màn hình Z-Flex 2025". Bạn dùng Midjourney để tạo concept quảng cáo.

Rủi ro: Prompt "smartphone with Z-Flex 2025 hinge technology, purple titanium frame, three camera layout like [bí mật thiết kế]" sẽ lưu vào public gallery của Midjourney. Đối thủ có thể tìm thấy và đoán ra sản phẩm chưa ra mắt.

Giải pháp:

Dùng từ chung chung: "foldable smartphone with unique triple hinge, metallic purple frame, minimalist camera layout"
Hoặc bật Stealth Mode (yêu cầu gói Pro) để ảnh không hiện trên public feed
Hoặc dùng local image generation (Stable Diffusion trên máy tính) cho giai đoạn concept nhạy cảm

Ứng dụng

Người dùng cá nhân

Luôn vào Settings tắt "Improve the model for everyone" trong ChatGPT/Claude nếu không muốn data dùng cho training.
Không scan/upload ảnh CCCD, giấy tờ nhà đất, hoặc ảnh riêng tư nhạy cảm lên AI image generators miễn phí (Midjourney, Leonardo).
Dùng "Temporary Chat" cho các câu hỏi về tình cảm cá nhân, vấn đề sức khỏe nhạy cảm, hoặc bí mật gia đình.

Người đi làm (Freelancer & Corporate)

Kỹ thuật Anonymize: Thay tên công ty thật bằng "Client A", "Một tập đoàn bán lẻ lớn tại VN", thay địa điểm bằng "một thành phố lớn phía Nam".
Kiểm tra chính sách AI của công ty bạn: một số tập đoàn (Samsung, Apple, JP Morgan) cấm hoàn toàn dùng public AI cho data nội bộ trên mạng công cộng.
Dùng tài khoản Enterprise (ChatGPT Team/Enterprise, Claude for Work) nếu xử lý data khách hàng — đây là yêu cầu pháp lý ở nhiều quốc gia tuân thủ GDPR hay Nghị định 13/2023/NĐ-CP.

Doanh nghiệp & Tổ chức

Ký Data Processing Agreement (DPA) với vendor AI (OpenAI, Anthropic) trước khi triển khai — đảm bảo họ không lưu hoặc train trên data bạn.
Cân nhắc self-hosted AI (chạy trên server riêng của công ty) cho ngành nhạy cảm như y tế, luật, chứng khoán, quân sự.
Training nhân viên về "AI Hygiene": xóa lịch sử chat định kỳ, không dùng AI miễn phí để paste code chứa API key, không upload database khách hàng lên ChatGPT web.

So sánh

Tiêu chí	AI Công khai miễn phí (ChatGPT Free)	AI Trả phí cá nhân (ChatGPT Plus/Claude Pro)	AI Doanh nghiệp (Enterprise)	AI Local (Ollama, LM Studio)
Dữ liệu dùng để train	Có thể có	Không	Không	Không
Lưu trữ lịch sử	Vĩnh viễn trên cloud	Mã hóa, có thể xóa	Kiểm soát bởi admin tổ chức	Chỉ trên máy bạn
Tuân thủ GDPR/NĐ13	Hạn chế	Tốt hơn	Đầy đủ SOC 2, ISO 27001	Hoàn toàn tuân thủ
Chất lượng	Cao (GPT-4o mini)	Cao (GPT-4, Claude 3.5)	Cao	Trung bình (Llama, Mistral)
Chi phí	Miễn phí	dưới 20 USD/tháng	Theo hợp đồng	Miễn phí (cần GPU tốt)

Kết luận: Không phải "AI miễn phí là xấu", mà là bạn cần hiểu hợp đồng ngầm — bạn đang đổi data lấy dịch vụ. Nếu làm việc với thông tin nhạy cảm, hãy trả tiền cho sự riêng tư (gói Pro/Enterprise), hoặc chạy AI trên máy riêng.