TROISINH
Hiểu bản chấtKhái niệm ML nâng cao

AI học online vs offline

Phân biệt hai phương pháp huấn luyện ML: Online learning cập nhật liên tục từ dữ liệu mới, offline learning huấn luyện một lần trên tập dữ liệu cố định.

Định nghĩa

Online learning (hay incremental learning) là phương pháp huấn luyện mô hình Machine Learning cập nhật liên tục từng phần dữ liệu mới ngay khi chúng xuất hiện, trong khi offline learning (hay batch learning) huấn luyện mô hình một lần duy nhất trên toàn bộ tập dữ liệu tĩnh trước khi triển khai.

Giải thích chi tiết

Cách offline learning vận hành

Trong offline learning, bạn thu thập toàn bộ dữ liệu huấn luyện trước, lưu vào kho lưu trữ, rồi cho mô hình học một lần qua nhiều vòng lặp (epochs). Sau khi huấn luyện xong, mô hình được đóng gói và triển khai. Khi có dữ liệu mới, bạn phải thu thập thêm, trộn với dữ liệu cũ, và huấn luyện lại từ đầu. Đây là cách tiếp cận batch gradient descent truyền thống — ổn định nhưng cứng nhắc.

Phương pháp này phù hợp khi dữ liệu không thay đổi nhiều theo thời gian, như nhận diện khuôn mặt trong công ty (nhân viên không đổi hàng ngày) hoặc phân loại ảnh chụp X-quang (giải phẫu người không thay đổi).

Cách online learning thích ứng

Online learning hoạt động như một học sinh luôn tỉnh táo: mô hình cập nhật trọng số ngay lập tức sau mỗi mẫu dữ liệu mới (hoặc mỗi nhóm nhỏ), thường dùng stochastic gradient descent (SGD). Điều này giúp mô hình bắt kịp concept drift — hiện tượng phân phối dữ liệu thay đổi theo thời gian (ví dụ: thói quen mua sắm thay đổi theo mùa, thuật ngữ hot trên mạng xã hội biến đổi nhanh).

Tuy nhiên, online learning mang rủi ro catastrophic forgetting: mô hình có thể quên kiến thức cũ khi học quá nhiều dữ liệu mới khác biệt. Cần cơ chế regularization hoặc replay buffer để giữ cân bằng.

Concept drift và chi phí tính toán

Dữ liệu thế giới thực luôn chuyển động: giá cổ phiếu, xu hướng thời trang, hành vi gian lận. Offline learning phản ứng chậm vì cần thu thập đủ dữ liệu mới rồi train lại — có thể mất ngày. Online learning phản ứng trong giây lát, nhưng đòi hỏi hệ thống luôn hoạt động để theo dõi và kiểm soát chất lượng cập nhật.

Về tài nguyên: offline learning cần GPU mạnh trong thời gian ngắn để train, sau đó chỉ cần CPU nhẹ để inference. Online learning cần hạ tầng ổn định liên tục để vừa inference vừa train nhẹ.

Ví dụ thực tế

Gợi ý sản phẩm trên Shopee/Tiki: Ban đầu, mô hình gợi ý được huấn luyện offline trên lịch sử mua hàng 6 tháng. Nhưng khi có đợt giảm giá nhanh hoặc xu hướng TikTok bất ngờ (ví dụ trend "ghế công thái học" bùng nổ), dữ liệu mới đổ về hàng giây. Hệ thống dùng online learning để điều chỉnh gợi ý ngay trong giờ, thay vì chờ 3 ngày train lại toàn bộ.

Lọc tin nhắn rác trên Zalo: Mô hình ban đầu train offline với hàng triệu tin nhắn spam đã gán nhãn. Nhưng khi kẻ xấu thay đổi chiêu thức (dùng chữ viết hoa lạ, thêm ký tự đặc biệt), mô hình online learning cập nhật ngay từ những tin nhắn bị người dùng báo cáo, không cần chờ phiên bản ứng dụng mới.

Định giá xe của Grab: Thuật toán chính train offline với dữ liệu 2 năm để hiểu mô hình giá cơ bản. Nhưng khi có sự kiện bất ngờ (mưa lớn, concert), online learning điều chỉnh hệ số tăng giá theo thời điểm (surge pricing) trong thời gian thực dựa trên dữ liệu đặt xe vừa diễn ra 5 phút trước.

Ứng dụng

Sinh viên nghiên cứu: Khi thực hiện luận văn dự đoán giá tiền điện tử hoặc phân tích cảm xúc từ bình luận mạng xã hội, cần hiểu rõ mini-batch SGD (dạng online) so với full batch. Thị trường tài chính biến động nhanh đòi hỏi online learning, trong khi phân loại văn bản y học có thể offline.

Kỹ sư ML trong doanh nghiệp: Quyết định kiến trúc hệ thống — dùng offline cho nhận diện khuôn mặt nhân viên (dữ liệu ổn định), dùng online cho phát hiện gian lận (người xấu luôn đổi chiêu). Hoặc kết hợp: offline cho kiến thức nền, online cho tinh chỉnh theo ngữ cảnh.

Startup và sản phẩm MVP: Giai đoạn đầu dùng offline learning để tiết kiệm chi phí hạ tầng (train một lần trên máy local). Khi có lượng người dùng lớn và dữ liệu chảy liên tục, chuyển sang online để cá nhân hóa trải nghiệm không bị chậm trễ.

So sánh

Tiêu chíOffline LearningOnline Learning
Dữ liệu đầu vàoTập cố định, lưu trữ sẵnDòng dữ liệu liên tục đổ về
Thời gian huấn luyệnMột lần, kéo dài (giờ/ngày)Liên tục, từng bước nhỏ (giây/phút)
Phản ứng với thay đổiChậm (cần thu thập và train lại)Nhanh (cập nhật ngay lập tức)
Tài nguyên tính toánCần GPU mạnh trong thời gian ngắnCần hệ thống ổn định lâu dài, nhẹ
Rủi ro chínhOverfitting trên dữ liệu cũ, lỗi thờiCatastrophic forgetting, concept drift không kiểm soát
Ví dụ điển hìnhNhận diện chữ viết tay, chẩn đoán ảnh y tếGợi ý tin tức, lọc spam, định giá động

Không có phương pháp nào tuyệt đối tốt hơn. Hầu hết hệ thống AI hiện đại dùng lai ghép (hybrid): offline learning để xây dựng kiến thức nền tảng vững chắc, online learning để thích ứng với biến động thời gian thực.

Bài viết liên quan

Cùng cụm:

  • Inference là gì? — Hiểu cách mô hình đưa ra dự đoán sau khi đã được huấn luyện
  • Overfitting là gì? — Rủi ro học quá kỹ dữ liệu huấn luyện trong cả hai phương pháp
  • Underfitting là gì? — Khi mô hình chưa đủ khả năng học dù đã train kỹ
  • Embedding là gì? — Cách biểu diễn dữ liệu để học online hiệu quả hơn

Đọc tiếp:

  • Fine-tuning thực chiến — Chuyển từ hiểu concept sang thực hành tinh chỉnh mô hình với LoRA và QLoRA, thường kết hợp cả online và offline
  • RAG pipeline — Kỹ thuật kết hợp truy xuất thông tin để cập nhật kiến thức mới không cần train lại toàn bộ mô hình
  • Machine Learning cơ bản — Ôn lại kiến thức nền về batch training và gradient descent nếu bạn chưa vững

On this page