TROISINH
AI Chat & Tìm kiếmChatGPT

Sử dụng Code Interpreter

Hướng dẫn sử dụng Code Interpreter trong ChatGPT để phân tích dữ liệu, xử lý file và tạo báo cáo tự động chỉ bằng ngôn ngữ tự nhiên, không cần biết lập trình.

Giới thiệu

Code Interpreter (hiện được đổi tên thành Advanced Data Analysis) là tính năng độc quyền dành cho người dùng ChatGPT Plus, Pro và Team. Đây là môi trường thực thi Python được tích hợp sẵn, cho phép AI không chỉ "nói" về code mà thực sự chạy code để xử lý file, tính toán số liệu phức tạp và tạo ra các file output mới — tất cả trong một giao diện chat quen thuộc.

Cách kích hoạt và sử dụng

Bật tính năng Advanced Data Analysis

Nếu bạn dùng giao diện web hoặc app ChatGPT:

  1. Bắt đầu cuộc trò chuyện mới
  2. Ở thanh chọn model phía trên (bên dưới tiêu đề chat), click chọn "ChatGPT" với tag "Advanced Data Analysis" hoặc "Code Interpreter" (tên gọi tùy phiên bản)
  3. Biểu tượng + (Upload file) sẽ xuất hiện ở ô nhập chat

Hoặc khi tạo Custom GPTs, bạn có thể bật toggle "Code Interpreter" trong phần Capabilities để GPT của riêng mình có khả năng này.

Upload và quản lý file

Code Interpreter hỗ trợ hầu hết định dạng phổ biến:

  • Dữ liệu: CSV, Excel (.xlsx, .xls), JSON, SQLite
  • Tài liệu: PDF, Word (.docx), TXT
  • Media: PNG, JPG, GIF, MP4, MP3, WAV
  • Archive: ZIP (để upload nhiều file cùng lúc)

Giới hạn: Mỗi file tối đa 512MB (tùy gói đăng ký), và dung lượng lưu trữ tạm thời trong session là 100GB — con số lớn đủ để xử lý dataset cỡ trung bình.

Khi upload, ChatGPT sẽ hiển thị thumbnail file bên cạnh câu hỏi của bạn. Bạn có thể upload nhiều file cùng lúc để so sánh hoặc gộp dữ liệu.

Cơ chế hoạt động

Khi bạn đưa ra yêu cầu liên quan đến dữ liệu hoặc tính toán:

  1. ChatGPT viết script Python phù hợp (thường dùng pandas, numpy, matplotlib, seaborn)
  2. Code thực thi trong sandbox an toàn (isolated environment)
  3. Kết quả (biểu đồ, file mới, hoặc text) được hiển thị trong chat
  4. Bạn có thể yêu cầu điều chỉnh: "Thay đổi màu biểu đồ", "Lọc thêm cột này", "Xuất file PDF thay vì Excel"

Lưu ý quan trọng: Môi trường này không có internet. Code Interpreter không thể tải thêm dữ liệu từ web hay gọi API bên ngoài trong lúc chạy. Mọi thứ phải được cung cấp qua file upload hoặc tính toán nội bộ.

Ví dụ thực tế

Phân tích doanh thu từ file CSV "bẩn"

Tình huống: Bạn nhận file sales_q3.csv từ bộ phận kế toán, dữ liệu rối loạn — có dòng trống, định dạng ngày tháng không đồng nhất, và cột giá tiền chứa ký tự $.

Cách làm:

  1. Upload file CSV vào chat
  2. Prompt: "Dọn dẹp file này: chuẩn hóa định dạng ngày tháng, bỏ dòng trống, chuyển cột giá về số. Sau đó cho biết tổng doanh thu quý 3 và vẽ biểu đồ cột so sánh doanh thu 3 tháng gần nhất."
  3. Code Interpreter tự động:
    • Dùng pandas.read_csv() đọc file
    • Xử lý string parsing để loại bỏ $ và chuyển sang float
    • Chuẩn hóa datetime với pd.to_datetime()
    • Tính tổng nhóm theo tháng với groupby()
    • Vẽ biểu đồ bằng matplotlib và lưu ảnh PNG
  4. Kết quả: Bạn nhận được bảng số liệu sạch (có thể download lại CSV đã xử lý) và ảnh biểu đồ trực quan.

Batch resize ảnh sản phẩm cho sàn thương mại điện tử

Tình huống: Chuẩn bị upload 50 ảnh sản phẩm lên Shopee/TikTok Shop, yêu cầu kích thước vuông 800x800px và thêm watermark logo.

Cách làm:

  1. Nén 50 ảnh thành file ZIP, upload lên ChatGPT
  2. Prompt: "Giải nén folder này, resize mỗi ảnh về 800x800 giữ tỷ lệ (crop center nếu cần), thêm text 'TroiSinh Official' màu trắng opacity 50% ở góc dưới phải, rồi nén lại thành file ZIP mới để tôi download"
  3. Code Interpreter thực hiện:
    • Dùng zipfile để giải nén
    • Dùng PIL (Pillow) để mở từng ảnh, resize với Image.Resampling.LANCZOS, thêm text layer
    • Tạo file ZIP output mới
  4. Bạn download file ZIP chứa 50 ảnh đã xử lý sẵn sàng để upload lên sàn.

Trích xuất bảng từ báo cáo PDF scan

Tình huống: Báo cáo tài chính PDF 30 trang được scan từ giấy (dạng ảnh), cần chuyển sang Excel để tính toán.

Cách làm:

  1. Upload file PDF
  2. Prompt: "Trích xuất tất cả bảng dữ liệu trong file PDF này. Nếu là ảnh scan, hãy dùng OCR để đọc. Xuất kết quả ra file Excel với nhiều sheet nếu cần, giữ đúng định dạng số và ngày tháng."
  3. Code Interpreter sử dụng pdf2image chuyển trang thành ảnh, sau đó dùng pytesseract (OCR) hoặc pdfplumber để trích xuất bảng, rồi ghi vào openpyxl
  4. Nhận file .xlsx với dữ liệu đã được cấu trúc hóa, sẵn sàng cho pivot table.

Ứng dụng theo đối tượng

Data Analyst & Business Intelligence

  • Làm sạch dữ liệu nhanh: Xử lý missing values, duplicate, outlier detection trên file CSV lớn mà không cần mở Jupyter Notebook.
  • Prototype visualization: Test nhanh các loại biểu đồ (heatmap, boxplot, scatter matrix) trước khi đưa vào dashboard chính thức bằng Tableau/PowerBI.
  • Automation báo cáo định kỳ: Lưu lại prompt template, mỗi tuần chỉ cần upload file mới và chạy lại cùng workflow.

Marketing & Content Creator

  • Phân tích campaign: Upload file CSV từ Facebook Ads/Google Ads, yêu cầu tính CPA, ROAS, vẽ funnel visualization.
  • Xử lý media hàng loạt: Resize, đổi định dạng ảnh, cắt video ngắn, trích xuất audio từ video để làm podcast.

Sinh viên & Nghiên cứu sinh

  • Thống kê mô tả: Ném file SPSS hoặc Excel khảo sát vào, yêu cầu t-test, regression cơ bản, hoặc chỉ đơn giản là tính mean/median.
  • Chuyển đổi tài liệu: Chuyển bài tham khảo từ PDF sang text để dán vào đề cương, hoặc gộp nhiều file PDF thành một.

Developer & PM

  • Code review nhanh: Dán log file dài hàng nghìn dòng, yêu cầu Code Interpreter đếm số lỗi mỗi loại, vẽ biểu đồ thời gian xuất hiện lỗi.
  • Data migration: Viết script chuyển đổi giữa JSON và CSV, hoặc normalize database dump từ định dạng cũ sang mới.

So sánh với phương pháp truyền thống

Tiêu chíCode InterpreterExcel + Python LocalClaude Artifacts
Thời gian setupNgay lập tứcCài đặt Python, thư viện, IDENgay lập tức
Giao diệnChat tự nhiênJupyter/VS CodeChat + Preview panel
Xử lý file lớnTốt (lên đến 512MB/file)Phụ thuộc RAM máy tínhTốt nhưng ít thư viện hơn
Lưu trữ kết quảSession chat (tải xuống file)Lưu trữ vĩnh viễn localSession chat
Thư viện hỗ trợpandas, numpy, matplotlib, pillow... tích hợp sẵnTự do cài đặtChủ yếu hiển thị code, không chạy Python mạnh mẽ
Chi phí$20/tháng (ChatGPT Plus)Miễn phíFree/Pro tùy gói

Kết luận: Code Interpreter nằm ở vị trí "sweet spot" — mạnh mẽ hơn Excel nhưng dễ tiếp cận hơn lập trình thuần túy. Nó phù hợp nhất cho các tác vụ "dùng một lần" hoặc lặp lại định kỳ mà không đòi hỏi đầu tư xây dựng pipeline phức tạp. Tuy nhiên, nếu bạn cần hệ thống xử lý dữ liệu tự động chạy 24/7 hoặc kết nối API bên ngoài, vẫn nên dùng Python local hoặc các nền tảng automation như n8n hoặc Make.

Bài viết liên quan

Cùng cụm ChatGPT

  • Bắt đầu với ChatGPT — Làm quen giao diện và các tính năng cơ bản trước khi dùng Code Interpreter.
  • Tạo Custom GPT riêng — Học cách tích hợp Code Interpreter vào GPT chuyên biệt cho công việc của bạn.
  • Dùng ChatGPT Voice Mode — Kết hợp phân tích dữ liệu bằng Code Interpreter và ra lệnh bằng giọng nói.

Đọc tiếp

  • Claude Artifacts — So sánh cách Claude xử lý code và file so với Code Interpreter của ChatGPT.
  • Google Gemini Advanced — Xem cách Google tích hợp phân tích dữ liệu vào Gemini như thế nào.

On this page