Sử dụng Code Interpreter
Hướng dẫn sử dụng Code Interpreter trong ChatGPT để phân tích dữ liệu, xử lý file và tạo báo cáo tự động chỉ bằng ngôn ngữ tự nhiên, không cần biết lập trình.
Giới thiệu
Code Interpreter (hiện được đổi tên thành Advanced Data Analysis) là tính năng độc quyền dành cho người dùng ChatGPT Plus, Pro và Team. Đây là môi trường thực thi Python được tích hợp sẵn, cho phép AI không chỉ "nói" về code mà thực sự chạy code để xử lý file, tính toán số liệu phức tạp và tạo ra các file output mới — tất cả trong một giao diện chat quen thuộc.
Cách kích hoạt và sử dụng
Bật tính năng Advanced Data Analysis
Nếu bạn dùng giao diện web hoặc app ChatGPT:
- Bắt đầu cuộc trò chuyện mới
- Ở thanh chọn model phía trên (bên dưới tiêu đề chat), click chọn "ChatGPT" với tag "Advanced Data Analysis" hoặc "Code Interpreter" (tên gọi tùy phiên bản)
- Biểu tượng + (Upload file) sẽ xuất hiện ở ô nhập chat
Hoặc khi tạo Custom GPTs, bạn có thể bật toggle "Code Interpreter" trong phần Capabilities để GPT của riêng mình có khả năng này.
Upload và quản lý file
Code Interpreter hỗ trợ hầu hết định dạng phổ biến:
- Dữ liệu: CSV, Excel (
.xlsx,.xls), JSON, SQLite - Tài liệu: PDF, Word (
.docx), TXT - Media: PNG, JPG, GIF, MP4, MP3, WAV
- Archive: ZIP (để upload nhiều file cùng lúc)
Giới hạn: Mỗi file tối đa 512MB (tùy gói đăng ký), và dung lượng lưu trữ tạm thời trong session là 100GB — con số lớn đủ để xử lý dataset cỡ trung bình.
Khi upload, ChatGPT sẽ hiển thị thumbnail file bên cạnh câu hỏi của bạn. Bạn có thể upload nhiều file cùng lúc để so sánh hoặc gộp dữ liệu.
Cơ chế hoạt động
Khi bạn đưa ra yêu cầu liên quan đến dữ liệu hoặc tính toán:
- ChatGPT viết script Python phù hợp (thường dùng pandas, numpy, matplotlib, seaborn)
- Code thực thi trong sandbox an toàn (isolated environment)
- Kết quả (biểu đồ, file mới, hoặc text) được hiển thị trong chat
- Bạn có thể yêu cầu điều chỉnh: "Thay đổi màu biểu đồ", "Lọc thêm cột này", "Xuất file PDF thay vì Excel"
Lưu ý quan trọng: Môi trường này không có internet. Code Interpreter không thể tải thêm dữ liệu từ web hay gọi API bên ngoài trong lúc chạy. Mọi thứ phải được cung cấp qua file upload hoặc tính toán nội bộ.
Ví dụ thực tế
Phân tích doanh thu từ file CSV "bẩn"
Tình huống: Bạn nhận file sales_q3.csv từ bộ phận kế toán, dữ liệu rối loạn — có dòng trống, định dạng ngày tháng không đồng nhất, và cột giá tiền chứa ký tự $.
Cách làm:
- Upload file CSV vào chat
- Prompt: "Dọn dẹp file này: chuẩn hóa định dạng ngày tháng, bỏ dòng trống, chuyển cột giá về số. Sau đó cho biết tổng doanh thu quý 3 và vẽ biểu đồ cột so sánh doanh thu 3 tháng gần nhất."
- Code Interpreter tự động:
- Dùng
pandas.read_csv()đọc file - Xử lý string parsing để loại bỏ
$và chuyển sang float - Chuẩn hóa datetime với
pd.to_datetime() - Tính tổng nhóm theo tháng với
groupby() - Vẽ biểu đồ bằng
matplotlibvà lưu ảnh PNG
- Dùng
- Kết quả: Bạn nhận được bảng số liệu sạch (có thể download lại CSV đã xử lý) và ảnh biểu đồ trực quan.
Batch resize ảnh sản phẩm cho sàn thương mại điện tử
Tình huống: Chuẩn bị upload 50 ảnh sản phẩm lên Shopee/TikTok Shop, yêu cầu kích thước vuông 800x800px và thêm watermark logo.
Cách làm:
- Nén 50 ảnh thành file ZIP, upload lên ChatGPT
- Prompt: "Giải nén folder này, resize mỗi ảnh về 800x800 giữ tỷ lệ (crop center nếu cần), thêm text 'TroiSinh Official' màu trắng opacity 50% ở góc dưới phải, rồi nén lại thành file ZIP mới để tôi download"
- Code Interpreter thực hiện:
- Dùng
zipfileđể giải nén - Dùng
PIL(Pillow) để mở từng ảnh, resize vớiImage.Resampling.LANCZOS, thêm text layer - Tạo file ZIP output mới
- Dùng
- Bạn download file ZIP chứa 50 ảnh đã xử lý sẵn sàng để upload lên sàn.
Trích xuất bảng từ báo cáo PDF scan
Tình huống: Báo cáo tài chính PDF 30 trang được scan từ giấy (dạng ảnh), cần chuyển sang Excel để tính toán.
Cách làm:
- Upload file PDF
- Prompt: "Trích xuất tất cả bảng dữ liệu trong file PDF này. Nếu là ảnh scan, hãy dùng OCR để đọc. Xuất kết quả ra file Excel với nhiều sheet nếu cần, giữ đúng định dạng số và ngày tháng."
- Code Interpreter sử dụng
pdf2imagechuyển trang thành ảnh, sau đó dùngpytesseract(OCR) hoặcpdfplumberđể trích xuất bảng, rồi ghi vàoopenpyxl - Nhận file
.xlsxvới dữ liệu đã được cấu trúc hóa, sẵn sàng cho pivot table.
Ứng dụng theo đối tượng
Data Analyst & Business Intelligence
- Làm sạch dữ liệu nhanh: Xử lý missing values, duplicate, outlier detection trên file CSV lớn mà không cần mở Jupyter Notebook.
- Prototype visualization: Test nhanh các loại biểu đồ (heatmap, boxplot, scatter matrix) trước khi đưa vào dashboard chính thức bằng Tableau/PowerBI.
- Automation báo cáo định kỳ: Lưu lại prompt template, mỗi tuần chỉ cần upload file mới và chạy lại cùng workflow.
Marketing & Content Creator
- Phân tích campaign: Upload file CSV từ Facebook Ads/Google Ads, yêu cầu tính CPA, ROAS, vẽ funnel visualization.
- Xử lý media hàng loạt: Resize, đổi định dạng ảnh, cắt video ngắn, trích xuất audio từ video để làm podcast.
Sinh viên & Nghiên cứu sinh
- Thống kê mô tả: Ném file SPSS hoặc Excel khảo sát vào, yêu cầu t-test, regression cơ bản, hoặc chỉ đơn giản là tính mean/median.
- Chuyển đổi tài liệu: Chuyển bài tham khảo từ PDF sang text để dán vào đề cương, hoặc gộp nhiều file PDF thành một.
Developer & PM
- Code review nhanh: Dán log file dài hàng nghìn dòng, yêu cầu Code Interpreter đếm số lỗi mỗi loại, vẽ biểu đồ thời gian xuất hiện lỗi.
- Data migration: Viết script chuyển đổi giữa JSON và CSV, hoặc normalize database dump từ định dạng cũ sang mới.
So sánh với phương pháp truyền thống
| Tiêu chí | Code Interpreter | Excel + Python Local | Claude Artifacts |
|---|---|---|---|
| Thời gian setup | Ngay lập tức | Cài đặt Python, thư viện, IDE | Ngay lập tức |
| Giao diện | Chat tự nhiên | Jupyter/VS Code | Chat + Preview panel |
| Xử lý file lớn | Tốt (lên đến 512MB/file) | Phụ thuộc RAM máy tính | Tốt nhưng ít thư viện hơn |
| Lưu trữ kết quả | Session chat (tải xuống file) | Lưu trữ vĩnh viễn local | Session chat |
| Thư viện hỗ trợ | pandas, numpy, matplotlib, pillow... tích hợp sẵn | Tự do cài đặt | Chủ yếu hiển thị code, không chạy Python mạnh mẽ |
| Chi phí | $20/tháng (ChatGPT Plus) | Miễn phí | Free/Pro tùy gói |
Kết luận: Code Interpreter nằm ở vị trí "sweet spot" — mạnh mẽ hơn Excel nhưng dễ tiếp cận hơn lập trình thuần túy. Nó phù hợp nhất cho các tác vụ "dùng một lần" hoặc lặp lại định kỳ mà không đòi hỏi đầu tư xây dựng pipeline phức tạp. Tuy nhiên, nếu bạn cần hệ thống xử lý dữ liệu tự động chạy 24/7 hoặc kết nối API bên ngoài, vẫn nên dùng Python local hoặc các nền tảng automation như n8n hoặc Make.
Bài viết liên quan
Cùng cụm ChatGPT
- Bắt đầu với ChatGPT — Làm quen giao diện và các tính năng cơ bản trước khi dùng Code Interpreter.
- Tạo Custom GPT riêng — Học cách tích hợp Code Interpreter vào GPT chuyên biệt cho công việc của bạn.
- Dùng ChatGPT Voice Mode — Kết hợp phân tích dữ liệu bằng Code Interpreter và ra lệnh bằng giọng nói.
Đọc tiếp
- Claude Artifacts — So sánh cách Claude xử lý code và file so với Code Interpreter của ChatGPT.
- Google Gemini Advanced — Xem cách Google tích hợp phân tích dữ liệu vào Gemini như thế nào.
Dùng ChatGPT Voice Mode
Hướng dẫn cách dùng ChatGPT Voice Mode để trò chuyện trực tiếp với AI bằng giọng nói. Từ cài đặt đến mẹo luyện nói tiếng Anh và brainstorming rảnh tay.
Losan AI là gì? Giới thiệu AI companion
Khám phá Losan AI - nền tảng AI companion biết nhớ, học và làm việc cùng bạn. Hướng dẫn sử dụng chi tiết cho người mới bắt đầu.