Mẹo viết prompt cho DALL-E
Bí quyết viết prompt DALL-E 3 từ cơ bản đến nâng cao: cấu trúc câu, tính từ chi tiết, và tham chiếu nghệ thuật. Tạo ảnh chuẩn ý ngay từ lần đầu.
Giới thiệu
DALL-E 3 hoạt động trên nền tảng diffusion model — một loại AI học cách tạo ảnh bằng cách dần dần loại bỏ nhiễu khỏi hình ảnh ngẫu nhiên để tiến về mô tả văn bản. Khác với Midjourney chỉ cần từ khóa rời rạc, DALL-E hiểu ngôn ngữ tự nhiên như con người, xử lý tốt các mô tả dài và phức tạp. Viết prompt cho DALL-E không phải là chọn từ khóa "ma thuật", mà là mô tả chi tiết bằng câu văn hoàn chỉnh, chỉ định rõ ràng bối cảnh, ánh sáng, vật liệu và phong cách nghệ thuật.
Giải thích chi tiết
Cấu trúc prompt chuẩn: 4 lớp thông tin
DALL-E 3 phân tích prompt theo thứ tự ưu tiên. Cấu trúc hiệu quả nhất gồm 4 thành phần theo trình tự:
- Chủ thể chính: Mô tả chính xác đối tượng, tư thế, biểu cảm
- Bối cảnh/Môi trường: Địa điểm, thời gian trong ngày, thời tiết, bố cục không gian
- Phong cách nghệ thuật: Tên họa sĩ, trường phái hội họa, hoặc tham chiếu văn hóa đại chúng
- Kỹ thuật/Thông số: Loại máy ảnh, ống kính, độ phân giải, ánh sáng cụ thể
Ví dụ thay vì viết "một con mèo đẹp", hãy viết: "Một con mèo Anh lông ngắn màu xám xanh đang ngồi trên cửa sổ gỗ vintage, ánh sáng buổi chiều chiếu vào tạo hiệu ứng tương phản cao, phong cách chụp ảnh phim 35mm với độ nhiễu nhẹ, lấy nét vào đôi mắt màu hổ phách".
Chi tiết hóa bằng tính từ cụ thể và liên tưởng
Tránh các tính từ trừu tượng như "đẹp", "tuyệt vời", "chất lượng cao" — AI không hiểu định nghĩa chủ quan này. Thay vào đó, dùng tính từ mang tính kỹ thuật hoặc liên tưởng hình ảnh:
- Thay "đẹp" → "ánh sáng Rembrandt", "chiếu sáng ba điểm", "bokeh tròn mịn"
- Thay "cũ" → "gỉ sét ở mép", "sơn bong tróc", "patina xanh đồng"
- Thay "nhanh" → "chuyển động mờ 1/60s", "cánh quạt để lại vệt xoáy"
DALL-E 3 có khả năng hiểu ngữ cảnh vật lý: bạn có thể mô tả "bề mặt kính phản chiếu ánh nến lung linh" và AI sẽ tính toán đúng quy luật khúc xạ ánh sáng.
Tận dụng khả năng xử lý prompt dài
Khác với các model cũ giới hạn độ dài token (đơn vị xử lý ngôn ngữ của AI), DALL-E 3 xử lý tốt các mô tả dài 200-300 từ. Điều này cho phép bạn kể một câu chuyện nhỏ trong prompt:
"Một barista đang rót latte art hình cây thông Giáng sinh, góc chụp từ phía trên cao (top-down), bàn gỗ sồi có vân tự nhiên, xung quanh có tách sứ trắng, hạt cà phê rơi rải rác, báo sáng với tiêu đề tiếng Ý, ánh sáng tự nhiên từ cửa sổ bên trái tạo bóng đổ mềm mại, phong cách ảnh lifestyle Instagram, màu sắc ấm áp với điểm nhấn xanh lá cây đậm"
Prompt này chỉ định rõ góc máy, vật thể phụ, vị trí nguồn sáng, và palette màu — điều mà các model khác thường bỏ sót nếu prompt quá ngắn.
Sử dụng tham chiếu nghệ thuật và văn hóa đại chúng
DALL-E 3 được huấn luyện trên dataset rộng lớn, nhận diện tốt các tên họa sĩ, thương hiệu, và phong cách trực quan:
- Phong cách hội họa: "oil painting in the style of Rembrandt", "watercolor like Studio Ghibli backgrounds", "cyberpunk aesthetic of Syd Mead"
- Nhiếp ảnh: "shot on Canon EOS R5 with RF 85mm f/1.2", "Kodak Portra 400 film look", "architectural photography by Iwan Baan"
- Thiết kế đồ họa: "Swiss International Style poster", "brutalist web design aesthetic", "vintage 1970s NASA branding"
Lưu ý: Khi dùng tên họa sĩ sống, DALL-E có cơ chế từ chối để tránh vấn đề bản quyền. Hãy dùng các họa sĩ cổ điển hoặc mô tả phong cách thay vì tên cụ thể.
Ví dụ thực tế
Thumbnail YouTube: Từ chung chung đến chuyên nghiệp
Prompt cơ bản (kết quả thường generic):
"Một người đang nói về tiền điện tử, nền màu xanh, chữ to"
Prompt nâng cao cho DALL-E 3:
"Wide shot của một nam presenter 30 tuổi mặc blazer xanh navy đứng trước màn hình LED hiển thị biểu đồ Bitcoin tăng giá màu xanh lá, ánh sáng studio chuyên nghiệp với rim light màu cam tạo separation khỏi nền, biểu cảm tự tin hơi mỉm cười, foreground có hiệu ứng particle ánh sáng bay lơ lửng, phong cách ảnh chân dung doanh nhân trên Forbes, tỷ lệ khung hình 16:9, không có chữ trên ảnh"
Kết quả là ảnh có độ sâu trường ảnh, ánh sáng chuyên nghiệp, và sẵn sàng để designer thêm text overlay sau.
Mockup sản phẩm: Chai nước hoa cao cấp
Tình huống: Bạn cần ảnh chai nước hoa để test concept trước khi chụp thực tế.
Prompt:
"Product photography của chai nước hoa hình trụ trong suốt 100ml, nắm vàng brushed metal, đặt trên tảng đá cẩm thạch trắng vân xám tự nhiên, nền màu be nhạt đơn sắc, ánh sáng tự nhiên từ bên trái tạo shadow cứng bên phải sản phẩm, reflection mờ trên bề mặt đánh bóng, phong cách chụp ảnh sản phẩm minimalist như Cosmeceutical advertising, depth of field nông chỉ lấy nét chai nước hoa, không có nhãn mác trên chai"
DALL-E 3 hiểu rõ "reflection mờ" và "depth of field nông", tạo ra ảnh có tính thương mại cao, phù hợp để dùng trong bản thảo thiết kế package.
Minh họa bài viết blog: Phong cách đa dạng
Tình huống: Bài viết về "Làm việc từ xa" cần ảnh minh họa không mang tính stock photo quá rõ.
Prompt cho phong cách Flat Design:
"Flat vector illustration của người phụ nữ đang ngồi uống cà phê trước laptop, góc nghiêng 45 độ, bảng màu pastel gồm vàng kem, xanh mint, và hồng đào, nền có các hình học trừu tượng nhẹ nhàng, phong cách thiết kế đồ họa hiện đại như Airbnb illustration, không có chi tiết phức tạp, màu sắc đồng nhất không gradient"
Prompt cho phong cách Photorealistic:
"Candid photography của freelancer nam đang làm việc tại quán cà phê có ánh sáng tự nhiên lớn, bàn gỗ thô, laptop MacBook mở màn hình code, tách cappuccino có latte art, ánh sáng vàng ấm chiếu qua cửa kính, background có cây xanh mờ ảo, phong cách ảnh documentary như Humans of New York, cảm giác cozy và tập trung"
Ứng dụng theo đối tượng
Content Creator & YouTuber
Dùng DALL-E 3 để tạo thumbnail concept nhanh chóng. Thay vì mất 2-3 giờ chụp và chỉnh sửa ảnh thử nghiệm, bạn có thể tạo 5-10 phương án bố cục khác nhau trong dưới 10 phút để A/B test ý tưởng. Tập trung vào prompt mô tả rõ góc máy (wide shot, close-up, Dutch angle) và ánh sáng cảm xúc (dramatic, soft, high-key).
Marketer & Chủ doanh nghiệp nhỏ
Tạo mockup sản phẩm và bối cảnh sử dụng (lifestyle context) mà không cần studio. Ví dụ: mô tả "chai nước rửa tay organic đặt trong phòng tắm Scandinavian với ánh sáng tự nhiên" giúp khách hàng hình dung sản phẩm trong không gian thực tế. Lưu ý thêm từ khóa "photorealistic" hoặc "product photography" để đảm bảo độ thật cao.
Designer & Creative Professional
Dùng DALL-E 3 làm mood board và reference cho concept art. Khi brainstorm ý tưởng cho chiến dịch, viết prompt mô tả chi tiết phong cách thẩm mỹ mong muốn (ví dụ: "retrofuturism 1980s with neon grid floor and chrome typography") để tạo tài liệu tham khảo cho team. Đây là cách nhanh hơn nhiều so với tìm ảnh stock hoặc vẽ sketch thủ công.
Lập trình viên & Founder indie
Tạo hero image cho landing page và illustration cho UI/UX. DALL-E 3 đặc biệt mạnh khi tạo isometric illustration cho các khái niệm kỹ thuật trừu tượng như "cloud computing infrastructure" hoặc "data flow between microservices". Thêm từ khóa "tech illustration style" và "clean vector art" để có kết quả phù hợp với giao diện SaaS.
So sánh với các công cụ khác
| Khía cạnh | DALL-E 3 | Midjourney | Leonardo.ai |
|---|---|---|---|
| Cách viết prompt | Ưu tiên mô tả dài, ngôn ngữ tự nhiên, câu văn hoàn chỉnh | Keyword ngắn, tham số kỹ thuật như \--ar 16:9`, `--v 6`` | Linh hoạt giữa cả hai, hỗ trợ cả prompt tự nhiên và negative prompt chi tiết |
| Độ dài prompt | Hỗ trợ tốt đến 300-400 từ, hiểu ngữ cảnh phức tạp | Hiệu quả nhất với 20-40 từ, dài quá dễ bị ignore | Trung bình 100-150 từ, có hệ thống weight từ khóa |
| Phong cách mặc định | Thiên về realism, ảnh chục thực tế, ít "ảo" | Nghệ thuật hơn, màu sắc rực rỡ, composition mạnh | Phụ thuộc model (DreamShaper, Absolute Reality...), đa dạng phong cách |
| Chữ trong ảnh | Tốt hơn Midjourney nhưng vẫn sai chính tả thường xuyên | Rất kém, chữ thường là hieroglyph | Tốt hơn với các model fine-tuned cho typography |
| Truy cập | Miễn phí qua Bing Image Creator, trả phí qua ChatGPT Plus | Discord-only, subscription | Free tier hào phóng (150 tokens/ngày) |
Khi nào chọn DALL-E 3: Bạn cần tạo ảnh từ mô tả phức tạp, nhiều chi tiết cụ thể về bối cảnh và ánh sáng, hoặc khi muốn dùng ngôn ngữ tự nhiên không cần học syntax đặc biệt. DALL-E 3 cũng là lựa chọn tốt nếu bạn đã dùng ChatGPT và muốn workflow liền mạch.
Khi nào chọn tool khác: Nếu cần ảnh nghệ thuật mang tính thẩm mỹ cao (Midjourney), cần kiểm soát chi tiết pose nhân vật với ControlNet (Leonardo), hoặc cần tạo chữ chính xác trong ảnh (Ideogram).
Bài viết liên quan
Cùng cụm Image Tools
- Bắt đầu với DALL-E 3 — Hướng dẫn cơ bản về giao diện và cách truy cập DALL-E lần đầu
- Sử dụng DALL-E trong ChatGPT — Cách tận dụng tích hợp liền mạch giữa ChatGPT và DALL-E 3
- Hướng dẫn Leonardo.ai — So sánh chi tiết khi nào dùng Leonardo thay vì DALL-E
- Hướng dẫn Ideogram — Công cụ chuyên biệt khi bạn cần chữ trong ảnh chính xác
- Hướng dẫn Recraft AI — Tạo vector và mockup thiết kế đồ họa chuyên nghiệp
- So sánh các tool tạo ảnh AI — Bảng so sánh tổng quát DALL-E, Midjourney, Leonardo, và Ideogram
Đọc tiếp
- Midjourney — Tìm hiểu cách viết prompt cho Midjourney với syntax riêng và khả năng nghệ thuật vượt trội
- Video Tools — Biến ảnh tĩnh từ DALL-E thành video động với Runway, Pika, và Haiper
Sử dụng DALL-E trong ChatGPT
Hướng dẫn cách dùng DALL-E trong ChatGPT để tạo ảnh qua trò chuyện tự nhiên, không cần học thuật ngữ phức tạp. Tối ưu workflow sáng tạo với GPT-4o.
Hướng dẫn Leonardo.ai
Hướng dẫn sử dụng Leonardo.ai từ cơ bản đến nâng cao — tool tạo ảnh AI miễn phí mỗi ngày, lý tưởng cho concept art, game asset và illustration chuyên nghiệp.