TROISINH
Sáng tạo Nội dungDALL-E & Image Tools

Mẹo viết prompt cho DALL-E

Bí quyết viết prompt DALL-E 3 từ cơ bản đến nâng cao: cấu trúc câu, tính từ chi tiết, và tham chiếu nghệ thuật. Tạo ảnh chuẩn ý ngay từ lần đầu.

Giới thiệu

DALL-E 3 hoạt động trên nền tảng diffusion model — một loại AI học cách tạo ảnh bằng cách dần dần loại bỏ nhiễu khỏi hình ảnh ngẫu nhiên để tiến về mô tả văn bản. Khác với Midjourney chỉ cần từ khóa rời rạc, DALL-E hiểu ngôn ngữ tự nhiên như con người, xử lý tốt các mô tả dài và phức tạp. Viết prompt cho DALL-E không phải là chọn từ khóa "ma thuật", mà là mô tả chi tiết bằng câu văn hoàn chỉnh, chỉ định rõ ràng bối cảnh, ánh sáng, vật liệu và phong cách nghệ thuật.

Giải thích chi tiết

Cấu trúc prompt chuẩn: 4 lớp thông tin

DALL-E 3 phân tích prompt theo thứ tự ưu tiên. Cấu trúc hiệu quả nhất gồm 4 thành phần theo trình tự:

  1. Chủ thể chính: Mô tả chính xác đối tượng, tư thế, biểu cảm
  2. Bối cảnh/Môi trường: Địa điểm, thời gian trong ngày, thời tiết, bố cục không gian
  3. Phong cách nghệ thuật: Tên họa sĩ, trường phái hội họa, hoặc tham chiếu văn hóa đại chúng
  4. Kỹ thuật/Thông số: Loại máy ảnh, ống kính, độ phân giải, ánh sáng cụ thể

Ví dụ thay vì viết "một con mèo đẹp", hãy viết: "Một con mèo Anh lông ngắn màu xám xanh đang ngồi trên cửa sổ gỗ vintage, ánh sáng buổi chiều chiếu vào tạo hiệu ứng tương phản cao, phong cách chụp ảnh phim 35mm với độ nhiễu nhẹ, lấy nét vào đôi mắt màu hổ phách".

Chi tiết hóa bằng tính từ cụ thể và liên tưởng

Tránh các tính từ trừu tượng như "đẹp", "tuyệt vời", "chất lượng cao" — AI không hiểu định nghĩa chủ quan này. Thay vào đó, dùng tính từ mang tính kỹ thuật hoặc liên tưởng hình ảnh:

  • Thay "đẹp" → "ánh sáng Rembrandt", "chiếu sáng ba điểm", "bokeh tròn mịn"
  • Thay "cũ" → "gỉ sét ở mép", "sơn bong tróc", "patina xanh đồng"
  • Thay "nhanh" → "chuyển động mờ 1/60s", "cánh quạt để lại vệt xoáy"

DALL-E 3 có khả năng hiểu ngữ cảnh vật lý: bạn có thể mô tả "bề mặt kính phản chiếu ánh nến lung linh" và AI sẽ tính toán đúng quy luật khúc xạ ánh sáng.

Tận dụng khả năng xử lý prompt dài

Khác với các model cũ giới hạn độ dài token (đơn vị xử lý ngôn ngữ của AI), DALL-E 3 xử lý tốt các mô tả dài 200-300 từ. Điều này cho phép bạn kể một câu chuyện nhỏ trong prompt:

"Một barista đang rót latte art hình cây thông Giáng sinh, góc chụp từ phía trên cao (top-down), bàn gỗ sồi có vân tự nhiên, xung quanh có tách sứ trắng, hạt cà phê rơi rải rác, báo sáng với tiêu đề tiếng Ý, ánh sáng tự nhiên từ cửa sổ bên trái tạo bóng đổ mềm mại, phong cách ảnh lifestyle Instagram, màu sắc ấm áp với điểm nhấn xanh lá cây đậm"

Prompt này chỉ định rõ góc máy, vật thể phụ, vị trí nguồn sáng, và palette màu — điều mà các model khác thường bỏ sót nếu prompt quá ngắn.

Sử dụng tham chiếu nghệ thuật và văn hóa đại chúng

DALL-E 3 được huấn luyện trên dataset rộng lớn, nhận diện tốt các tên họa sĩ, thương hiệu, và phong cách trực quan:

  • Phong cách hội họa: "oil painting in the style of Rembrandt", "watercolor like Studio Ghibli backgrounds", "cyberpunk aesthetic of Syd Mead"
  • Nhiếp ảnh: "shot on Canon EOS R5 with RF 85mm f/1.2", "Kodak Portra 400 film look", "architectural photography by Iwan Baan"
  • Thiết kế đồ họa: "Swiss International Style poster", "brutalist web design aesthetic", "vintage 1970s NASA branding"

Lưu ý: Khi dùng tên họa sĩ sống, DALL-E có cơ chế từ chối để tránh vấn đề bản quyền. Hãy dùng các họa sĩ cổ điển hoặc mô tả phong cách thay vì tên cụ thể.

Ví dụ thực tế

Thumbnail YouTube: Từ chung chung đến chuyên nghiệp

Prompt cơ bản (kết quả thường generic):

"Một người đang nói về tiền điện tử, nền màu xanh, chữ to"

Prompt nâng cao cho DALL-E 3:

"Wide shot của một nam presenter 30 tuổi mặc blazer xanh navy đứng trước màn hình LED hiển thị biểu đồ Bitcoin tăng giá màu xanh lá, ánh sáng studio chuyên nghiệp với rim light màu cam tạo separation khỏi nền, biểu cảm tự tin hơi mỉm cười, foreground có hiệu ứng particle ánh sáng bay lơ lửng, phong cách ảnh chân dung doanh nhân trên Forbes, tỷ lệ khung hình 16:9, không có chữ trên ảnh"

Kết quả là ảnh có độ sâu trường ảnh, ánh sáng chuyên nghiệp, và sẵn sàng để designer thêm text overlay sau.

Mockup sản phẩm: Chai nước hoa cao cấp

Tình huống: Bạn cần ảnh chai nước hoa để test concept trước khi chụp thực tế.

Prompt:

"Product photography của chai nước hoa hình trụ trong suốt 100ml, nắm vàng brushed metal, đặt trên tảng đá cẩm thạch trắng vân xám tự nhiên, nền màu be nhạt đơn sắc, ánh sáng tự nhiên từ bên trái tạo shadow cứng bên phải sản phẩm, reflection mờ trên bề mặt đánh bóng, phong cách chụp ảnh sản phẩm minimalist như Cosmeceutical advertising, depth of field nông chỉ lấy nét chai nước hoa, không có nhãn mác trên chai"

DALL-E 3 hiểu rõ "reflection mờ" và "depth of field nông", tạo ra ảnh có tính thương mại cao, phù hợp để dùng trong bản thảo thiết kế package.

Minh họa bài viết blog: Phong cách đa dạng

Tình huống: Bài viết về "Làm việc từ xa" cần ảnh minh họa không mang tính stock photo quá rõ.

Prompt cho phong cách Flat Design:

"Flat vector illustration của người phụ nữ đang ngồi uống cà phê trước laptop, góc nghiêng 45 độ, bảng màu pastel gồm vàng kem, xanh mint, và hồng đào, nền có các hình học trừu tượng nhẹ nhàng, phong cách thiết kế đồ họa hiện đại như Airbnb illustration, không có chi tiết phức tạp, màu sắc đồng nhất không gradient"

Prompt cho phong cách Photorealistic:

"Candid photography của freelancer nam đang làm việc tại quán cà phê có ánh sáng tự nhiên lớn, bàn gỗ thô, laptop MacBook mở màn hình code, tách cappuccino có latte art, ánh sáng vàng ấm chiếu qua cửa kính, background có cây xanh mờ ảo, phong cách ảnh documentary như Humans of New York, cảm giác cozy và tập trung"

Ứng dụng theo đối tượng

Content Creator & YouTuber

Dùng DALL-E 3 để tạo thumbnail concept nhanh chóng. Thay vì mất 2-3 giờ chụp và chỉnh sửa ảnh thử nghiệm, bạn có thể tạo 5-10 phương án bố cục khác nhau trong dưới 10 phút để A/B test ý tưởng. Tập trung vào prompt mô tả rõ góc máy (wide shot, close-up, Dutch angle) và ánh sáng cảm xúc (dramatic, soft, high-key).

Marketer & Chủ doanh nghiệp nhỏ

Tạo mockup sản phẩmbối cảnh sử dụng (lifestyle context) mà không cần studio. Ví dụ: mô tả "chai nước rửa tay organic đặt trong phòng tắm Scandinavian với ánh sáng tự nhiên" giúp khách hàng hình dung sản phẩm trong không gian thực tế. Lưu ý thêm từ khóa "photorealistic" hoặc "product photography" để đảm bảo độ thật cao.

Designer & Creative Professional

Dùng DALL-E 3 làm mood boardreference cho concept art. Khi brainstorm ý tưởng cho chiến dịch, viết prompt mô tả chi tiết phong cách thẩm mỹ mong muốn (ví dụ: "retrofuturism 1980s with neon grid floor and chrome typography") để tạo tài liệu tham khảo cho team. Đây là cách nhanh hơn nhiều so với tìm ảnh stock hoặc vẽ sketch thủ công.

Lập trình viên & Founder indie

Tạo hero image cho landing page và illustration cho UI/UX. DALL-E 3 đặc biệt mạnh khi tạo isometric illustration cho các khái niệm kỹ thuật trừu tượng như "cloud computing infrastructure" hoặc "data flow between microservices". Thêm từ khóa "tech illustration style""clean vector art" để có kết quả phù hợp với giao diện SaaS.

So sánh với các công cụ khác

Khía cạnhDALL-E 3MidjourneyLeonardo.ai
Cách viết promptƯu tiên mô tả dài, ngôn ngữ tự nhiên, câu văn hoàn chỉnhKeyword ngắn, tham số kỹ thuật như \--ar 16:9`, `--v 6``Linh hoạt giữa cả hai, hỗ trợ cả prompt tự nhiên và negative prompt chi tiết
Độ dài promptHỗ trợ tốt đến 300-400 từ, hiểu ngữ cảnh phức tạpHiệu quả nhất với 20-40 từ, dài quá dễ bị ignoreTrung bình 100-150 từ, có hệ thống weight từ khóa
Phong cách mặc địnhThiên về realism, ảnh chục thực tế, ít "ảo"Nghệ thuật hơn, màu sắc rực rỡ, composition mạnhPhụ thuộc model (DreamShaper, Absolute Reality...), đa dạng phong cách
Chữ trong ảnhTốt hơn Midjourney nhưng vẫn sai chính tả thường xuyênRất kém, chữ thường là hieroglyphTốt hơn với các model fine-tuned cho typography
Truy cậpMiễn phí qua Bing Image Creator, trả phí qua ChatGPT PlusDiscord-only, subscriptionFree tier hào phóng (150 tokens/ngày)

Khi nào chọn DALL-E 3: Bạn cần tạo ảnh từ mô tả phức tạp, nhiều chi tiết cụ thể về bối cảnh và ánh sáng, hoặc khi muốn dùng ngôn ngữ tự nhiên không cần học syntax đặc biệt. DALL-E 3 cũng là lựa chọn tốt nếu bạn đã dùng ChatGPT và muốn workflow liền mạch.

Khi nào chọn tool khác: Nếu cần ảnh nghệ thuật mang tính thẩm mỹ cao (Midjourney), cần kiểm soát chi tiết pose nhân vật với ControlNet (Leonardo), hoặc cần tạo chữ chính xác trong ảnh (Ideogram).

Bài viết liên quan

Cùng cụm Image Tools

Đọc tiếp

  • Midjourney — Tìm hiểu cách viết prompt cho Midjourney với syntax riêng và khả năng nghệ thuật vượt trội
  • Video Tools — Biến ảnh tĩnh từ DALL-E thành video động với Runway, Pika, và Haiper

On this page