Mục lục
Không cần prompt tạo ảnh nhiều lần, đây là cách để bạn kiểm soát mọi chi tiết khi tạo ảnh bằng AI.
Trong bài viết này, Skills Bridge sẽ hướng dẫn bạn bí quyết dùng JSON Prompt, – cách giao tiếp với AI bằng cấu trúc dữ liệu giúp kiểm soát chi tiết chính xác gấp 5 lần. Bạn sẽ làm chủ quy trình 3 bước thiết lập "Trợ lý Gems" trên Gemini để tạo chuỗi ảnh đồng bộ nhân vật, màu sắc, và chỉnh sửa chi tiết vật thể chuẩn xác mà không cần biết lập trình. Khám phá ngay tư duy hệ thống hóa AI để nâng tầm sáng tạo của bạn
1. Tại Sao Lại Là JSON prompt?
Đầu tiên, Linh sẽ giải thích JSON prompt là gì.
JSON là viết tắt của JavaScript Object Notation, một định dạng dữ liệu dạng văn bản.
Nghe có vẻ kỹ thuật, nhưng hiểu đơn giản: JSON là một cách để ghi thông tin sao cho máy tính dễ đọc hơn.
Nhiều bạn nghe đến "JSON" có lẽ sẽ thấy hơi ngại vì trông nó giống như lập trình. Nhưng thực tế, hãy nghĩ về JSON prompt như một bản đồ của bức ảnh.
Thay vì viết những đoạn prompt dài để mô tả, chúng ta sẽ học cách giao tiếp với AI bằng một cấu trúc dữ liệu, giúp bạn tiết kiệm thời gian và nâng chất lượng câu lệnh.
JSON giúp phân rã bức ảnh thành từng thành những phần riêng biệt chi tiết: từ hành động, biểu cảm, màu sắc, góc máy, ánh sáng cho đến không gian.

Khi mọi thứ được liệt kê chi tiết, AI sẽ hiểu chính xác đâu là yếu tố bạn cần tạo mới hoặc chỉnh sửa.
Bây giờ hãy cùng Linh đi vào từng ví dụ chi tiết cách để bạn có thể áp dụng JSON prompt trong việc tạo ảnh bằng AI nha.
2. Tạo Chuỗi Hình Ảnh Thương Hiệu Đồng Bộ Nhân Vật
Giả sử bạn đang xây dựng hình ảnh cho một thương hiệu Matcha mang phong cách Nhật Bản cổ kính truyền thống.
Làm sao để tạo ra hàng chục bức ảnh khác mang đúng cái vibe của thương hiệu mà bạn mong muốn? Sau đây là quy trình 3 bước thiết lập trợ lý tạo ảnh AI để bạn làm được điều đó.
2.1 3 Bước Thiết Lập “Trợ lý tạo ảnh”
Bước 1: Tạo Visual Guideline
Bước đầu tiên, Linh sẽ tạo ra bộ tài liệu tạm gọi là “Visual guideline”. Đây sẽ là phần cấu trúc chung mà mọi hình ảnh bạn tạo ra đều đi theo hướng dẫn này.
Cách làm như sau, bạn chỉ cần tìm khoảng 3 đến 4 bức ảnh ưng ý, có thể là hình ảnh có sẵn trong máy của bạn hoặc, bạn cũng có thể tìm thêm hình ảnh có tone and mood ưng ý trên các nền tảng như Pexel hay Freepik. Sau đó, tải tất cả lên Gemini và yêu cầu:
Phân tích tất cả hình ảnh này. Tổng hợp thông tin về màu sắc, ánh sáng, góc độ camera, bố cục, chất liệu, câu chuyện đằng sau bức ảnh. Hãy tư duy như 1 Đạo diễn hình ảnh (DOP).
Và đây là kết quả mà Gemini trả về cho Linh.
Bạn cần đọc qua và trích ra những yếu tố cần thiết để hình thành “Visual guideline” của chính bạn. Nếu thấy vẫn thiếu chi tiết nào đó, bạn cũng có thể ghi chú thêm vào bộ tài liệu này hoặc làm việc tiếp với Gemini để cho ra kết quả ưng ý.
Linh sẽ lưu lại 5 yếu tố chính mà Linh xem là quan trọng nhất là:
Bảng màu (Color Palette)
Ánh sáng (Lighting)
Chất liệu (Texture)
Góc máy & Bố cục
Cuối cùng là Câu chuyện.

Những yếu tố phụ khác như nhân vật, hành động, biểu cảm, chúng ta có thể linh hoạt thay đổi tuỳ vào mục đích của bức ảnh nha.
Bạn có thể tham khảo bài viết: 10 phong cách hình được dùng nhiều nhất trên ChatGPT
Bước 2: Tạo Trợ Lý Gems
Bước tiếp theo, bắt đầu tạo Gems trong Gemini. Đặt tên cho phần Gems của bạn, điền mô tả. Ở phần chỉ dẫn instruction này, bạn sẽ dán toàn bộ đoạn “visual guideline” lúc nãy vào.
Vậy là bây giờ, bạn đã có 1 trợ lý AI tạo hình ảnh theo đúng yêu cầu mà bạn mong muốn. Bây giờ Linh sẽ bấm vào start chat để bắt đầu quá trình tạo ảnh nha.
NHƯNG MÀ KHOAN! Cần viết prompt như thế nào để có được hình đẹp bây giờ?
Đừng vội tạo ảnh ngay.
Bước 3: Tạo Khung JSON Prompt
Để nâng chất lượng đầu ra, bạn cần làm thêm bước thứ 3 là tạo 1 khung JSON prompt chung từ chính phần Visual guideline bạn đang có.
Linh sẽ copy cả đoạn guideline này và prompt cho Gemini tiếp tục tạo ra khung JSON prompt.
Câu lệnh Linh đang dùng trên màn hình, bạn có thể lấy trong bài blog ở phía dưới nha.
Từ visual guideline này, hãy tạo 1 đoạn template JSON prompt bằng tiếng Việt. Đầu ra là 1 đoạn template chung dùng để tạo hình ảnh chuẩn thương hiệu.
Lưu ý: Không tạo hình ảnh, hãy cho ra kết quả là đoạn JSON prompt chung.
Và đây chính là khung JSON prompt mà Gemini đã đưa ra cho Linh.
Phần đầu tiên “mô tả chung” bạn có thể linh hoạt thay đổi tuỳ vào ý tưởng hình ảnh

Những phần ở dưới như: bảng màu, ánh sáng, góc máy, bố cục, câu chuyện bạn có thể giữ nguyên hoặc điều chỉnh để phù hợp với ý đồ từng hình ảnh mà bạn muốn tạo. Nhớ lưu lại khung JSON prompt này nha.
2.2 Bắt đầu Tạo Ảnh
Sau khi đã có khung JSON prompt chuẩn rồi, Linh sẽ bắt đầu hiện thực hóa ý tưởng cho chuỗi hình ảnh thương hiệu.
Linh muốn tạo ra hình ảnh nhân vật nữ, mang nét đẹp thanh tú kiểu Á Đông, đang thực hiện công đoạn rây bột trong quá trình pha chế matcha. Không gian quán có phần cổ kính, hoài niệm, đậm chất truyền thống.
Trong chính khung chat của Gems vừa tạo, Bạn chỉ cần copy đoạn khung JSON prompt này, chỉnh sửa phần “tổng quan” ở đây. Bạn cũng có thể chỉnh sửa lại phần “góc máy” khi cần. Linh sẽ điều chỉnh lại thành góc máy ngang tầm mắt (Eye-level shot) nha. Khi mọi thứ đã hoàn tất, gửi câu lệnh đi và bắt đầu tạo ảnh.
Và đây là thành quả Linh có.

Bạn có thể thấy. Từ biểu cảm, ánh sáng, tone màu và không gian đều sát với phần visual guideline mà chúng ta đã tạo đúng không?
Tiếp đến, Linh muốn cô gái sẽ chuyển sang bước tiếp theo trong quá trình pha chế là đánh bọt matcha.
Bạn không cần phải prompt lại từ đầu. Để chắc chắn mọi thứ không thay đổi ngoại trừ hành động của nhân vật. Bạn sẽ yêu cầu công cụ “Chuyển hình ảnh này sang dạng JSON prompt bằng tiếng Việt”.
Sau đó copy lại đoạn bộ đoạn JSON prompt này, tìm đến đoạn “Hành động”, thay đoạn prompt là: "Đang dùng Chasen đánh tan bột matcha trong bát thủy tinh để tạo lớp bọt mịn".
Giờ thì cùng xem thành quả nha.

Mọi thứ từ góc máy, ánh sáng, bố cục, khuôn mặt nhân vật đều được giữ nguyên. Và cứ đúng công thức như thế, chỉ cần đổi phần mô tả chung, hành động, đổi một chút góc máy.
Bạn sẽ tiếp tục tạo ra được hàng loạt bức ảnh như thế này.

Quy trình nghe có vẻ hơi dài nhưng thật ra rất đơn giản. Để Linh tóm tắt lại cho bạn nha.
Đầu tiên, chúng ta sẽ tạo ra 1 bản visual guideline. Sau đó, dùng tính năng Gems trong Gemini để custom trợ lý AI tạo ảnh riêng cho thương hiệu.
Tiếp đến, copy phần visual guideline dán vào phần chỉ dẫn cho Gems. Bắt đầu chat với trợ lý Gems này, yêu cầu công cụ tạo khung JSON prompt từ chính visual guideline đó.
Vậy là bạn sẽ tạo ra được loạt hình ảnh từ khung JSON prompt này đồng bộ về mặt tone màu, ánh sáng, cảm xúc mà bức ảnh mang lại.
Đây chính là đáp án để bạn trả lời cho câu hỏi làm sao để tạo ra hình ảnh đồng bộ, đúng tone thương hiệu.
Giờ thì cùng Linh đi đến phần tiếp theo, chỉnh sửa chi tiết ảnh với JSON prompt nha.
3. Chỉnh Sửa Chi Tiết Ảnh Với JSON Prompt
Ở phần này, Linh sẽ chia sẻ ba ứng dụng thực tế trong việc dùng JSON prompt để chỉnh sửa hình ảnh cho các ngành nghề khác nhau.
Mục tiêu là giúp bạn kiểm soát hình ảnh tạo bởi AI, tối ưu thời gian chỉnh sửa, không cần phải prompt đi prompt lại.
Cùng bắt đầu nha.
3.1 Thay Đổi Thời Tiết, Góc Máy & Cách Đánh Sáng
Ví dụ đầu tiên Linh muốn chia sẻ về cách chúng ta có thể thay đổi thời tiết, góc máy và hướng ánh sáng.
Bạn có một bức ảnh chụp không gian homestay ngập tràn ánh nắng như thế này.

Nhưng sắp đến mùa mưa rồi, bạn cần một phiên bản hình ảnh phòng ngủ mang cảm giác ấm cúng giữa một buổi chiều mưa lãng mạn để đăng bài quảng cáo đúng không?
Nếu bạn không thuận tiện để chụp lại. Hãy dùng JSON prompt.
Linh sẽ tải hình ảnh này lên Gemini, nhập câu lệnh yêu cầu chuyển hình ảnh này sang dạng file JSON prompt bằng tiếng Việt.
Copy toàn bộ đoạn prompt này xuống khung chat. Sau đó, bạn sẽ thay đổi chi tiết : “Ánh sáng vàng ấm của hoàng hôn chiếu qua cửa sổ” thành “Khung cảnh trời mưa lãng mạn qua cửa sổ, hướng ánh sáng trong phòng thay đổi theo thời tiết bên ngoài".
Bắt đầu tạo ảnh, và đây là thành quả bạn có.
Bức ảnh của chúng ta đã chuyển từ nắng sang mưa rồi.

Mọi chi tiết ảnh, từ chiếc ghế sofa ở xa đến khung cảnh bên ngoài đều không bị thay đổi.
Chỉ có thời tiết và phần ánh sáng có chút thay đổi theo đúng ý muốn.
Thêm vào đó, Linh cần tạo thêm hình ảnh chụp ở 1 góc độ khác để thấy được trọn vẹn view trời mưa.
Tiếp tục nhập câu lệnh yêu cầu Gemini phân tích hình ảnh này ra dạng JSON. Sau đó, tìm đến đoạn “góc chụp” ở đây, nhập thêm câu lệnh: “Thay đổi góc chụp thẳng lên phía đầu giường”.
Và bạn sẽ có ngay 1 góc view khác lấy toàn bộ phần cửa sổ đầu giường. Rất hợp lý đúng không.

Đó là ví dụ đầu tiên về cách bạn có thể dùng JSON prompt chỉnh sửa phần thời tiết, ánh sáng và góc độ hình ảnh.

Vậy nếu Linh muốn thay đổi chi tiết vật thể trong ảnh thì sao? Cùng đến với ví dụ kế tiếp nha.
3.2 Chỉnh Sửa Màu Sắc & Chất Liệu
Giả sử bạn có một bức ảnh chụp lookbook người mẫu đang cầm chiếc túi xách da màu đen như thế này.

Nhưng bạn lại muốn thay đổi chiếc túi này thành chất liệu vải nhung màu xanh nhạt để hợp với concept mới.
Dùng câu lệnh bình thường sẽ có rủi ro AI đổi luôn khuôn mặt người mẫu hoặc thay đổi chi tiết trang phục.

Nhưng với JSON prompt, bạn làm chủ hoàn toàn bức ảnh. Cách làm cũng tương tự như ví dụ trước, bạn tải ảnh này lên Gemini, yêu cầu chuyển sang dạng JSON prompt bằng tiếng Việt.
Tiếp đến, tìm đúng phần thông tin miêu tả về chiếc túi xách, đổi màu đen thành mã màu bạn mong muốn và đổi chất liệu thành vải nhung.
Và thế là bạn đã có hình ảnh người mẫu với chiếc túi xách mới.

Thần thái người mẫu, ánh sáng, bố cục hình, mọi thứ đều không thay đổi.
Linh vẫn chưa hài lòng lắm với chiếc áo khoác ngoài này. Thử đổi thành áo khoác dài màu đen xem có hợp hơn không nha.
Tiếp tục yêu cầu công cụ chuyển hình mới này sang dạng JSON prompt.
Tìm đến phần cấu trúc thông tin liên quan đến chiếc áo, viết prompt thay đổi màu sắc và chất liệu chiếc áo thành màu đen.
Và thế là chúng ta lại có thêm 1 bộ outfit mới với nhân vật giữ nguyên như cũ.

Rất thú vị đúng không?
Trường hợp bạn đang làm trong những lĩnh vực như thiết kế nội thất, hay thiết kế công nghiệp. Bạn cũng có thể áp dụng cách làm này khi cần chỉnh sửa nhanh màu sắc, vật liệu của từng chủ thể có trong ảnh.
Ví dụ như với hình ảnh phòng khách này,

Linh có thể đổi chiếc ghế bên phải thành chiếc ghế sofa nhỏ.

Đổi bộ đèn chùm thành bộ đèn làm từ mây tre đan

Hay đổi cả màu của bộ sofa mà vẫn giữ nguyên các thành phần như ảnh cũ.

Những chi tiết đi kèm như chiếc gối hay lọ hoa vẫn ở đó, không hề thay đổi.
Đó là cách mà Linh áp dụng JSON prompt vào việc kiểm soát các chi tiết trên ảnh.
Nếu bạn đã đi cùng Linh đến đây, Linh tin rằng bạn không xem video này chỉ để biết thêm một bí quyết mới.
Có lẽ điều bạn thực sự đang tìm kiếm là một bộ kỹ năng trọn vẹn giúp chính bản thân bạn đi xa hơn trong công việc. Và Linh muốn chia sẻ với bạn cách để làm được điều đó.
Linh rất thích cách tiếp cận này vì nó phản ánh đúng một tư duy mà Linh luôn tin tưởng: phát triển năng lực cũng cần được cá nhân hóa.
Trở lại với các ví dụ tạo ảnh. Không chỉ với hình ảnh, bạn cũng có thể dùng JSON prompt để sáng tạo phần thông điệp bằng chữ và logo.
Cùng Linh đi đến phần kế tiếp nha.
3.3 Sáng Tạo Thông Điệp & Logo
Ở đây Linh có 1 hình mẫu với bảng billboard quảng cáo ngoài trời. Bạn có thể tìm kiếm dạng hình này trên Canva, Freepik hoặc các nguồn hình stock mẫu cho phép sử dụng nha.

Nếu phải xóa phần chữ cũ rồi design lại, canh chỉnh rất mất thời gian đúng không.
Thay vào đó, Linh sẽ tải hình ảnh này lên, yêu cầu công cụ chuyển sang dạng JSON prompt bằng tiếng Việt.
Khi Gemini trả về kết quả, Linh chỉ cần việc tìm đến phần “Text” ở đây, chỉnh sửa lại thông điệp. Bạn cũng có thể sửa lại màu chữ ở phần color.
Và với mục “Element”, Linh yêu cầu hãy dùng logo Skills Bridge đính kèm. Sau đó chèn thêm logo Skills Bridge. Vậy là xong.
Bắt đầu tạo ảnh mới, và đây là kết quả Linh nhận được.

Rất nhanh và cũng khá hoàn chỉnh ha.
Với quy trình và công thức tương tự, bạn có thể áp dụng cách này để tạo ảnh làm slide deck, proposal và tài liệu nội bộ.
Mọi thứ đều trong tầm kiểm soát, từ font chữ, màu chữ, đảm bảo logo hoàn toàn chính xác không bị sai lệch.
Quan trọng hơn, chỉ trong 1 lần prompt tạo ảnh duy nhất, không cần phải prompt lại nhiều lần. Đó chính là tính hiệu quả của JSON prompt trong việc chỉnh sửa phần text trên hình ảnh.

4. Bắt Đầu Tận Dụng AI Với Tư Duy Mới
Bạn có thể thấy, trong kỷ nguyên AI, lợi thế cạnh tranh không nằm ở việc bạn biết dùng công cụ nào. Lợi thế nằm ở việc bạn có tư duy hệ thống để định hướng, kiểm soát và khai thác sức mạnh từ AI một cách hiệu quả.
JSON Prompt chính là một trong những cách giúp chúng ta xây dựng quy trình tạo hình chất lượng, nhất quán, và có thể nhân rộng.
Bạn không cần mất quá nhiều thời gian thử và sai với những câu lệnh rời rạc. Cũng không phải thủ công ngồi hàng giờ để kéo thả, chỉnh sửa từng chi tiết. Khi bạn kiểm soát tốt dữ liệu đầu vào và cấu trúc hướng dẫn cho AI, bạn không chỉ làm việc nhanh hơn mà còn mở rộng được chất lượng sáng tạo của mình.
Đừng ngại áp dụng những tư duy và cách thức mới mẻ này vào công việc nha.
FAQ
CÂU 1: Không biết lập trình hay code có dùng được JSON prompt không?
Trả lời: Hoàn toàn được. Bạn không cần tự gõ code hay các dấu ngoặc. Chỉ cần tải ảnh mẫu lên Gemini và ra lệnh: "Chuyển hình ảnh này thành cấu trúc JSON prompt bằng tiếng Việt". AI sẽ tự làm bản mẫu, việc của bạn chỉ là sửa lại phần chữ mô tả bên trong.
CÂU 2: Cách này có áp dụng được cho Midjourney hay Stable Diffusion không?
Trả lời: Có, nhưng cách hoạt động sẽ khác nhau:
- Gemini (Imagen 3) & ChatGPT (DALL-E 3): Hoạt động cực tốt vì các AI này hiểu rất sâu cấu trúc dữ liệu JSON.
- Midjourney: Chuộng ngôn ngữ tự nhiên hơn. Bạn nên dùng khung JSON để tư duy, sau đó chuyển nó thành dạng các cụm từ phân tách bằng dấu phẩy , khi nhập vào Midjourney.
CÂU 3: Làm sao để giữ khuôn mặt nhân vật không bị đổi khi thay đổi hành động?
Trả lời: Cố định trường thông tin nhân vật. Trong khung JSON, bạn hãy mô tả thật kỹ và giữ nguyên 100% nội dung ở mục Nhan_vat (như tuổi tác, nét mặt, kiểu tóc). Khi bạn chỉ thay đổi nội dung ở mục Hanh_dong, AI sẽ hiểu và chỉ tập trung đổi động tác chứ không đổi mặt.
CÂU 4: Tại sao đôi khi dùng JSON prompt nhưng AI vẫn tạo ảnh sai lệch?
Trả lời: Thường do 2 lý do:
1. JSON quá ôm đồm: Bạn nhồi nhét quá nhiều chi tiết mâu thuẫn. Hãy rút gọn lại, chỉ giữ 5 - 7 mục chính.
2. Thiếu ưu tiên: AI bị loãng thông tin. Hãy đưa những chi tiết quan trọng nhất lên các dòng đầu tiên của khung JSON để AI ưu tiên xử lý.
CÂU 5: Nên viết mô tả bên trong khung JSON bằng tiếng Anh hay tiếng Việt để ảnh đẹp nhất?
Trả lời: Nên ưu tiên tiếng Anh cho phần mô tả chi tiết. Dù Gemini hiểu tiếng Việt rất tốt, nhưng các lõi công cụ tạo ảnh hiện nay vẫn "nhạy" và hiểu chính xác nhất bằng tiếng Anh. Mẹo nhỏ là bạn cứ sửa khung JSON bằng tiếng Việt cho thoải mái, rồi nhờ Gemini: "Dịch toàn bộ nội dung bên trong các thẻ JSON này sang tiếng Anh" trước khi nhấn lệnh tạo ảnh nhé!


