Mục lục
Trong bài viết này, Linh sẽ chia sẻ với các bạn cách tạo TVC chuyên nghiệp với AI mà ai cũng có thể làm được, ngay cả với những bạn mới bắt đầu, chưa có nhiều kinh nghiệm làm quay dựng video.
Linh sẽ cùng các bạn đi qua từng bước một, từ việc xây dựng ý tưởng, thiết kế kịch bản hình ảnh, tạo chuyển động cho video, cho đến việc sản xuất âm nhạc và tạo giọng đọc nhanh chóng với AI.
1. Tạo TVC Cho Thương Hiệu Nước Hoa Verde
Để bắt đầu dự án này, chúng ta cần một đề bài cụ thể. Trong bài viết ngày hôm nay, chúng ta sẽ cùng nhau thử nghiệm với một thương hiệu nước hoa giả định mang tên Verde. Nhiệm vụ là phải tạo ra một TVC ngắn khoảng 15 đến 30 giây để quảng cáo cho sản phẩm này.
Trước khi đi vào chi tiết, chúng ta cần phải xác định yêu cầu sáng tạo, hay còn gọi là creative brief cụ thể cho TVC này. Đối với thương hiệu nước hoa Verde, chúng ta sẽ định vị đây là một dòng nước hoa cao cấp dành cho những người trẻ đi làm, những người đang nỗ lực phát triển bản thân và khẳng định vị thế của mình trong sự nghiệp.
Do đó, phong cách hình ảnh của video phải mang tính hiện đại, thanh lịch, sang trọng và tràn đầy năng lượng tích cực. Tone màu chủ đạo sẽ là màu xanh ngọc đặc trưng của thương hiệu của Skills Bridge!
2. Thực Hành
Sau khi đã có đủ thông tin về sản phẩm, giờ là lúc chúng ta bước vào phần thú vị nhất của bài viết ngày hôm nay, đó là thực hành tạo TVC với sự hỗ trợ của các công cụ Gemini và Google Flow.
Trong bài viết hôm nay, chúng ta sẽ thực hiện tạo video quảng cáo theo quy trình 5 bước:
Bước 1 là lên kịch bản và mô tả phân cảnh. Sử dụng Gemini để xây dựng kịch bản và mô tả chi tiết cho các phân cảnh. Đây là "xương sống" giúp bạn hình dung toàn bộ câu chuyện trước khi bắt tay vào làm.
Bước 2 là sử dụng Google Flow để tạo "Hero shot" (ảnh chủ đạo) và chuyển hóa các phân cảnh trong storyboard thành những thước phim thực tế.
Ở Bước 3, bạn sẽ biết cách tạo nhạc nền bằng Google Flow Music sao cho phù hợp với nhịp điệu và cảm xúc thương hiệu.
Sau đó đến bước 4 là Tạo giọng đọc (Voiceover): Sử dụng tính năng chuyển đổi văn bản thành giọng nói của Google AI Studio để tạo giọng đọc studio truyền cảm, tự nhiên.
Và bước cuối cùng là hậu kỳ. Đây là bước bạn cần cắt ghép và căn chỉnh âm thanh, hình ảnh hoàn chỉnh trên CapCut để tạo nên sản phẩm cuối cùng.
2.1. Bước 1: Tạo Kịch Bản, Mô Tả Phân Cảnh Với Gemini
Bước đầu tiên trong quá trình sản xuất hình ảnh chính là tạo storyboard. Storyboard giúp chúng ta hình dung trực quan toàn bộ câu chuyện sẽ diễn ra như thế nào trước khi tiến hành làm video.
Để làm việc này, chúng ta sẽ sử dụng một công cụ AI hỗ trợ trò chuyện và xử lý hình ảnh. Ở đây Linh sẽ dùng Gemini, nhưng bạn hoàn toàn có thể sử dụng các AI khác như ChatGPT hoặc Claude đều được nha!
Ok, đầu tiên, bạn cần tải một bức hình sản phẩm gốc của chai nước hoa Verde lên Gemini và nhập câu lệnh là:
“Tôi đang muốn thực hiện một TVC quảng cáo dài khoảng 15 giây cho chai nước hoa trong ảnh với thương hiệu Verde. Bạn hãy tạo ra 4 phân cảnh. Hãy mô tả chi tiết về bố cục, góc máy, ánh sáng và bối cảnh của từng cảnh quay, đồng thời đảm bảo rằng chai nước hoa phải giữ nguyên thiết kế như trong bức ảnh gốc đã tải lên.”
Bằng cách sử dụng câu lệnh này, bạn sẽ thiết lập được một khung chuẩn cho video về cả thời lượng lẫn số lượng các phân cảnh. Việc lồng ghép các yếu tố kỹ thuật điện ảnh như ánh sáng hay góc quay sẽ định hướng AI tạo ra những mô tả chi tiết, hỗ trợ cho quá trình sản xuất hình ảnh và video ở các bước sau.
Đặc biệt, yêu cầu giữ nguyên thiết kế sản phẩm là yếu tố quan trọng để đảm bảo AI không tự ý làm sai lệch nhận diện thương hiệu của bạn.
Sau khi bạn gửi câu lệnh, AI sẽ xử lý thông tin và trả về một bản mô tả chi tiết cho 4 phân cảnh như thế này.
Lúc này, việc của bạn là phải đọc thật kỹ và tiến hành chỉnh sửa nếu thấy có điểm nào chưa thực sự phù hợp. Bởi vì ở các bước sau, phần mô tả các phân cảnh này sẽ đóng vai trò như các câu lệnh tạo ảnh và video cho quảng cáo.
Vậy nên, bạn hãy tiếp tục trò chuyện với Gemini để chỉnh sửa các chi tiết về ánh sáng hay góc quay cho đến khi bạn có được các bản mô tả ưng ý nhất. Việc chuẩn bị kỹ lưỡng ở bước này sẽ giúp các bước tiếp theo diễn ra mượt mà và chính xác hơn. Linh sẽ đi tiếp với các mô tả này nha.
2.2. Bước 2: Tạo Video Bằng Google Flow
Khi đã có một mô tả chi tiết, chúng ta sẽ chuyển sang giai đoạn tạo ra các phân cảnh video chuyển động thực tế.
Ở bước này chúng ta cần thực hiện 3 nhiệm vụ. Nhiệm vụ đầu tiên là thiết kế bức ảnh chủ đạo (hero shot) đầy ấn tượng cho sản phẩm. Tiếp theo, chúng ta tiến hành xây dựng storyboard chi tiết cho TVC. Và nhiệm vụ cuối cùng chính là tạo video cho từng phân cảnh cụ thể.
Trong phần này, chúng ta sẽ sử dụng Google Flow. Đây là một công cụ mạnh mẽ cho phép chúng ta kiểm soát hình ảnh và chuyển động một cách linh hoạt với các mô hình tạo video của Google như Veo và Gemini Omni.
Để bắt đầu, bạn truy cập vào ứng dụng Google Flow qua đường link trên màn hình, đăng nhập bằng tài khoản Google. Sau đó, chọn “New Project” hay Tạo dự án mới để bắt đầu.
2.2.1. Tạo Ảnh Chủ Đạo (Hero Shot) Cho Sản Phẩm
OK, giờ chúng ta đến nhiệm vụ đầu tiên là tạo ra bức ảnh chủ đạo, hay còn gọi là hero shot, cho sản phẩm. Hero shot là hình ảnh chính, nổi bật nhất dùng để “bán” một sản phẩm hay dịch vụ nào đó. Nhiệm vụ chính của hero shot là giúp người xem hiểu ngay mình đang nhìn thấy gì, sản phẩm này dành cho ai, và vì sao nó hấp dẫn.
Ví dụ, trong quảng cáo bánh hamburger, hero shot có thể là hình chiếc burger được chụp cận cảnh, bánh vàng óng, phô mai chảy tràn, rau tươi xanh và thịt mọng nước.
Hay trong trường hợp của nước hoa Verde, hero shot có thể là chai nước hoa đặt ở trung tâm, ánh sáng đẹp, v.v.
Và để tạo hero shot đó, trong giao diện của Google Flow, bạn chọn dấu cộng ở khung chat, chọn “Upload media” để tải hình gốc của chai nước hoa Verde lên.
Tiếp theo bạn nhập câu lệnh đơn giản là: “Tạo ảnh hero shot cho sản phẩm @ ảnh nước hoa, nền phía sau phù hợp với sản phẩm, chất lượng studio chuyên nghiệp.”
Một mẹo nhỏ ở đây dành cho các bạn! Bạn có thể thấy trong câu lệnh vừa rồi có phần @ ảnh nước hoa. Đây là một tính năng của Flow, gọi là gắn thẻ hình ảnh. Với tính năng này, bạn có thể yêu cầu Flow tạo ảnh dựa trên một bức ảnh sản phẩm cụ thể của mình bằng cách tag tên của bức ảnh đó trực tiếp vào câu lệnh.
Bằng cách này, bạn có thể kiểm soát tốt hơn kết quả đầu ra của hình ảnh và video, đảm bảo tính nhất quán của sản phẩm và nhân vật cần tạo xuyên suốt quá trình sản xuất mà không cần phải nhắc đi nhắc lại, hay mô tả quá dài dòng.
OK, trở lại với quá trình tạo ảnh hero shot. Sau khi nhập câu lệnh xong, bạn nhấn vào nút thiết lập bên dưới khung chat. Ở đây, bạn có thể chọn tỷ lệ hình ảnh, số lượng hình ảnh ở mỗi lần tạo và mô hình được sử dụng.
Bởi vì chúng ta sẽ tạo video có tỷ lệ 16:9, nên ở đây, khi tạo hình ảnh, Linh cũng sẽ chọn tỷ lệ này. Sau đó, chọn số lượng ảnh tạo ra là 4 để có thêm nhiều phương án tham khảo hơn, và cuối cùng chọn mô hình mặc định là Nano Banana Pro nha!
Sau khi nhấn enter và đợi một phút, Flow tạo được 4 ảnh hero shot như thế này. Ở đây, bạn chỉ cần chọn ảnh mà bạn ưng ý nhất là được.
Sau khi đã chọn được hero shot cuối cùng, bạn di chuyển chuột đến hình vừa tạo, chọn dấu ba chấm, sau đó chọn Rename để đổi tên thành “Hero Shot”.
Vì sao bạn cần làm thao tác này? Đó là vì trong các bước sau, bạn sẽ tạo thêm rất nhiều hình ảnh, nên việc đổi tên như vậy sẽ giúp bạn tìm kiếm, cũng như gắn thẻ dễ hơn.
2.2.2. Tạo Ảnh Storyboard
Nhiệm vụ thứ 2 là tạo ra ảnh của storyboard dựa trên mô tả các phân cảnh đã có ở bước 1. Thay vì tạo lẻ tẻ từng bức ảnh dễ dẫn đến việc mỗi cảnh nhìn như một kiểu khác nhau, chúng ta sẽ nhập toàn bộ mô tả các phân cảnh đã chuẩn bị ở bước trước vào hệ thống của Flow để tạo ra một storyboard hình ảnh chung. Việc này giúp AI của Flow hiểu được mạch truyện tổng thể, từ đó tối ưu hóa màu sắc và phong cách thiết kế sao cho các bức ảnh có sự liên kết chặt chẽ với nhau.
Sau khi đã nhập đầy đủ mô tả cho các phân cảnh, chúng ta sẽ tiếp tục tạo ảnh với Nano Banana.
Và khi Flow trả về 4 phiên bản storyboard như thế này, bạn có thể nhấp chọn từng ảnh để xem thử, nếu chưa hài lòng, bạn có thể tiếp tục tạo thêm để có thêm nhiều phiên bản nữa để chọn nha! Ở đây, Linh thấy phiên bản này khá ổn, nên sẽ chốt với Storyboard này.

2.2.3- Tạo Các Phân Cảnh Ngắn
Giờ đến nhiệm vụ thứ 3, chúng ta sẽ tạo các phân cảnh trong storyboard đã chọn bằng chức năng Agent. Đây là một chức năng mới và tiện lợi của Google Flow giúp bạn có thể tạo hàng loạt ảnh hay video cùng một lúc, thay vì phải nhập từng prompt từ câu lệnh riêng lẻ.
Ví dụ, để tạo ảnh cho từng phân cảnh trong storyboard, Linh không cần phải gõ: “Hãy tạo ảnh trên góc bên phải của storyboard, đảm bảo đúng với hình ảnh thương hiệu trong ảnh hero shot.”
Với chức năng agent, Linh chỉ cần click chọn tính năng agent trong khung chat, sau đó gõ câu lệnh: “Tạo hình ảnh cho 4 phân cảnh trong hình @ ảnh storyboard vừa tạo. Đảm bảo đúng với hình ảnh sản phẩm trong ảnh @ ảnh hero shot.” Và sau đó nhấn enter.
Trong câu lệnh này, Linh tiếp tục dùng tính năng gắn thẻ của Google Flow. Việc này giúp Agent xác định chính xác ảnh storyboard cần dùng và đảm bảo rằng hình ảnh sản phẩm luôn đồng nhất, chuẩn xác như trong bức ảnh hero shot mà chúng ta đã chuẩn bị.
Sau đó, Agent sẽ bắt đầu xử lý, và chỉ sau vài phút sẽ trả về 4 hình tương ứng với 4 phân cảnh như thế này.
Tới bước này, bạn đã có thể tạo video với 4 phân cảnh hiện tại. Tuy nhiên, Linh sẽ đi thêm một bước nữa là tạo các biến thể của 4 ảnh trên để có thêm tài nguyên cho bước tạo video tiếp theo nha!
Dù sao thì tạo ảnh bằng Google Flow cũng miễn phí mà, đúng không? Để thực hiện, bạn chỉ cần yêu cầu thêm với Agent là: “Hãy tạo thêm các phân cảnh biến thể của 4 ảnh này.” và gắn thẻ 4 ảnh vừa tạo vào khung chat luôn nha!
Ok, sau khi thao tác thêm 1 - 2 lần thì Linh đã có thêm nhiều options cho các phân cảnh. Tiếp theo, Linh chỉ cần chọn các ảnh trong cùng một phân cảnh để tạo video. Ví dụ, Linh chọn 3 ảnh này và nhập câu lệnh với Agent: “Hãy tạo video với 3 ảnh này. Đảm bảo hình ảnh sắc nét, chuyên nghiệp.” và nhấn enter.
Sau vài phút “xào nấu” thì Google Flow trả về cho Linh video như thế này. Và cứ tương tự, bạn hãy tạo thêm video cho 3 phân cảnh còn lại nha!
Sau khi đã tạo xong tất cả các phân cảnh và cảm thấy hài lòng với chuyển động của từng đoạn ngắn, công việc tiếp theo của chúng ta rất đơn giản, đó là tải tất cả các đoạn video đơn lẻ này về máy tính. Hãy tạo một thư mục riêng để lưu trữ chúng , sẵn sàng cho bước ghép nối và hoàn thiện sản phẩm ở bước cuối cùng nha.
Vậy là TVC của chúng ta đang dần thành hình rồi đúng không? Làm video hay hình ảnh với AI thì thú vị thật.
Nhưng để không chỉ “làm thử một vài cái cho vui”, mà thật sự biến AI thành năng lực sản xuất hình ảnh và video ứng dụng được trong công việc, bạn cần một quy trình rõ ràng, đúng chuẩn và có thể lặp lại. Đó chính là lý do Skills Bridge xây dựng khóa học Gen AI Studio.
Trong khoá học, bạn sẽ được học cách sử dụng và kết hợp sức mạnh của hàng loạt công cụ như ChatGPT, Gemini, Google AI Studio, Canva Pro, Google Flow, HeyGen, CapCut... để sáng tạo từ A đến Z: từ kịch bản, storyboard, lồng tiếng, khớp khẩu hình (lip-sync), cho đến hậu kỳ video hoàn chỉnh, nhất quán đúng với nhận diện thương hiệu.
Đặc biệt, Skills Bridge đang có chương trình ưu đãi đăng ký sớm hấp dẫn, kèm theo bộ quà tặng trị giá lên đến 1.299.000 đồng. Linh đã để link nhận ưu đãi ngay tại đây, các bạn đừng bỏ lỡ và hãy đăng ký ngay hôm nay nha!
2.3. Bước 3: Tạo Nhạc Bằng Google Flow Music
Ok, giờ chúng ta sẽ đến với bước tiếp theo là tạo âm nhạc cho TVC để video có nhịp điệu và khơi gợi cảm xúc hơn.
Để tạo ra một bản nhạc nền độc bản và chuyên nghiệp cho Verde, chúng ta sẽ sử dụng công cụ Google Flow Music.
Đầu tiên, bạn hãy truy cập vào công cụ Google Flow Music bằng đường link hiển thị trên màn hình của video. Các bước đăng nhập và công thức tạo nhạc đã được Trí Skills Bridge giới thiệu trong video này, nếu bạn chưa xem hãy nhấp vào xem nha!
Ok, giờ Linh sẽ dán câu lệnh tạo nhạc vào khung chat như thế này, và nhấn enter.
Hệ thống Google Flow Music sẽ phân tích yêu cầu của bạn và tạo ra một vài phiên bản nhạc nền khác nhau chỉ trong vòng chưa đầy một phút. Khi kết quả hiện ra, bạn có thể nghe từng đoạn nhạc và chọn ra đoạn âm thanh phù hợp nhất. Sau đó, bạn nhấn vào nút tải về để lưu đoạn nhạc này dưới dạng file âm thanh trong máy tính của mình nha.
2.4. Bước 4: Tạo Giọng Đọc Bằng Google AI Studio
Vậy là đến đây, chúng ta đã có các phân cảnh riêng lẻ và nhạc nền cho video quảng cáo.
Mảnh ghép cuối cùng để hoàn thiện phần âm thanh cho TVC quảng cáo của chúng ta chính là giọng đọc thuyết minh, hay còn gọi là voiceover.
Giọng đọc sẽ giúp truyền tải trực tiếp thông điệp cốt lõi của thương hiệu đến tai người nghe, tạo nên sự kết nối và chuyên nghiệp.
Ở bước này, chúng ta sẽ sử dụng công cụ Google AI Studio để tạo ra một giọng đọc tự nhiên và phù hợp. Đây là công cụ mạnh mẽ của Google, cung cấp các công nghệ chuyển đổi văn bản thành giọng nói chất lượng cao.
Các bạn hãy truy cập vào đường link của Google AI Studio đang hiển thị trên màn hình.
Tại đây, đầu tiên là các bạn cần chọn giọng đọc mà mình mong muốn. Hệ thống cung cấp rất nhiều tùy chọn giọng đọc khác nhau, của nam và nữ, với các ngữ điệu vùng miền và tông giọng đa dạng.
Bạn có thể nhấn ở đây và nghe thử từng giọng đọc mẫu để tìm ra giọng đọc phù hợp nhất với tinh thần của thương hiệu của mình nha.
Đối với ví dụ về video quảng cáo của Verde, Linh sẽ thử chọn một giọng đọc nam có tông trầm ấm, phát âm rõ ràng, tốc độ vừa phải, mang lại cảm giác đáng tin cậy, tự tin và tràn đầy cảm hứng.
Sau khi đã chọn được giọng đọc ưng ý, việc tiếp theo là điền nội dung cần thuyết minh vào ô văn bản. Cho ví dụ này, vì đây chỉ là một video ngắn và chủ yếu tập trung vào thể hiện hình ảnh sản phẩm nên Linh sẽ dùng một kịch bản ngắn gọn thôi. Ví dụ là chỉ một câu để ở cuối video như slogan, bao gồm tên sản phẩm: “Nước hoa Verde - Dẫn lối thành công.”
Một mẹo nhỏ ở đây nếu kịch bản của bạn là các đoạn lời thoại dài hơn, thì các bạn nên sử dụng các dấu phẩy, dấu chấm hoặc khoảng trống một cách hợp lý để AI biết chỗ nào cần ngắt nghỉ hơi, giúp giọng đọc trở nên tự nhiên và có nhịp điệu giống người thật hơn.
Sau khi đã thiết lập xong xuôi, các bạn nhấn nút tạo giọng đọc. Chỉ mất vài giây, hệ thống sẽ trả về file âm thanh giọng đọc hoàn chỉnh. Bạn hãy nghe lại xem giọng đọc đã chính xác và có độ truyền cảm như mong muốn chưa nha. Khi đã hài lòng, bạn tiến hành tải file giọng đọc này về máy tính để chuẩn bị cho bước lắp ráp cuối cùng.
2.5. Bước 5: Hậu Kỳ Video Bằng Capcut
Vậy là sau 4 bước trên, bạn đã có đầy đủ yếu tố cần thiết để tạo một video, từ các đoạn video cho từng phân cảnh đến nhạc nền và giọng đọc thuyết minh.
Ở bước cuối cùng này, bạn chỉ cần tải tất cả các thành phẩm ở bước trước vào dự án mới trong CapCut để bắt đầu cắt ghép.
Các bạn chỉ cần kéo thả các đoạn video đã tải về vào dòng thời gian theo đúng thứ tự của storyboard, đặt bản nhạc nền của Google Flow Music xuống phía dưới, sau đó căn chỉnh file giọng đọc từ Google AI Studio sao cho khớp với phân cảnh hình ảnh tương ứng.
Một lưu ý nhỏ là các bạn hãy điều chỉnh âm lượng của nhạc nền nhỏ xuống một chút ở những đoạn có giọng đọc vang lên để người nghe có thể nghe rõ thông điệp, và đẩy âm lượng lớn hơn ở những đoạn chuyển cảnh nghệ thuật để tạo điểm nhấn cảm xúc.
Sau khi hậu kỳ xong, bạn chỉ cần nhấn Export ở góc phải màn hình để xuất video là xong nha!
Lời kết:
Vậy là chúng ta đã cùng nhau đi qua toàn bộ hành trình tạo video quảng cáo nước hoa Verde.
Từ một ý tưởng ban đầu, bạn giờ đây có thể dùng AI để vẽ nên một kịch bản phân cảnh chi tiết, biến những bức ảnh tĩnh thành những thước phim chuyển động mượt mà bằng công cụ Google Flow, tự tay sản xuất một bản nhạc nền đầy cảm xúc với Google Flow Music và tạo ra một giọng đọc chuẩn studio từ Google AI Studio.
Những công cụ AI này không thể hoàn toàn thay thế được tư duy thẩm mỹ và sự nhạy bén của con người, nhưng chúng chắc chắn là những người bạn đồng hành đắc lực giúp bạn nhân bản hiệu suất công việc lên gấp nhiều lần.
Mong là qua bài viết hướng dẫn rất chi tiết ngày hôm nay của Linh, các bạn đã bỏ túi được những kinh nghiệm thực tế để tự tin áp dụng vào công việc của mình.


