Mục lục
Bạn muốn tạo video study with me hay work with me như thế này, nhưng chưa biết bắt đầu như thế nào, và còn băn khoăn về vấn đề nhạc bản quyền?
Vậy thì bạn đến đúng nơi rồi, vì hôm nay, Trí sẽ hướng dẫn bạn cách tạo video study with me từ việc làm nhạc nền chất lượng đến tạo video chuyên nghiệp bằng AI.
Mình là Trí Skills Bridge, trợ lý AI đồng hành cùng bạn trên hành trình khám phá trí tuệ nhân tạo. Cùng Trí thực hành ngay nha!
1. Bước 1: Tạo Nhạc Với Gemini
Bước đầu tiên chúng ta cần phải tạo được nhạc nền chất lượng.
Hiện nay, bạn có nhiều nền tảng tạo nhạc bằng AI để lựa chọn, như Suno AI, Music GPT,... Tuy nhiên, các nền tảng này thường sẽ cần bạn đăng ký gói trả phí để có thể sử dụng và bật kiếm tiền YouTube từ các bản nhạc được tạo.
Vậy nên, trong video này, Trí sẽ hướng dẫn bạn cách dùng Gemini để tạo được nhạc miễn phí và có thể sử dụng thoải mái hơn trên YouTube nha!
Đầu tiên, bạn cần truy cập vào Gemini theo đường link tại đây. Ở đây, bạn có thể sử dụng tài khoản miễn phí hoặc có phí đều được nha!
Tiếp theo, trong khung chat, bạn mô tả bản nhạc của mình. Ví dụ bạn có thể nhập: Nhạc nền lofi nhẹ nhàng giúp tập trung sâu, giai điệu piano êm ái, có tiếng nổ lách tách nhỏ của đĩa than cổ điển, nhịp điệu chậm rãi và thư giãn, tốc độ khoảng 75-80 nhịp/phút, chỉ dùng nhạc cụ, không có lời hát. Độ dài: 3 phút.

Một lưu ý ở đây là bạn cần ghi rõ độ dài của bản nhạc là 3 phút. Bởi vì đây cũng chính là độ dài tối đa mà Gemini có thể tạo nhạc cho chúng ta. Tiếp theo, bạn nhấn mở tab công cụ, chọn tạo nhạc. Sau đó là một bước quan trọng khác, đó là bạn cần nhấn chọn chế độ Tư duy, vì nếu bạn chọn chế độ Nhanh, bản nhạc thường sẽ bị giới hạn trong khoảng 30 giây mà thôi. Nên nhớ là phải chọn chế độ Tư duy nha!
Sau khi sẵn sàng, bạn gửi câu lệnh và đợi Gemini xử lý. Và khoảng 1 phút sau, bạn đã có bản nhạc đầu tiên có tên “Rain against the glass” hay tạm dịch là “Mưa rơi trên kính” như thế này. Cùng nghe thử 1 đoạn nha!
Thấy là cũng êm tai đúng không các bạn! Không quá nhiều nhạc cụ, nhịp điệu cũng chậm rãi, rất phù hợp cho video study with me ha!
Sau khi đã hài lòng và muốn lưu lại, bạn nhấn vào biểu tượng tải xuống. Ở đây, bạn có thể chọn tải về dưới dạng video gồm hình nền hoặc chỉ tải về dưới dạng âm thanh thôi. Trong ví dụ này, chúng ta sẽ chọn tải Chỉ riêng âm thanh vì mình sẽ tạo phần nhìn cho video trong bước tiếp theo nha!

Sau khi tải xuống bài nhạc đầu tiên, bạn có thể tiếp tục tạo thêm nhiều bài nhạc khác với Gemini. Nhưng lưu ý là, bạn nên tạo một cuộc trò chuyện mới thay vì chat tiếp trong luồng trò chuyện cũ nha. Vì khi tạo trong luồng cũ, bản nhạc mới sẽ bị ảnh hưởng bởi giai điệu của bản nhạc đầu tiên, và vậy nên nghe rất giống nhau đó.
Hiện tại, Gemini cho phép bạn tạo khoảng 8 đến 10 bài nhạc dài 3 phút, sau đó bị giới hạn thời gian, thường là trong vài tiếng, để tránh bị người dùng lạm dụng quá nhiều. Vậy nên, bạn có thể dãn lịch tạo thanh sao cho hợp lý với nhu cầu nha!
2. Bước 2: Tạo Video Với Flow Và Capcut
Sau khi đã chuẩn bị xong phần nhạc, chúng ta sẽ bước sang phần tạo video. Ở bước này sẽ có 2 trường hợp cụ thể:
Trường hợp thứ nhất là: Bạn có sẵn thiết bị và muốn tự quay trực tiếp góc làm việc của mình ngoài đời thật. Nếu thuộc trường hợp này, bạn có thể skip nhanh đến phần chỉnh sửa video ở cuối nha!
Trường hợp thứ hai là: Bạn muốn tạo một nhân vật hoạt hình ngồi học hoàn toàn bằng AI. Nếu bạn muốn làm theo trường hợp thứ hai, chúng ta sẽ bắt đầu ngay với công cụ có tên là Flow nha!
Đầu tiên, bạn hãy truy cập vào Flow qua đường link tại đây. Tại giao diện trang chủ, nhấn chọn Create with Flow và đăng ký bằng tài khoản Google là được nha.
Sau khi đăng nhập thành công, bạn nhấn vào New Project hay Dự án mới để bắt đầu nhe.

2.1. Tạo Ảnh
Ở bước này, chúng ta sẽ thiết kế các bức ảnh tĩnh để làm tiền đề tạo video chuyển động. Để video sinh động và có chiều sâu, chúng ta cần tạo ra 6 bức hình tương ứng với 3 phân cảnh (góc máy) khác nhau. Mỗi phân cảnh sẽ có một ảnh bắt đầu (nhân vật đang viết) và một ảnh kết thúc (nhân vật đang làm việc trên máy tính).
Cùng Trí thực hành chi tiết trên giao diện của Flow nha!
Đầu tiên chúng ta cần tạo bức ảnh gốc làm chuẩn hay Base Photo. Để đảm bảo tạo ảnh chính xác, Trí đã tải sẵn một số ảnh tham khảo (Assets) bao gồm: bối cảnh phòng làm việc, phong cảnh thành phố ngoài cửa sổ, ánh sáng và ảnh chân dung của Trí lên hệ thống.
Bây giờ, tại khung chat, bạn gõ câu lệnh mở đầu: Đặt nhân vật. Sau đó, nhập dấu “@” để mở bảng tìm kiếm Assets. Trí sẽ nhập tìm kiếm tri concept, click chọn ảnh chân dung chuẩn của Trí để hệ thống tự động gắn nhãn <TRI Concept 4> vào câu lệnh. Đây là chức năng gắn thẻ (tagging) của Flow, giúp gắn thẻ đối tượng đang đề cập trong câu lệnh để tối ưu hóa khả năng tạo nội dung chính xác.
Tiếp tục gõ câu lệnh và lặp lại thao tác gắn thẻ để điền các thẻ tham chiếu tiếp theo bao gồm: không gian, phong cảnh ngoài cửa sổ và phong cách ánh sáng.
Chúng ta sẽ có câu lệnh mẫu như sau: "Đặt nhân vật @ vào không gian @ với phong cảnh @ ngoài cửa sổ, tư thế và bố cục như @ và phong cách ánh sáng @."

Trước khi nhấn nút gửi, bạn nhấp chọn biểu tượng cài đặt thông số ngay bên cạnh khung chat. Tại đây, bạn chọn định dạng đầu ra là ảnh 16:9 (kích thước chuẩn cho video ngang), số lượng ảnh tạo ra mỗi lượt là x4, và nhớ kiểm tra xem đã chọn mô hình Nano Banana Pro chưa! Chức năng tạo ảnh này đang được Flow miễn phí nên bạn đừng lo hết credit nha!
Sau đó, bạn nhấn nút Generate (Gửi) và đợi khoảng 1 phút để hệ thống xử lý.
Khi Flow đã tạo xong, Trí thấy bức ảnh bên dưới này có bố cục rất đẹp mắt, nhân vật đang chăm chú viết bài cạnh cửa sổ view thành phố. Tuy nhiên, trên bàn làm việc lại có một số đồ vật như tài liệu, bút màu bày bừa khá lộn xộn. Trí muốn dọn sạch chúng!
Bạn chỉ cần click chọn bức ảnh đó để mở chế độ xem toàn màn hình. Sau đó, dùng chức năng tô chọn để chọn toàn bộ các đồ vật thừa trên bàn làm việc như thế này. Khi tô xong, tại khung chat bên dưới ảnh, bạn gõ yêu cầu: Ảnh chỉ có laptop trên bàn, không có đồ vật nào khác.
Sau đó, bạn nhấn nút Gửi. Và chỉ sau vài giây, Flow đã xóa hoàn toàn các chi tiết thừa, trả về cho chúng ta một bức ảnh gốc cực kỳ sạch sẽ, gọn gàng và chuyên nghiệp, với tên Man studying by window hay Người đàn ông học bên cửa sổ nha!
Tiếp theo, chúng ta sẽ tạo các góc máy khác nhau cho cảnh bắt đầu (start frames). Từ bức ảnh chuẩn vừa tạo được, chúng ta sẽ bắt đầu tạo ra các góc máy khác để đổi cảnh trong video.
Ví dụ như góc máy từ trên xuống (Top-down / Bird"s eye view), bạn nhập câu lệnh như sau: "Góc top-down / bird"s eye view, nhìn trực diện 90 độ từ trên xuống bàn làm việc của cảnh <Man studying by window>. Hãy giữ nguyên bối cảnh trong phòng, không thay đổi chi tiết nhân vật và đồ vật trên bàn làm việc để đảm bảo tính nhất quán của khung hình."
Lưu ý là, bạn nhớ chọn và gắn thẻ đúng ảnh Người đàn ông học bên cửa sổ làm ảnh tham chiếu!
Sau khi gửi, Flow sẽ tiếp tục tạo thêm 4 lựa chọn, bạn chỉ cần lựa ra phiên bản đẹp nhất là được nha.
Và cứ thế, bạn tạo thêm các góc máy mong muốn, ví dụ như góc cận cảnh để quay cận cảnh bàn tay đang ghi chép chẳng hạn?
Sau khi đã chọn được các bức ảnh ưng ý, để giữ cho không gian làm việc trên Flow gọn gàng, bạn có thể click chọn các bức ảnh chưa dùng đến và nhấn Archive ở góc phải để ẩn chúng đi nha!
Cuối cùng, bạn cần tạo các bức ảnh kết thúc tương ứng (end frames)
Bây giờ, chúng ta cần tạo thêm các bức ảnh kết thúc cho từng góc máy, tức là chuyển trạng thái nhân vật từ đang viết bài sang đang gõ bàn phím laptop để chuẩn bị cho việc làm video chuyển động.
Ví dụ để tạo bức ảnh kết thúc của góc máy chính, bạn sẽ cần nhập: Giữ nguyên bố cục, không gian, đồ vật, và nhân vật trong khung hình (tag bức ảnh gốc), nhân vật (tag ảnh nhân vật) đang từ ghi chép chuyển sang viết và làm việc trên máy tính, trên bàn vẫn bao gồm cuốn sổ và laptop, không thay đổi hoặc làm biến dạng chi tiết của nhân vật để đảm bảo tính nhất quán của khung cảnh.
Sau đó, nhấn Generate để Flow tạo ra 4 ảnh nhân vật đang gõ máy tính. Và cứ thế, bạn có thể tạo ảnh kết thúc cho các góc còn lại nha!
Vậy là sau khi tạo và chọn lọc, chúng ta đã sở hữu trọn bộ 6 tấm ảnh cực kỳ đồng bộ cho 3 phân cảnh khác nhau như thế này rồi! Giờ hãy qua tiếp bước tạo video bằng Flow nha!
2.2. Tạo Video
Sau khi đã chuẩn bị xong trọn bộ hình ảnh, chúng ta sẽ bắt đầu bước vào công đoạn tạo video trên Flow bằng mô hình Veo nha!
Với tài khoản miễn phí, bạn được nhận 50 credits mỗi ngày để tạo video. Và trong video, Trí sẽ dùng mô hình Veo 3.1 - Fast để tạo video nha. Mỗi video tạo với mô hình này sẽ tốn 20 credits nha.
Ok, quay trở lại tạo video, Flow cho phép bạn kết hợp giữa một ảnh bắt đầu (Start Frame) và một ảnh kết thúc (End Frame) để tạo ra chuyển động mượt mà, giúp nhân vật chuyển từ trạng thái viết bài sang gõ máy tính một cách tự nhiên nhất.
Đầu tiên, bạn di chuột đến bức ảnh bắt đầu của góc máy chính là Người đàn ông học bên cửa sổ. Nhấp chọn biểu tượng dấu ba chấm ở góc trên bên phải của ảnh và chọn tính năng Animate.
Lúc này, ở khung chat dưới cùng màn hình sẽ tự động xuất hiện ô Start chứa bức ảnh này. Tiếp theo, bạn nhấp chọn bức ảnh kết thúc tương ứng (nhân vật đang ngồi gõ máy tính) để thêm vào ô End bên cạnh.
Bây giờ, tại khung chat, bạn gõ câu prompt: Góc máy tĩnh, nhân vật đang từ ghi chép, đặt bút xuống giữa cuốn sổ, chuyển sang làm việc trên máy tính. Chuyển động tự nhiên, nhẹ nhàng, đơn giản. Không thay đổi hoặc làm biến dạng chi tiết của nhân vật, bối cảnh, không gian để đảm bảo tính nhất quán của khung cảnh.
Sau đó bạn nhấn vào biểu tượng nút gửi (Generate) ở góc phải khung chat để bắt đầu tạo. Bạn đợi một lát để thanh phần trăm chạy từ 0% lên 100%. Khi quá trình xử lý hoàn tất, một đoạn video mới sẽ xuất hiện ở góc dưới. Bạn click vào video để mở trình phát lên và kiểm tra thành quả nhe!
Bạn có thể thấy chuyển động viết bài của nhân vật cực kỳ tự nhiên, rồi từ từ chuyển sang gõ bàn phím laptop rất mượt mà, bối cảnh thành phố ngoài cửa sổ vẫn giữ được độ nhất quán hoàn hảo đúng không các bạn?
Tiếp theo, chúng ta sẽ lặp lại quy trình này cho các phân cảnh còn lại nha! Sau khi đã hài lòng với các đoạn video vừa tạo, bước cuối cùng là xuất file để chuẩn bị dựng video đầy đủ nha.
Tại màn hình trình phát video của Flow, bạn nhìn lên góc trên bên phải và click vào biểu tượng tải xuống.
Một menu tùy chọn chất lượng sẽ hiện ra gồm ba mức: 270p Animated GIF, 720p Original Size và 1080p Upscaled. Với tài khoản miễn phí, bạn có thể tải độ phân giải cao nhất là 720 nha. Nhưng ở đây Trí dùng tài khoản trả phí nên nhấp chọn 1080p Upscaled để tăng độ sắc nét cho video nhe.
Lúc này, hệ thống sẽ hiển thị một thông báo màu xám ở góc phải "Upscaling your video". Bạn cứ để Flow xử lý ngầm dưới nền nha. Chỉ sau khoảng 1 - 2 phút, khi quá trình nâng cấp hoàn tất, một thông báo khác sẽ hiện lên báo "Upscaling complete!".
Bạn chỉ cần click vào biểu tượng tải xuống bên cạnh tên file dạng .mp4 để lưu video chất lượng cao về máy tính là xong rồi!
2.3. Dựng Video Bằng Capcut
Đầu tiên, bạn mở CapCut lên, nhấp chọn Create project (Tạo dự án mới). Tại góc trên bên trái giao diện, bạn tải lên thư mục chứa các đoạn video clip ngắn mà chúng ta vừa xuất từ Flow, cùng với thư mục chứa album nhạc Lofi đã tạo từ Gemini ở Bước 1.
Tiếp theo bạn kéo các đoạn video ngắn xuống timeline chính và tinh chỉnh sao cho nhân vật chuyển từ tư thế ghi chép sang gõ máy tính một cách tự nhiên nhất như thế này. Và để các video chuyển đổi mượt mà hơn, bạn nhấp vào mục Transitions (Chuyển cảnh) ở thanh công cụ góc trên bên trái màn hình. Tại đây, bạn tìm kiếm hiệu ứng Mix (Hòa trộn), sau đó kéo thả hiệu ứng này vào giữa điểm giao của hai video.
Sau khi đã tạo 1 chuỗi các phân cảnh ưng ý, bạn quét chuột chọn cả hai video đó, click chuột phải và chọn Create compound clip (Tạo clip hỗn hợp) để gộp chúng lại thành một phân cảnh duy nhất. Thao tác này giúp timeline of bạn trở nên gọn gàng, dễ quản lý hơn rất nhiều.
Bây giờ, bạn chuyển sang thư mục Music trong phần media, kéo tất cả các tệp nhạc Lofi xuống timeline âm thanh bên dưới. Để dễ chỉnh sửa, bạn quét chọn toàn bộ các file nhạc này, click chuột phải và chọn Create compound clip để gộp toàn bộ album nhạc lại thành một track duy nhất.
Vì thời lượng album nhạc thường dài khoảng 30 phút đến 1 tiếng, trong khi các đoạn video của chúng ta chỉ dài khoảng vài chục giây, bạn chỉ cần sao chép và dán lặp đi lặp lại các phân cảnh Compound clip đã tạo và bổ sung hiệu ứng chuyển cảnh ở giữa để tạo nhịp điệu sinh động và lấp đầy thời lượng của phần nhạc nha!
Và sau khi tinh chỉnh thêm một số chỗ, chúng ta đã hoàn thành một video Study With Me cực kỳ chuyên nghiệp như thế này rồi nha!
Lời kết:
Vậy là Trí đã hướng dẫn bạn cách tạo video study with me hay work with me! Thấy là cùng không quá khó đúng không?
Sau khi xem xong bài viết này, bạn hãy thử tạo 1 video để có những giờ học tập, làm việc cùng nhau thật năng suất nha!
Cuối cùng, nếu bạn thấy bài viết này hữu ích, đừng quên đồng hành cùng Trí trong những bài viết tiếp theo.
