Khám Phá Gemini 2.5 Flash Image: Google Nâng Tầm Công Cụ Tạo Ảnh Với AI?

Google Gemini vừa cập nhật mô hình AI tạo ảnh mới có tên là Gemini 2.5 Flash Image (còn gọi là nano-banana).

Khác với những mô hình tạo ảnh bằng AI thường thấy, Gemini 2.5 Flash Image có khả năng (1) giữ được sự nhất quán về nhân vật, (2) hiểu ngữ nghĩa ảnh, (3) ghép nhiều nguồn ảnh thành một tấm ảnh hoàn chỉnh và (4) chỉnh sửa ảnh bằng câu lệnh nhanh chóng. 

Nếu bạn cần một tấm ảnh minh họa thật ấn tượng cho bản thuyết trình, một poster quảng cáo độc đáo hay chỉ đơn giản là muốn biến ý tưởng trong đầu thành tác phẩm trực quan ngay lập tức. Gemini 2.5 Flash Image có thể giúp bạn tạo ảnh dễ dàng. 

Bài viết sau đây sẽ cùng bạn khám phá chi tiết những cập nhật mới nhất về công cụ, đồng thời đưa ra ví dụ để bạn có thể áp dụng các tính năng vào công việc thực tiễn hiệu quả. 

1. Duy Trì Tính Nhất Quán Của Nhân Vật Với “Past Forward”

Thách thức trong việc tạo hình ảnh bằng AI là khả năng duy trì sự nhất quán về ngoại hình của một nhân vật hoặc đặc điểm của một chủ thể. 

Với Gemini 2.5 Flash Image, bạn có thể đặt cùng một nhân vật vào các khung cảnh khác nhau, hiển thị một sản phẩm từ nhiều góc độ trong những bối cảnh mới mà vẫn giữ nguyên đặc điểm của chủ thể.

Để thể hiện khả năng này, Google Gemini đã cho ra mắt tính năng tạo ảnh hàng loạt “Past forward” có trong Google AI Studio. Với “Past forward”, bạn có thể tạo ra những hình ảnh chân dung của bản thân với những phiên bản khác nhau trong quá khứ. 

Tất cả chi tiết về khuôn mặt đều được giữ nguyên ngoại trừ phong cách thời trang, kiểu tóc hoặc những thay đổi dựa trên câu lệnh của chính bạn. Để thử trải nghiệm công cụ, bạn có thể nhấn vào đường link tại đây nhé. 

Tạo ảnh phiên bản quá khứ với tính năng “Past forward”

Tạo ảnh phiên bản quá khứ với tính năng “Past forward”

Bạn có thể áp dụng tính năng này vào công việc ra sao? Trường hợp bạn cần tạo bộ ảnh quảng bá cho sản phẩm mới. Với “Past forward”, bạn có thể đưa một nhân vật đại diện (brand mascot hoặc người mẫu ảo) vào nhiều bối cảnh khác nhau nhưng vẫn có thể giữ nguyên khuôn mặt, vóc dáng và phong cách nhận diện.

Cách làm như sau: 


Bước (1): Tại phần trang chủ của Google AI Studio, nhấn vào phần “Bulid” trên thanh điều hướng phía bên trái

Bước (2): Chọn vào tính năng “Past forward”

Bước (3): Nhập câu lệnh và tải hình ảnh mẫu gốc lên trong phần khung chat bên trái. 

Ví dụ với hình ảnh chân dung này, mình sẽ nhập câu lệnh là: “Thay đổi bối cảnh của hình ảnh thành nhiều nơi khác nhau như: Tàu điện, trường học, công viên, quán cà phê”. 

Bước (4): Nhấn vào phần khung hình ảnh phía bên phải để tải hình mẫu gốc lên, sau đó nhấn “Generate”. 

Đây chính là kết quả có được. Từ một tấm ảnh chân dung gốc, bạn có thể đưa nhân vật của mình vào nhiều bối cảnh khác nhau. 

Một nhân vật với nhiều bối cảnh khác nhau

2. Chỉnh Sửa Hình Ảnh Dựa Trên Câu Lệnh Với Tính Năng Pixshop

Cập nhật thứ 2, Gemini 2.5 Flash Image cho phép thực hiện các chỉnh sửa chi tiết ảnh bằng ngôn ngữ tự nhiên. Ví dụ, mô hình có thể làm mờ nền ảnh, xóa vết bẩn trên áo thun, xóa hoàn toàn một người khỏi ảnh, thêm màu sắc cho ảnh đen trắng, hoặc bất kỳ ý tưởng nào khác mà bạn có thể nghĩ ra chỉ với một câu lệnh đơn giản.

Ví dụ như hình bên dưới, bạn có thể dễ dàng chỉnh sửa màu áo của người đàn ông trong ảnh từ màu đen sang màu đỏ đồng thời xoá bỏ cả khuyên tai. Tất cả đều được thực hiện chính xác với một câu lệnh: “Change my shirt color to red and remove earring”.

Nguồn ảnh: Google for Developers

Không chỉ hiệu quả với câu lệnh tiếng Anh, bạn cũng có thể đưa ra yêu cầu chỉnh sửa bằng tiếng Việt trong tình huống cần tinh chỉnh chi tiết trên ảnh. 

Cách làm như sau: 


Bước (1): Tại phần trang chủ của Google AI Studio, nhấn vào phần “Bulid” trên thanh điều hướng phía bên trái

Bước (2): Chọn vào tính năng “Pixshop”

Bước (3): Tải lên hình ảnh bạn muốn chỉnh sửa, sau đó nhập câu lệnh chỉnh sửa 

Ví dụ với hình ảnh chân dung này, mình sẽ nhập câu lệnh là: “Thay đổi thành mắt kính đen và thêm nón lá”. Sau đó bạn cần nhấn vào vùng cần thay đổi trên ảnh. 

Bước (4): Nhấn “Generate” để bắt đầu chỉnh sửa. 

Đây chính là sự khác biệt trước và sau khi chỉnh sửa

5 yếu tố cần có của một prompt

Chỉnh sửa hình ảnh với tính năng Pixshop 

3. Kết Hợp Nhiều Hình Ảnh (Multi-Image Fusion) Với Tính Năng “Home Canvas”

Cập nhật thứ 3, Gemini 2.5 Flash Image có thể kết hợp nhiều hình ảnh đầu vào, vào chung một hình ảnh. Tính năng này giúp bạn có thể kết hợp người mẫu và sản phẩm lại với nhau tương tự như hình dưới đây. 

Nguồn ảnh: Google for Developers

Cách làm như sau: 


Bước (1): Tại phần trang chủ của Google AI Studio, nhấn vào phần “Bulid” trên thanh điều hướng phía bên trái

Bước (2): Chọn vào tính năng “Home Canvas”

Bước (3): Tải lên hình ảnh chủ thể của bạn trong phần “Upload Product” và hình ảnh khung cảnh trong phần “Upload Scene”. Ngoài ra, bạn cũng có thể viết thêm câu lệnh chỉnh sửa cho hình ảnh hoàn chỉnh hơn trong phần khung chat phía bên trái. 

Bước (4): Chọn vào vị trí mà bạn muốn sản phẩm xuất hiện trong cảnh và bắt đầu tạo ảnh. 

Sau khi đã xuất hiện chủ thể trong khung cảnh, bạn có thể nhấn vào phần “change product” để thay thế chủ thể và tiếp tục đưa chủ thể mới khác vào trong khung cảnh bên phải.  

Kết hợp chủ thể và bối cảnh với tính năng “Home Canvas” 

Lời Kết

Đó là 3 cập nhật mới nhất từ công cụ AI tạo ảnh Gemini 2.5 Flash Image. Bạn có thể áp dụng linh hoạt những tính năng này vào công việc hằng ngày. Từ việc tạo ảnh giữ nguyên tính nhất quán của nhân vật, chỉnh sửa chi tiết hình ảnh bằng ngôn ngữ tự nhiên, cho đến việc kết hợp nhiều hình ảnh thành một ảnh mới hoàn chỉnh. 

Những cập nhật từ Gemini 2.5 Flash Image không chỉ phục vụ riêng giới sáng tạo, mà còn mở rộng ứng dụng đến nhiều ngành nghề khác nhau. Vấn đề còn lại: chúng ta sẽ khai thác công cụ này đến mức nào để tiết kiệm thời gian làm việc, nâng cao năng suất và xa hơn là biến nó thành lợi thế cạnh tranh trong công việc. 

Nội dung này được tài trợ bởi Skills Bridge. Trước khi đi tiếp, Skills Bridge muốn giới thiệu khóa học AI Productivity dành cho DOANH NGHIỆP.

Nếu bạn đang tìm kiếm cách thức để đột phá hiệu suất và giải quyết các thách thức trong công việc, khóa học AI Productivity - x10 hiệu suất doanh nghiệp với AI chính là sự lựa chọn dành cho bạn.

Với khóa học này, đội ngũ của bạn sẽ được trang bị tư duy làm việc mới và học cách thành thạo 10 công cụ AI để tối ưu quy trình làm việc một cách thông minh. Từ đó, chuyển hóa những thách thức thành cơ hội phát triển mới.

Nhấn vào LINK NÀY để tìm hiểu và đăng ký ngay!

Đào tạo kỹ năng làm việc văn phòng và kinh doanh 

cho khách hàng cá nhân và doanh nghiệp.

Liên hệ

© 2023 - Bản quyền của Công ty cổ phần Skills Bridge
Skills Bridge cung cấp các chương trình đào tạo giúp cả khách hàng cá nhân và doanh nghiệp nâng cao kỹ năng chuyên môn, kỹ năng lãnh đạo và xây dựng doanh nghiệp thành công.

Skills Bridge cung cấp các chương trình đào tạo giúp cả khách hàng cá nhân và doanh nghiệp nâng cao kỹ năng chuyên môn, kỹ năng lãnh đạo và xây dựng doanh nghiệp thành công.

© 2024 - Bản quyền của Công ty cổ phần Skills Bridge

Skills Bridge cung cấp các chương trình đào tạo giúp cả khách hàng cá nhân và doanh nghiệp nâng cao kỹ năng chuyên môn, kỹ năng lãnh đạo và xây dựng doanh nghiệp thành công.

© 2024 - Bản quyền của Công ty cổ phần Skills Bridge