Mục lục
Tròn mười năm kể từ khi Google chuyển dịch chiến lược ưu tiên AI (AI first), gã khổng lồ công nghệ này đã chứng minh vị thế dẫn đầu bằng những bước tiến vượt bậc.
Hệ sinh thái thông minh thế hệ mới đang chuyển mình mạnh mẽ từ các mô hình ngôn ngữ lớn thông thường sang kỷ nguyên "Agentic Gemini", nơi các trợ lý ảo có khả năng tự động hành động và tư duy độc lập để giải quyết các tác vụ phức tạp.
Bài viết này sẽ giúp bạn tổng hợp toàn bộ những thông tin đắt giá nhất trực tiếp từ bài phát biểu của CEO Google Sundar Pichai tại sự kiện.
1. Bước Nhảy Vọt Về Quy Mô Và Sức Mạnh Xử Lý Token
Tại sự kiện, Google đã công bố những số liệu thống kê ấn tượng về số lượng token (đơn vị dữ liệu cơ bản mà mô hình AI xử lý), phản ánh tốc độ tăng trưởng kinh ngạc của hệ sinh thái Gemini.
Cách đây hai năm, Google xử lý khoảng 9,7 nghìn tỷ token mỗi tháng trên tất cả các nền tảng. Con số này đã tăng lên 480 nghìn tỷ vào năm ngoái và hiện tại đã đạt mức kỷ lục hơn 3,2 triệu tỷ (quadrillion) token mỗi tháng, tương đương với mức tăng trưởng gấp 7 lần chỉ trong vòng một năm.
Mạng lưới xử lý dữ liệu khổng lồ này đang phục vụ cho hơn 8,5 triệu nhà phát triển xây dựng ứng dụng hàng tháng, với tốc độ xử lý API đạt khoảng 19 tỷ token mỗi phút. Bên cạnh đó, hơn 375 khách hàng doanh nghiệp lớn của Google Cloud đã vượt mốc xử lý một nghìn tỷ token, cho thấy nhu cầu ứng dụng trí tuệ nhân tạo đang bùng nổ mạnh mẽ trong mọi ngành nghề kinh doanh.

2. Khám Phá Trải Nghiệm Hội Thoại Tự Nhiên Trên Các Ứng Dụng Phổ Biến
Mục tiêu lớn nhất của Google trong năm nay là tối ưu hóa năng suất bằng cách tích hợp khả năng giao tiếp tự nhiên bằng giọng nói và ngôn ngữ đời thường vào sâu trong các ứng dụng lõi.
2.1 Tính Năng Trò Chuyện Thông Minh Ask YouTube
Nền tảng xem video lớn nhất hành tinh chuẩn bị đón nhận một sự thay đổi toàn diện về mặt trải nghiệm với công cụ Ask YouTube. Thay vì mất nhiều thời gian tìm kiếm hoặc xem hết các video dài để chắt lọc ý chính, người dùng có thể đặt câu hỏi trực tiếp cho AI. Hệ thống thông minh sẽ phân tích, gợi ý các video phù hợp nhất với sở thích và tự động chuyển ngay đến phân đoạn chứa câu trả lời mà bạn đang tìm kiếm. Tính năng này đang được thử nghiệm giới hạn và sẽ sớm triển khai rộng rãi tại thị trường Mỹ vào mùa hè này.

2.2 Sáng Tạo Nội Dung Bằng Giọng Nói Với Docs Live
Tận dụng những bước nhảy vọt về mặt công nghệ của các mô hình xử lý âm thanh, Google giới thiệu tính năng Docs Live giúp hiện thực hóa ý tưởng theo tốc độ lời nói. Trước đây, để soạn thảo một văn bản với sự trợ giúp của trí tuệ nhân tạo, người dùng bắt buộc phải nhập các câu lệnh (prompt) văn bản vô cùng chi tiết.
Giờ đây, với Docs Live, bạn chỉ cần nói ra toàn bộ những suy nghĩ lộn xộn trong đầu, AI sẽ tự động lắng nghe, sắp xếp cấu trúc và biên tập thành một văn bản hoàn chỉnh. Trong tương lai, người dùng hoàn toàn có thể khởi tạo và chỉnh sửa trực tiếp tài liệu hoàn toàn bằng giọng nói. Tiện ích này sẽ được cập nhật cho những tài khoản đăng ký trả phí vào mùa hè này, đồng thời các giải pháp giọng nói quyền năng này cũng sẽ sớm được tích hợp vào Gmail và ứng dụng ghi chú Keep.

3. Gemini Omni
Gemini Omni là mô hình mới nhất từ Google, sở hữu khả năng tạo ra các mẫu dữ liệu ở bất kỳ định dạng đầu ra nào từ bất kỳ nguồn dữ liệu đầu vào nào.
Google sẽ bắt đầu với các định dạng đầu ra là video, sau đó theo thời gian sẽ kích hoạt thêm định dạng hình ảnh và văn bản. Mô hình mới này kết hợp trí thông minh của Gemini với các mô hình truyền thông đa phương tiện tạo sinh (generative media models). Mô hình đầu tiên trong thế hệ Omni là Gemini Omni Flash.
Gemini Omni Flash sẽ chính thức khả dụng bắt đầu từ ngày hôm nay. Bạn có thể trải nghiệm trực tiếp mô hình này trên ứng dụng Gemini, Google Flow và trên YouTube Shorts. Google cũng sẽ sớm triển khai mô hình này đến các nhà phát triển và khách hàng doanh nghiệp thông qua hệ thống API trong vài tuần tới. Dưới đây là một số điểm đặc biệt tạo nên sức mạnh của Omni:
- Chỉnh Sửa Video Thông Qua Trò Chuyện: Gemini Omni hỗ trợ chỉnh sửa video dễ dàng hơn bằng ngôn ngữ tự nhiên. Mỗi câu lệnh hướng dẫn mới sẽ được xây dựng nối tiếp dựa trên câu lệnh trước đó. Các nhân vật của bạn sẽ giữ nguyên tính nhất quán, các định luật vật lý được đảm bảo và bối cảnh sẽ ghi nhớ những gì đã xảy ra trước đó.
- Hiện Thực Hóa Ý Tưởng Dựa Trên Kiến Thức Thực Tế Của Gemini: Gemini Omni không chỉ xây dựng những bối cảnh trông như thật mà nó còn tư duy logic về những gì nên xảy ra tiếp theo. Mô hình kết hợp sự hiểu biết trực quan về vật lý với kiến thức của Gemini về lịch sử, khoa học và bối cảnh văn hóa, xóa nhòa khoảng cách từ hình ảnh chân thực (photorealism) đến những câu chuyện có chiều sâu ý nghĩa.
- Tạo Video Từ Bất Kỳ Sự Kết Hợp Đầu Vào Nào: Omni biến bất kỳ tài liệu tham chiếu nào (hình ảnh, văn bản, video hoặc âm thanh) thành một đầu ra duy nhất, gắn kết. Mặc dù ban đầu đối với âm thanh sẽ chỉ hỗ trợ các tham chiếu bằng giọng nói, chúng tôi sẽ sớm triển khai các loại đầu vào âm thanh khác.

4. Gemini Spark
Gemini Spark là trợ lý thông minh (agent) hoạt động 24/7 trong ứng dụng Gemini.
Mô hình này chạy trên các máy ảo chuyên dụng thuộc nền tảng Google Cloud và được vận hành bởi Gemini 3.5 cùng hệ thống khai thác Google Antigravity, cho phép thực hiện các tác vụ dài hạn (long-horizon tasks) một cách dễ dàng trong nền.
Spark sẽ tích hợp mượt mà với các công cụ, bắt đầu từ các công cụ trong hệ sinh thái Google và trong vài tuần tới sẽ kết nối với các công cụ của bên thứ ba thông qua giao thức MCP.

Và bạn có thể làm việc với Spark theo bất kỳ cách nào thuận tiện nhất: ngay trong ứng dụng Gemini hoặc sớm thôi, thông qua email và tin nhắn trò chuyện.
Trên hệ điều hành Android, bạn sẽ có thể xem các cập nhật trực tiếp và tiến trình thực hiện nhiệm vụ của các trợ lý thông minh như Spark thông qua một không gian giao diện người dùng mới mang tên Android Halo, dự kiến ra mắt vào cuối năm nay. Tương lai gần, Spark sẽ hoạt động trực tiếp bên trong Chrome, đóng vai trò như một trình duyệt tự động hành động của bạn trên khắp môi trường web.
Google sẽ bắt đầu triển khai Gemini Spark cho các nhà thử nghiệm đáng tin cậy vào tuần này và phiên bản Beta sẽ đến với những người đăng ký gói Google AI Ultra tại Mỹ vào tuần tới.
5. Tìm kiếm trong kỷ nguyên tự động hành động (Agentic Era)
Gemini Spark là trải nghiệm đầu tiên được hiện thực hóa nhờ vào các mô hình 3.5 và hệ thống Antigravity.
Khi bước vào kỷ nguyên tự động hành động này, công cụ Tìm kiếm (Search) sẽ trở nên hữu ích và mạnh mẽ hơn bao giờ hết.
Google cũng đã giới thiệu các trợ lý thông tin (information agents) trong Google Search. Đây là những trợ lý AI mang tính cá nhân hóa mà bạn có thể thiết lập để hoạt động ngầm trong nền 24/7, nhằm tìm kiếm chính xác những gì bạn cần vào đúng thời điểm và giúp bạn thực hiện hành động. Các trợ lý thông tin này sẽ được triển khai vào mùa hè này, bắt đầu với những người dùng đăng ký gói Google AI Pro và Ultra.
Một cách khác mà chúng tôi đang dùng để xây dựng một công cụ Tìm kiếm tự động hành động thực thụ là truyền vào đó năng lực lập trình tự động (agentic coding capabilities). Với sức mạnh của Gemini 3.5 Flash và Google Antigravity, Search sẽ tự động xây dựng các trải nghiệm tùy biến dành riêng cho từng câu hỏi cá nhân của bạn, chẳng hạn như các bố cục động (dynamic layouts) và hình ảnh trực quan có tính tương tác. Những năng lực tạo giao diện tự động (generative UI) này sẽ giao đến tay tất cả mọi người trên Google Search vào mùa hè này hoàn toàn miễn phí.

6. Các Cập Nhật Đáng Chú Ý Khác:
1. Daily Brief là một trợ lý thông minh tiện ích sắp có mặt trên ứng dụng Gemini. Tính năng này cung cấp cho bạn một bản tin tổng hợp được cá nhân hóa và tổng hợp thông tin từ hộp thư đến, lịch làm việc cũng như danh sách tác vụ của bạn để tìm ra những điều quan trọng nhất cần lưu ý.
Tính năng không chỉ đơn thuần là tóm tắt dữ liệu mà còn sắp xếp thứ tự ưu tiên, tổ chức và gợi ý các bước xử lý tiếp theo, giúp bạn dễ dàng thực hiện hành động. Tất cả đều gói gọn trong một bản tin tổng hợp buổi sáng siêu ngắn gọn được thiết kế tối ưu cho việc đọc lướt.
2. Google Flow đang triển khai một trợ lý thông minh mới, có khả năng lập kế hoạch và tư duy qua các tác vụ phức tạp dựa trên các dữ liệu đầu vào của bạn, dưới sự kiểm soát của chính bạn.
Trợ lý này mang đến chuyên môn và sự hiểu biết sâu sắc về dự án của bạn để hỗ trợ quá trình động não lên ý tưởng ban đầu, sáng tạo và chỉnh sửa. Bạn cũng có thể lập trình bằng giọng nói/ý tưởng (vibe code) cho bất kỳ công cụ sáng tạo nào ngay trong Flow chẳng hạn như các công cụ thiết kế hiệu ứng video, hoạt ảnh vẽ tay hoặc chèn các lớp văn bản.
3. Google Pics là công cụ chỉnh sửa và sáng tạo hình ảnh bằng AI, được xây dựng trên mô hình Nano Banana mới nhất, giúp bạn tạo ra hầu như mọi thứ với các quyền kiểm soát sáng tạo theo ý muốn. Cho dù bạn đang xây dựng một thiết kế từ một khung bạt trống hay chỉnh sửa một bức ảnh có sẵn, Pics đều xử lý mọi yếu tố như một đối tượng riêng lẻ thay vì một hình ảnh phẳng, tĩnh.
Điều này cho phép bạn tạo mới, hoán đổi hoặc hoàn thiện các chi tiết cụ thể. Google Pics hiện đã khả dụng cho các nhà thử nghiệm đáng tin cậy và sẽ được triển khai vào cuối mùa hè này cho những người dùng đăng ký gói Google AI Pro và Ultra trong không gian làm việc Workspace.
4. Google cũng chia sẻ thêm về thiết bị kính đeo thông minh (intelligent eyewear) từng hé lộ lần đầu vào năm ngoái, bao gồm kính âm thanh (audio glasses) giúp đưa ra các hỗ trợ bằng giọng nói trực tiếp vào tai bạn và kính hiển thị (display glasses) giúp hiển thị thông tin bạn cần ngay vào thời điểm bạn cần.
Cả hai đều giúp bạn rảnh tay và không phải cúi đầu, nhận trợ giúp từ Gemini chỉ bằng cách đặt câu hỏi. Kính âm thanh sẽ được ra mắt đầu tiên, dự kiến vào cuối mùa thu năm nay.
5. Gemini for Science tổng hợp các công cụ AI nhằm giúp đẩy nhanh tiến độ nghiên cứu khoa học. Được xây dựng dựa trên năng lực nghiên cứu và tư duy chuyên sâu (deep reasoning) của Gemini cũng như các công cụ Deep Think và Deep Research, giải pháp này bao gồm các thử nghiệm mới trên nền tảng Labs cũng như tính năng Science Skills (Kỹ năng Khoa học) để kết nối các nền tảng tự động hành động (agentic platforms) như Google Antigravity với hơn 30 cơ sở dữ liệu và công cụ khoa học đời sống lớn.
Người dùng có thể đăng ký bày tỏ sự quan tâm để trải nghiệm các thử nghiệm của Gemini for Science trên hệ thống Google Labs, còn tính năng Science Skills hiện đã chính thức khả dụng ngay hôm nay trên Github và trực tiếp bên trong môi trường Antigravity.
