Sự kiện công nghệ thường niên Google I/O diễn ra hôm 20/5 đã chính thức đánh dấu một năm bùng nổ của trí tuệ nhân tạo (AI). Bước sang chu kỳ mới, Google đã mang đến các sản phẩm tích hợp AI ở mức độ cao hơn nữa, phù hợp với đa dạng nhu cầu của người dùng.
Bộ đôi siêu mô hình: Gemini 3.5 Flash và Gemini Omni
Sự tiến bộ của chip TPU chính là bệ phóng để Google phá vỡ các giới hạn điện toán, dịch chuyển AI từ dự đoán văn bản sang mô phỏng thực tế. Đầu tiên là Gemini 3.5 Flash, mô hình kết hợp giữa trí thông minh tiên phong và hành động thực tế.
So với phiên bản 3.1 Pro, Gemini 3.5 Flash vượt trội trên hầu hết các tiêu chí, đặc biệt là bước nhảy vọt trong chỉ số GDPVal (năng lực xử lý tác vụ mang lại giá trị kinh tế thực tế).

Theo Google, mô hình toàn năng này có tốc độ xử lý đầu ra nhanh gấp 4 lần các mô hình tiên phong khác, nhưng giá thành chưa bằng một nửa đối thủ cùng phân khúc.
Điều này giải quyết triệt để bài toán kinh tế cho doanh nghiệp. Nếu một công ty lớn chuyển dịch 80% khối lượng công việc (khoảng 1 nghìn tỷ token mỗi ngày) sang 3.5 Flash, họ có thể tiết kiệm hơn 1 tỷ USD hằng năm.
Mô hình này đã tích hợp vào Antigravity (nền tảng phát triển ưu tiên tác nhân của Google), đẩy lượng dữ liệu xử lý nội bộ đạt hơn 3 nghìn tỷ token mỗi ngày. Gemini 3.5 Flash hiện đã khả dụng trên toàn bộ các sản phẩm và cổng API, trong khi phiên bản cao cấp Gemini 3.5 Pro đang được thử nghiệm nội bộ và sẽ ra mắt vào tháng tới.
Bên cạnh đó, Google cũng tạo bước nhảy vọt đa phương thức với Gemini Omni Flash thuộc dòng Omni, có khả năng tiếp nhận bất kỳ dữ liệu đầu vào nào để tạo ra đầu ra ở mọi định dạng.
Công nghệ này kết hợp trí thông minh của Gemini với các mô hình truyền thông đa phương tiện tạo sinh, bắt đầu bằng định dạng video và sẽ mở rộng sang hình ảnh, văn bản theo thời gian. Người dùng có thể trải nghiệm trực tiếp Gemini Omni Flash ngay hôm nay trên ứng dụng Gemini, Google Flow và YouTube Shorts, hoặc qua các cổng API doanh nghiệp trong vài tuần tới.
Cách mạng hóa trải nghiệm trên hệ sinh thái tỷ người dùng

Google hiện sở hữu 13 sản phẩm có hơn 1 tỷ người dùng mỗi tháng, trong đó 5 sản phẩm đã vượt mốc 3 tỷ.
Tính năng AI Overviews hiện đạt hơn 2,5 tỷ người dùng hoạt động hằng tháng. Chế độ AI (bản nâng cấp lớn nhất của Tìm kiếm) cũng vượt mốc 1 tỷ người dùng hằng tháng chỉ sau một năm.
Sắp tới, Tìm kiếm sẽ tích hợp khả năng lập trình tự động dựa trên Gemini 3.5 Flash và Google Antigravity để tự động xây dựng giao diện trải nghiệm tùy chỉnh (bố cục động, hình ảnh trực quan) riêng cho từng câu hỏi, triển khai miễn phí vào mùa hè này.
Từ 400 triệu người dùng hoạt động hằng tháng tại kỳ I/O năm ngoái, ứng dụng Gemini hiện đã vượt mốc 900 triệu người dùng (tăng hơn gấp đôi), với số lượng yêu cầu xử lý hằng ngày tăng trưởng hơn 7 lần. Ứng dụng bổ sung tính năng Trí thông minh cá nhân giúp tối ưu câu trả lời, đồng thời ghi nhận hơn 50 tỷ hình ảnh được tạo ra từ mô hình Nano Banana.
Ứng dụng Bản đồ đón nhận đợt nâng cấp lớn nhất một thập kỷ với tính năng Ask Maps, cho phép xử lý những câu hỏi dài và phức tạp. Trong khi đó, tính năng Ask YouTube (đang thử nghiệm và sẽ triển khai rộng rãi tại Mỹ vào mùa hè này) thay đổi hoàn toàn cách tìm kiếm thông tin trên video khi không chỉ hiển thị video phù hợp mà còn chuyển hướng người dùng vào đúng phân đoạn liên quan trực tiếp đến câu hỏi.
Tận dụng bước tiến của các mô hình âm thanh, tính năng Docs Live cho phép người dùng khởi tạo và chỉnh sửa tài liệu hoàn toàn bằng giọng nói theo thời gian thực thay vì gõ lệnh. Đây là bước đệm mở đường cho chuỗi điều khiển giọng nói trên Gmail và Keep, triển khai cho các gói trả phí vào mùa hè này.
Kỷ nguyên của các tác nhân AI tự chủ

Sự kết hợp giữa Gemini 3.5 và bộ khung Antigravity đang mở ra kỷ nguyên của các tác nhân AI tự vận hành an toàn và bảo mật.
Gemini Spark: Trợ lý AI cá nhân thế hệ mới hoạt động liên tục 24/7 trên các máy ảo chuyên dụng của Google Cloud mà không cần người dùng mở máy tính. Spark thực hiện các chuỗi tác vụ dài hạn chạy ngầm dưới hệ thống, tích hợp mượt mà với hệ sinh thái Google và sắp tới là các công cụ bên thứ ba qua giao thức MCP.
Spark cũng sẽ vận hành trực tiếp bên trong trình duyệt Chrome vào cuối mùa hè này.
Daily Brief: Tác nhân sắp có mặt trên ứng dụng Gemini, tự động tổng hợp và ưu tiên thông tin từ hộp thư, lịch trình, danh sách công việc thành một bản tin buổi sáng súc tích để người dùng dễ dàng nắm bắt và hành động.
Antigravity 2.0 & Google Flow: Antigravity đang chuyển mình thành nền tảng quản lý các nhóm tác nhân AI tự vận hành. Phiên bản độc lập Antigravity 2.0 dành cho máy tính để bàn sẽ là không gian trung tâm để điều phối tác nhân xử lý mọi tác vụ, đi kèm phiên bản Flash tối ưu với tốc độ nhanh gấp 12 lần so với các mô hình khác.
Trong khi đó, Google Flow chính thức triển khai tác nhân AI mới từ hôm nay cho tất cả người dùng để lên kế hoạch, lập luận qua các tác vụ phức tạp và hỗ trợ lập trình trực tiếp (vibe code) các công cụ sáng tạo như thiết kế hiệu ứng, hoạt hình vẽ tay.
Google Pics: Công cụ sáng tạo và chỉnh sửa hình ảnh bằng AI mới, xây dựng trên mô hình Nano Banana. Pics xử lý mọi yếu tố trong ảnh như các đối tượng độc lập thay vì một bức ảnh phẳng tĩnh, cho phép người dùng thay thế hoặc hoàn thiện từng chi tiết cụ thể. Công cụ sẽ khả dụng vào cuối mùa hè này cho người dùng Google AI Pro và Ultra trong Workspace.
Tiêu chuẩn minh bạch và các dự án mở rộng tầm nhìn
AI tạo sinh càng phát triển thì tính minh bạch càng cấp thiết, nhất là khi nghiên cứu cho thấy chỉ có 25% người dùng nhận biết chính xác video deepfake chất lượng cao. Công nghệ đóng dấu mờ kỹ thuật số vô hình SynthID của Google đến nay đã đánh dấu mờ cho hơn 100 tỷ hình ảnh, video và 60.000 năm thời lượng âm thanh.
Để nâng cao tính xác thực, Google tích hợp Chứng chỉ Nội dung (Content Credentials) trên toàn bộ sản phẩm, hiển thị rõ nguồn gốc nội dung là từ AI hay máy ảnh. Giải pháp này đang được đưa lên Tìm kiếm và Chrome. Đặc biệt, liên minh minh bạch này đã mở rộng quy mô lớn khi NVIDIA, OpenAI, Kakao và ElevenLabs đều đã chính thức bắt tay cùng Google áp dụng tiêu chuẩn SynthID.
Bên cạnh phần mềm, Google cũng hé lộ những bước tiến mới về phần cứng và khoa học đời sống:
Kính mắt thông minh: Bao gồm kính âm thanh hỗ trợ bằng giọng nói trực tiếp vào tai (trình làng vào mùa thu này) và kính màn hình hiển thị trực quan thông tin, giúp người dùng hoàn toàn rảnh tay khi tương tác với Gemini.
Gemini cho Khoa học (Gemini for Science): Tập hợp loạt công cụ AI nhằm tăng tốc nghiên cứu khoa học dựa trên dự án Deep Think và Deep Research. Giải pháp bao gồm các thử nghiệm mới trên nền tảng Labs và bộ Kỹ năng Khoa học (Science Skills) để kết nối các nền tảng tác nhân như Google Antigravity tới hơn 30 cơ sở dữ liệu lớn về khoa học đời sống (hiện đã có sẵn trên GitHub và ứng dụng Antigravity).
