Các tin tức đáng chú ý trong ngày 20/5 bao gồm: Google I/O 2026 chính thức ra mắt Gemini Spark – AI agent vận hành 24/7 ngay trên nền Google Workspace; Andrej Karpathy, đồng sáng lập OpenAI và cựu lãnh đạo chương trình Full Self-Driving tại Tesla, gia nhập Anthropic với nhiệm vụ dùng chính Claude tăng tốc quá trình nghiên cứu pre-training; Mistral AI hoàn tất thương vụ mua lại Emmi AI – startup chuyên mô phỏng vật lý công nghiệp theo thời gian thực. Ba câu chuyện đại diện cho ba hướng đi trong cuộc đua AI: AI cắm sâu vào hệ sinh thái hiện có, AI tự cải thiện chính mình, và AI mở rộng vào những lĩnh vực trước đây cần phần mềm chuyên dụng tốn kém.
1. Google ra mắt Gemini Spark: Khi AI ngừng chờ bạn ra lệnh
Tại sự kiện Google I/O 2026 (ngày 19–20/5), Google ra mắt Gemini Spark – AI agent chạy 24/7, hoạt động ngay cả khi máy tính đã tắt. Spark được xây trên Gemini 3.5 Flash, mô hình mới vượt Gemini 3.1 Pro trên toàn bộ benchmark lập trình, agentic và đa phương thức, đồng thời nhanh hơn 4 lần so với các mô hình hàng đầu trên thị trường. Google cũng ra mắt gói AI Ultra với mức 100 USD/tháng dành riêng cho lập trình viên, nhà sáng tạo nội dung và người dùng nâng cao.
Gemini Spark không đợi bạn ra câu hỏi – nó chủ động theo dõi, tổng hợp và hành động thay bạn. Những gì Spark thực sự làm nghe rất đơn giản nhưng thay đổi căn bản cách AI vận hành. Ví dụ như tự rà soát sao kê thẻ tín dụng hằng tháng để phát hiện chi phí ẩn, theo dõi hộp thư đến và tổng hợp thông báo quan trọng mà không cần nhắc lệnh từng lần. Đây là sự dịch chuyển từ AI phản hồi (trả lời khi được hỏi) sang AI chủ động (vận hành ngầm dưới nền).
Với các doanh nghiệp Việt Nam dùng Google Workspace, đặc biệt đội marketing, vận hành, hoặc bộ phận chăm sóc khách hàng xử lý hàng chục email mỗi ngày, đây là bước tiến quan trọng. Spark sẽ mở cho người dùng AI Ultra tại Mỹ trong tuần tới, và ra mắt trên Gemini Mac app cuối hè 2026.
Google cũng ra mắt Gemini Omni – mô hình kết hợp lý luận với khả năng tạo nội dung, nhận hình ảnh, âm thanh, video và văn bản làm đầu vào, xuất ra video bám sát tri thức thực tế. Ngoài ra kính thực tế tăng cường Android XR hợp tác với Samsung cũng được giới thiệu, bao gồm một phiên bản không màn hình trang bị camera, loa, mic và một phiên bản tích hợp màn hình trong thấu kính hiển thị chỉ đường và phụ đề dịch theo thời gian thực.
Nguồn: 9to5Google / Tom’s Guide
Ghi chú thuật ngữ
- Agentic: Đặc tính của AI có thể tự lên kế hoạch và thực hiện nhiều bước liên tiếp mà không cần hướng dẫn từng lần
- Android XR: Nền tảng thực tế tăng cường của Google, hợp tác với Samsung để ra mắt kính AI
2. Andrej Karpathy gia nhập Anthropic: Claude tự cải thiện chính mình
Ngày 19/5, Andrej Karpathy, đồng sáng lập OpenAI, cựu lãnh đạo chương trình Full Self-Driving tại Tesla thông báo gia nhập Anthropic. Karpathy làm việc trong nhóm pre-training dưới sự dẫn dắt của Nick Joseph, đồng thời xây dựng một đội mới với nhiệm vụ dùng Claude để tăng tốc quá trình nghiên cứu pre-training.
Thông tin tuyển dụng này cho thấy Anthropic đang đặt cược vào khả năng Claude tăng tốc quá trình huấn luyện chính nó để duy trì lợi thế dài hạn trước OpenAI và Google.
Karpathy đã để lại dấu ấn rõ qua mỗi vai trò từng đảm nhiệm, bao gồm nghiên cứu thị giác máy tính tại OpenAI, dẫn dắt Autopilot và Full Self-Driving tại Tesla, đến lập Eureka Labs năm 2024 tập trung ứng dụng trợ lý AI vào giáo dục. Anh cho biết sẽ tiếp tục công việc giáo dục song song với vai trò tại Anthropic.
Với cộng đồng kỹ thuật và lập trình viên Việt Nam đang dùng Claude trong công việc hằng ngày, đây là bằng chứng cụ thể cho thấy vòng lặp “AI tự cải thiện AI” không còn là khái niệm nghiên cứu mà đang trở thành cấu trúc tổ chức thực tế của những lab hàng đầu thế giới.
Nguồn: TechCrunch / Axios
Ghi chú thuật ngữ
- Pre-training: Giai đoạn huấn luyện ban đầu của mô hình ngôn ngữ lớn, tiêu tốn phần lớn tài nguyên tính toán và quyết định năng lực lõi của mô hình
3. Mistral mua Emmi AI: AI vật lý công nghiệp từ Vienna đến Paris
Ngày 19/5, Mistral AI thâu tóm Emmi AI – startup khoảng 35 người tại Vienna (Áo), chuyên xây dựng Large Engineering Models (LEM): Mô hình AI mô phỏng luồng khí động học, phân bố nhiệt và biến dạng cấu trúc vật liệu trong thời gian thực. Emmi được thành lập năm 2024, đã gọi vốn 15 triệu EUR vào tháng 4/2025 từ 3VC, Speedinvest, Serena và PUSH. Đây là thương vụ M&A thứ hai của Mistral trong năm 2026, sau khi mua nhà cung cấp hạ tầng đám mây Koyeb vào tháng 2. Giá mua lại không được công bố.
Dù không tiết lộ con số tài chính, thông tin này cho thấy hướng đi chiến lược rất rõ của Mistral. Mistral đang lắp ráp một ngăn xếp AI tích hợp vật lý – nơi mô hình không chỉ xử lý ngôn ngữ mà còn mô phỏng thực thể vật lý như bộ phận máy móc, luồng nhiệt hay cấu trúc vật liệu. Đây là nền tảng của digital twin công nghiệp, công nghệ mà ngành hàng không, ô tô và bán dẫn đang tìm kiếm như một lợi thế R&D thực sự.
Khác với phần mềm mô phỏng chuyên dụng truyền thống, LEM của Emmi chạy theo thời gian thực và được thiết kế để nhúng trực tiếp vào quy trình R&D hiện có. Khi Mistral tích hợp công nghệ này vào nền tảng của mình, ngưỡng vào cho AI công nghiệp sẽ giảm đáng kể. không còn đòi hỏi đội ngũ chuyên biệt và phần mềm riêng tốn kém như trước.
Với doanh nghiệp sản xuất tại Việt Nam, đây là tín hiệu cho thấy AI đang tiến vào R&D lõi, không còn dừng ở hỗ trợ văn phòng hay tự động hóa nội dung. Lĩnh vực sản xuất nặng, vốn được xem là “khó AI hóa nhất,” đang bắt đầu có công cụ thực sự phù hợp.
Nguồn: The Decoder / Sifted
Ghi chú thuật ngữ
- Large Engineering Models (LEM): Dòng mô hình AI chuyên biệt được huấn luyện để mô phỏng hiện tượng vật lý công nghiệp như khí động học, truyền nhiệt và biến dạng cấu trúc
- Digital twin: Bản sao số của vật thể hoặc hệ thống thực, cho phép mô phỏng và kiểm thử trước khi triển khai thực tế
Bài viết của đội ngũ ZTO Labs, chuyên đào tạo và nghiên cứu AI tại Việt Nam.
