Hai tin tức đáng chú ý ngày 05/06 đặt ra hai câu hỏi liên quan mật thiết đến nhau: ai có thể tiếp cận mô hình AI mạnh nhất, và ai kiểm soát hạ tầng chạy chúng? NVIDIA vừa phát hành Nemotron 3 Ultra, mô hình AI mở mã nguồn đứng đầu bảng xếp hạng Mỹ với giấy phép thương mại tự do. Cùng ngày, Canada công bố chiến lược quốc gia “AI for All” trị giá 2,3 tỷ đô, đặt bài toán chủ quyền số lên trên cả mục tiêu tăng trưởng kinh tế.
1. NVIDIA ra mắt Nemotron 3 Ultra: mô hình AI mở mã nguồn hàng đầu Mỹ, có giấy phép thương mại tự do
NVIDIA phát hành Nemotron 3 Ultra vào ngày 4/6/2026, chiếm vị trí đầu bảng trong nhóm mô hình mở mã nguồn của Mỹ về trí tuệ tổng hợp. Thông số: 550 tỷ tham số tổng, 55 tỷ tham số hoạt động mỗi lần xử lý nhờ kiến trúc mixture-of-experts lai Mamba-Attention. Ngữ cảnh đạt 1 triệu token. Tốc độ sinh ra hơn 420 token/giây, nhanh hơn từ 1,6 đến 5,9 lần so với các mô hình cùng quy mô từ Trung Quốc và châu Âu trong điều kiện kiểm tra trực tiếp. Điểm trên Artificial Analysis Intelligence Index là 48, vượt toàn bộ nhóm mô hình mở mã nguồn hiện có của Mỹ, nhưng còn kém Kimi K2.6 của Trung Quốc 6 điểm (54).
Với giấy phép thương mại tự do (NVIDIA Open Model License), đây là lần đầu tiên NVIDIA tung ra một mô hình thực sự cạnh tranh với các mô hình đóng hàng đầu, đồng thời cho phép doanh nghiệp xây sản phẩm trực tiếp từ đó. Mô hình có mặt ngay trên HuggingFace, OpenRouter và hệ sinh thái NVIDIA NIM. NVIDIA cũng công bố toàn bộ checkpoint, dữ liệu huấn luyện và phiên bản lượng tử hóa kèm theo.
Từ trước đến nay, NVIDIA tập trung vào bán chip và hạ tầng. Với Nemotron 3 Ultra, họ bước thẳng vào cuộc đua mô hình, vừa mở vừa thương mại, tích hợp sẵn trong NIM để rút ngắn thời gian từ mô hình thô đến triển khai thực tế. CrowdStrike và Palantir là hai đơn vị đã công bố dùng Nemotron cho hệ thống an ninh mạng và phân tích vận hành.
Với doanh nghiệp Việt đang xây hệ thống AI tự vận hành, Nemotron 3 Ultra là ứng cử viên đáng kiểm tra nghiêm túc, đặc biệt cho các tác vụ agentic chạy dài và phân tích lượng dữ liệu lớn cần inference nhanh.
Nguồn: Artificial Analysis
Ghi chú thuật ngữ
- Mixture-of-experts (MoE): Kiến trúc mô hình trong đó chỉ một phần tham số được kích hoạt mỗi lần xử lý, giúp mô hình có quy mô lớn hơn mà vẫn chạy nhanh và tiết kiệm chi phí.
- Hybrid Mamba-Attention: Kiến trúc kết hợp hai cơ chế xử lý: Attention cho phép mô hình nhìn lại toàn bộ ngữ cảnh để nắm chi tiết quan trọng, còn Mamba nén thông tin theo dạng trạng thái cuộn giúp xử lý văn bản dài với chi phí thấp hơn. NVIDIA xen kẽ hai lớp này để vừa nhanh vừa chính xác.
- NIM (NVIDIA Inference Microservices): Bộ dịch vụ đóng gói sẵn của NVIDIA cho phép triển khai nhanh mô hình AI trong môi trường doanh nghiệp.
- Checkpoint: Phiên bản đã lưu của mô hình sau quá trình huấn luyện, dùng để tải lại và triển khai.
- Agentic: Chỉ các tác vụ yêu cầu AI tự lên kế hoạch và thực thi nhiều bước liên tiếp, không chỉ trả lời một câu hỏi đơn lẻ.
- Inference: Quá trình mô hình tạo ra kết quả từ đầu vào mới, phân biệt với quá trình huấn luyện.
2. Canada công bố chiến lược “AI for All”: 2,3 tỷ đô, chủ quyền số và 700 triệu cho SME
Ngày 4/6/2026, Thủ tướng Mark Carney chính thức công bố “AI for All” với tổng đầu tư 2,3 tỷ đô la Canada. Mục tiêu tạo ra 250.000 việc làm vào năm 2031 và đóng góp thêm 3% GDP. Số tiền đầu tư được phân bổ cụ thể: 1 tỷ đô để xây siêu máy tính công lập đẳng cấp thế giới, 700 triệu đô qua Quỹ Tiếp cận Năng lực Điện toán dành riêng cho doanh nghiệp vừa và nhỏ, 500 triệu đô hỗ trợ các công ty AI nội địa. Mục tiêu hạ tầng là đạt 850 MW năng lực điện toán vào năm 2030.
Điểm khác biệt so với các chiến lược AI quốc gia trước đó là sự xuất hiện rõ ràng của từ “chủ quyền.” Thủ tướng Carney cảnh báo nền tảng AI nước ngoài có thể bị dùng để tác động đến công dân Canada. Chiến lược tổ chức theo sáu trụ cột, trong đó “xây dựng nền tảng AI chủ quyền” là một trụ cột riêng, điều ít thấy trong các tuyên bố chính sách AI cấp quốc gia trước đây.
Nhóm chỉ trích lập luận rằng chiến lược này thiếu chi tiết về cơ chế bảo vệ người dùng và chưa có cam kết mới về tác động môi trường từ các trung tâm dữ liệu.
Trong bối cảnh Canada dành 700 triệu đô riêng cho SME tiếp cận hạ tầng điện toán, phần lớn doanh nghiệp vừa và nhỏ tại Việt Nam vẫn hoàn toàn phụ thuộc vào API từ các nền tảng Mỹ hay Trung Quốc, đặt ra câu hỏi lớn về vấn đề chủ quyền AI cho quốc gia này.
Nguồn: CBC News
Bài viết của đội ngũ ZTO Labs, chuyên đào tạo và nghiên cứu AI tại Việt Nam.
