Ba tin tức nổi bật hôm nay đều xoay quanh một câu hỏi chung: AI agent sẽ sống ở đâu? Trong nền tảng tập trung của các công ty lớn, trong công cụ nội bộ doanh nghiệp, hay ngay trên thiết bị người dùng?
1. OpenAI gộp ChatGPT, Codex và API vào một – hướng đến “super app” agent
Ngày 16/5, OpenAI công bố tái cơ cấu công ty. Đồng sáng lập kiêm Chủ tịch Greg Brockman chính thức tiếp quản toàn bộ chiến lược sản phẩm. Ba mảng riêng biệt bao gồm ChatGPT, Codex và developer API sẽ hội tụ vào một đội ngũ duy nhất với mục tiêu xây một “super app”. Ứng dụng này kết hợp ChatGPT, Codex và trình duyệt Atlas, nhận yêu cầu bằng ngôn ngữ tự nhiên, tự viết code, tự duyệt web rồi trả về kết quả.
Trong tuyên bố nội bộ, Brockman đặt mục tiêu rất rõ ràng: Tập trung hợp nhất các sản phẩm vào một để “hướng đến tương lai agentic, giành chiến thắng ở cả phân khúc cá nhân lẫn doanh nghiệp.” Thibault Sottiaux, nguyên CEO Codex, sẽ chỉ đạo đội hợp nhất. Nick Turley, nguyên trưởng nhóm ChatGPT, chuyển sang mảng Doanh nghiệp.
Như vậy, mặc dù ChatGPT có hàng trăm triệu người dùng, nó vẫn không phải là tương lai OpenAI muốn xây. Thứ họ nhắm đến là một agent thực hiện một luồng liên tục từ yêu cầu đến kết quả, không phải là chatbot và các công cụ lập trình riêng rẽ,
Với các team kỹ thuật đang dùng đồng thời ChatGPT và Codex, quy trình hiện tại của doanh nghiệp bạn đang được thiết kế theo từng công cụ riêng lẻ, hay theo hướng agent thống nhất?
Nguồn: TechCrunch
Ghi chú thuật ngữ
- super app: Ứng dụng đa năng tích hợp nhiều tính năng (chat, lập trình, duyệt web) trong một sản phẩm duy nhất
- AI agent: AI có khả năng tự lên kế hoạch và thực thi nhiều bước liên tiếp thay vì chỉ trả lời từng câu hỏi đơn lẻ
- API: Giao diện cho phép phần mềm kết nối và gọi tính năng từ dịch vụ khác
2. Microsoft rút phép truy cập Claude Code của nhân viên
Cuối năm 2025, Microsoft cấp quyền truy cập Claude Code cho hàng nghìn nhân viên nội bộ. Công cụ của Anthropic nhanh chóng được ưa chuộng hơn GitHub Copilot CLI, sản phẩm mà chính Microsoft xây.
Tuy nhiên, đội Experiences & Devices phụ trách Windows, Microsoft 365, Teams và Surface sẽ thu hồi giấy phép vào ngày 30/6/2026, đúng ngày kết thúc năm tài chính của Microsoft. Lý do chính thức là “hội tụ chiến lược” về GitHub Copilot CLI. Lý do thực tế, theo nguồn tin nội bộ, một phần là để giảm cắt chi phí trước khi bước sang năm tài chính mới, một phần vì Claude Code đang làm suy yếu sản phẩm của chính họ.
Các kỹ sư phần mềm của công ty không hài lòng với quyết định này khi mà khoảng cách tính năng giữa Claude Code và Copilot CLI vẫn còn đáng kể. Model Claude của Anthropic vẫn chạy được qua Copilot CLI, nhưng thứ được các kỹ sư ưa chuộng nhất là giao diện agentic của Claude Code sẽ biến mất.
Dù đây là quyết định có thể đoán trước của một công ty ưu tiên sản phẩm nội bộ, câu chuyện vẫn minh họa rủi ro ít được bàn đến trong việc xây stack công cụ AI: Chọn công cụ tốt nhất hôm nay không đảm bảo nó sẽ tồn tại lâu dài trong tổ chức. Điều quan trọng là xây quy trình linh hoạt đủ để thay thế công cụ khi cần, không phải tìm công cụ “hoàn hảo” để gắn bó mãi.
Nguồn: The Decoder
Ghi chú thuật ngữ
- Claude Code: Công cụ lập trình bằng AI dạng terminal của Anthropic, hoạt động như một agent tự viết, chỉnh sửa và chạy code
- GitHub Copilot CLI: Công cụ lập trình bằng AI dạng dòng lệnh của Microsoft, tích hợp với môi trường GitHub
- stack: Tập hợp các công cụ và nền tảng kỹ thuật một đội kỹ sư phần mềm dùng cùng nhau
3. OPPO công bố mã nguồn mở X-OmniClaw: AI agent Android chạy trực tiếp trên thiết bị
Phòng lab Multi-X của OPPO vừa công bố mã nguồn mở X-OmniClaw: Một AI agent đa phương thức chạy thẳng trên thiết bị Android, dùng camera, màn hình và giọng nói mà không cần gửi dữ liệu lên đám mây. Toàn bộ lớp nhận thức bao gồm đọc màn hình, nhận diện hình ảnh, điều hướng ứng dụng đều có thể xử lý ngay trên thiết bị. Model ngôn ngữ đám mây chỉ được gọi khi cần suy luận ở cấp độ phức tạp hơn.
Trong các bản demo, X-OmniClaw được thấy so sánh giá sản phẩm qua camera, hỗ trợ giải bài tập dưới dạng trợ lý nổi và tự tạo album ảnh từ bộ sưu tập người dùng. Hệ thống học cách lặp lại hành vi người dùng, không cần lập trình thủ công từng tác vụ. Mã nguồn và báo cáo kỹ thuật đã công bố trên GitHub và arXiv (2605.05765v1).
Thông tin này đem lại ý nghĩa rất lớn về câu chuyện kiến trúc: Khi toàn bộ vòng nhận thức–hành động của agent sống trực tiếp trên thiết bị, chi phí triển khai và rủi ro về quyền riêng tư (vốn là rào cản lớn trong giáo dục, y tế và tài chính) sẽ giảm đáng kể so với kiến trúc phụ thuộc hoàn toàn vào đám mây.
Đây là lần đầu tiên một hãng điện thoại lớn châu Á với lượng người dùng đáng kể tại Việt Nam và Đông Nam Á công bố kiến trúc agent đầu cuối ở dạng mã nguồn mở hoàn chỉnh. Với nhà phát triển ứng dụng Android tại Việt Nam, đặc biệt là các team đang có các dự án giáo dục, thương mại di động hoặc vùng kết nối internet không ổn định, X-OmniClaw là tham chiếu kỹ thuật thực tế đáng xem.
Nguồn: The Decoder
Ghi chú thuật ngữ
- arXiv: Kho lưu trữ bài báo nghiên cứu tiền xuất bản, được dùng rộng rãi trong khoa học máy tính và AI
