Ba tin tức ngày hôm nay đều chỉ ra một xu hướng chung: AI đang rời khỏi khung chat và trực tiếp đi vào nơi công việc thực sự diễn ra. Google thử nghiệm nội bộ agent 24/7 nhúng trong Gemini; Anthropic tung ra 10 agent tài chính; một giao thức mã nguồn mở mới nổi lên giúp AI agent nhúng thẳng vào giao diện phần mềm.
1. Google và Meta xây AI agent cá nhân nhúng trong Gemini và Instagram
Google đang thử nghiệm nội bộ “Remy”: một agent chạy trong phiên bản nhân viên của Gemini có thể kết nối trực tiếp với Gmail, Google Calendar, Docs, Drive và Keep. Trong tài liệu nội bộ, Remy được mô tả là agent “hoạt động 24/7 cho công việc, học tập và cuộc sống hằng ngày.” Hiện dự án vẫn ở giai đoạn thử nghiệm nội bộ, chưa có lịch ra mắt chính thức.
Từ ngày 04/05, Google vừa đóng cửa Project Mariner, agent hoạt động trên trình duyệt để sáp nhập toàn bộ công nghệ vào Gemini Agent. Động thái này cho thấy Google đang tập trung toàn bộ vào một sản phẩm duy nhất thay vì nhiều sản phẩm agent riêng lẻ.
Meta cũng không đứng ngoài cuộc chơi. Công ty đang phát triển “Hatch”, agent chạy trong Instagram với hơn 2 tỷ người dùng kèm tính năng mua sắm theo đại lý.
Như vậy, Anthropic đã có Claude Code và Claude Cowork trên thị trường; OpenAI đang xây ứng dụng đa năng tích hợp Codex; Microsoft dùng công nghệ Anthropic cho Copilot Cowork. Cuộc đua AI đang chuyển từ “model nào mạnh nhất” sang “agent nào gắn chặt nhất vào cuộc sống số của người dùng.” Những thông tin mới từ Google và Meta là bằng chứng rõ ràng cho thấy đây là hướng đi thực sự của ngành.
Với các doanh nghiệp Việt Nam dùng Google Workspace, Remy là tín hiệu đáng theo dõi ngay cả khi chưa ra mắt. Nếu agent tích hợp sâu vào Gmail và Calendar trở thành thực tế, cách xử lý email hằng ngày, đặt lịch và phối hợp nhóm sẽ thay đổi hoàn toàn luồng làm việc hiện tại trên Google Workspace.
Nguồn: The Decoder
2. Anthropic ra mắt 10 AI agent chuyên dụng cho ngành tài chính, ngân hàng và bảo hiểm
Anthropic vừa ra mắt 10 agent AI được cấu hình sẵn cho lĩnh vực tài chính, nhắm cụ thể đến ngân hàng đầu tư, công ty quản lý tài sản và hãng bảo hiểm. Mỗi agent đều có vai trò riêng biệt. Nhóm nghiên cứu có “Pitch builder,” “Earnings reviewer” và “Meeting preparer.” Nhóm phân tích có “Model builder.” Bộ phận tuân thủ có “KYC screener.” Các agent có thể chạy dưới dạng plugin tích hợp vào phần mềm hiện có, hoặc vận hành hoàn toàn độc lập trên nền tảng Anthropic, với khả năng kéo dữ liệu tài chính bên ngoài thông qua mạng lưới đối tác.
Ý nghĩa lớn nhất nằm ở tốc độ tăng trưởng phía sau. Doanh thu niên lệ của Anthropic đạt khoảng 30 tỷ USD theo thống kê trong tháng 3/2026, tăng gần 1.400% so với cùng kỳ năm ngoái, và gấp hơn 3 lần so với mức 9 tỷ USD cuối năm 2025. CEO Dario Amodei xác nhận doanh thu Q1 tăng 80 lần theo năm. Trong bối cảnh ông lớn này đang hướng đến IPO vào cuối năm, việc tung ra 10 agent tài chính thể hiện cách công ty đang xây dựng doanh thu có thể định giá được trước khi lên sàn.
Với các doanh nghiệp Việt Nam trong lĩnh vực fintech, ngân hàng và bảo hiểm, tín hiệu từ Anthropic cho thấy AI agent tài chính không còn là giải pháp cần nghiên cứu thêm. Các nghiệp vụ như sàng lọc KYC, chuẩn bị tài liệu cho cuộc họp hay tổng hợp báo cáo kết quả kinh doanh đã có agent được xây sẵn. Câu hỏi không còn là “có nên thử không” mà là “quy trình nào triển khai trước.”
Nguồn: The Decoder
Ghi chú thuật ngữ
- KYC (Know Your Customer): quy trình xác minh danh tính khách hàng. Đây là yêu cầu bắt buộc trong ngân hàng và tài chính để phòng chống rửa tiền và gian lận
- plugin: thành phần phần mềm bổ sung tích hợp vào ứng dụng hoặc nền tảng có sẵn, mở rộng tính năng mà không cần thay thế toàn bộ hệ thống
- IPO (Initial Public Offering): lần đầu tiên một công ty phát hành cổ phiếu ra công chúng để huy động vốn.
- niên lệ (annualized): quy đổi doanh thu trong một khoảng thời gian ngắn (thường là một quý) thành mức tương đương cả năm để dễ so sánh tốc độ tăng trưởng
3. CopilotKit gọi vốn 27 triệu USD. AG-UI thành chuẩn kết nối AI agent với giao diện phần mềm
CopilotKit vừa hoàn thành vòng Series A trị giá 27 triệu USD, dẫn dắt bởi Glilot Capital, NFX và SignalFire, để mở rộng AG-UI – giao thức mã nguồn mở chuẩn hóa cách AI agent kết nối và giao tiếp với giao diện phần mềm.
Về mặt kỹ thuật, AG-UI giải quyết một vấn đề cụ thể: Agent không còn là chatbot nổi trên màn hình mà là lớp hoạt động nhúng thẳng trong ứng dụng. Giao thức xử lý streaming chat, gọi công cụ phía giao diện và chia sẻ trạng thái ứng dụng theo thời gian thực cho phép agent thấy được người dùng đang làm gì, thực hiện tác vụ và hiển thị giao diện phù hợp với ngữ cảnh thay vì trả về khối văn bản dài. AG-UI hoạt động song song với MCP của Anthropic và giao thức Agent2Agent của Google; đã được LangChain, Mastra, PydanticAI và Agno tích hợp và có tệp khách hàng doanh nghiệp lớn bao gồm Deutsche Telekom, Docusign, Cisco và S&P Global, với hàng triệu lượt cài đặt mỗi tuần.
Điểm đáng chú ý là cả Google, Microsoft, Amazon và Oracle cùng lúc hỗ trợ một giao thức do startup xây dựng. Điều này hiếm khi xảy ra. AG-UI đang trở thành lớp kết nối chuẩn giữa AI agent và giao diện phần mềm, tương tự cách MCP trở thành chuẩn kết nối agent với dữ liệu và công cụ bên ngoài.
Với các đội ngũ xây dựng sản phẩm và công ty SaaS Việt Nam đang tích hợp AI, đây là tín hiệu rõ về hướng kiến trúc tương lai khi agent nhúng đúng điểm vào luồng thực tế của người dùng. AG-UI đang ở thời điểm tương tự như MCP, khi những đội ngũ tích hợp sớm đã có lợi thế đáng kể chỉ sau vài tháng.
Nguồn: TechCrunch
Ghi chú thuật ngữ
- AG-UI: giao thức mã nguồn mở do CopilotKit phát triển, chuẩn hóa cách AI agent kết nối với giao diện người dùng trong ứng dụng phần mềm
- MCP (Model Context Protocol): giao thức mã nguồn mở do Anthropic phát hành, chuẩn hóa cách AI agent kết nối với dữ liệu và công cụ bên ngoài
- Agent2Agent (A2A): giao thức của Google cho phép các AI agent giao tiếp và phối hợp với nhau
- Series A: vòng gọi vốn từ quỹ đầu tư mạo hiểm sau khi startup đã có sản phẩm và số liệu tăng trưởng ban đầu
- SaaS (Software as a Service): mô hình phần mềm cung cấp qua internet dưới dạng dịch vụ thuê bao
- streaming: truyền dữ liệu liên tục theo thời gian thực, thay vì chờ toàn bộ kết quả hoàn thành mới hiển thị một lần
