Tin tức ngày 22/5 mang đến ba tín hiệu định hình lại cách nhìn về cuộc đua AI trong năm 2026. Không phải OpenAI hay Google, Anthropic là AI lab đầu tiên có lợi nhuận hoạt động nhờ chiến lược tập trung vào doanh nghiệp và lập trình viên. Cùng ngày, OpenAI nộp hồ sơ IPO bí mật với định giá mục tiêu vượt 1 nghìn tỷ USD nhưng vẫn dự báo lỗ đến tận năm 2030. Cuối cùng, Cohere trao cho cộng đồng mã nguồn mở một mô hình doanh nghiệp 218 tỷ tham số chỉ cần 2 chiếc H100 để chạy.
1. Anthropic sắp trở thành AI lab đầu tiên có lợi nhuận hoạt động
Anthropic vừa thông báo với nhà đầu tư rằng quý 2/2026 sẽ là quý đầu tiên công ty đạt lợi nhuận hoạt động, dự kiến 559 triệu USD. Doanh thu quý này ước đạt 10,9 tỷ USD – tăng 130% so với 4,8 tỷ USD của quý trước, một mức tăng trưởng đặt Anthropic vào nhóm doanh nghiệp tăng nhanh nhất trong lịch sử công nghệ toàn cầu.
Động lực chính là mảng doanh nghiệp, đặc biệt là Claude Code – công cụ hỗ trợ lập trình viên viết và rà soát code ở quy mô tổ chức. Chi phí tính toán cũng đang được kiểm soát tốt hơn: từ 71 xu xuống còn 56 xu cho mỗi USD doanh thu. Dario Amodei, CEO của Anthropic, thừa nhận tốc độ tăng trưởng doanh thu “đang trở nên khó theo kịp.”
Điều đáng chú ý không phải là bản thân lợi nhuận, mà là con đường dẫn đến nó. Anthropic không chạy theo thị phần người dùng phổ thông mà tập trung vào phân khúc doanh nghiệp có tỷ suất lợi nhuận rõ ràng. Tuy nhiên, công ty cũng cảnh báo lợi nhuận có thể không duy trì được cả năm do kế hoạch đầu tư hạ tầng tính toán lớn trong các quý tới.
Nguồn: The Decoder
Ghi chú thuật ngữ
- Lợi nhuận hoạt động (operating profit): Lợi nhuận tính sau chi phí vận hành (tính toán, nhân sự) nhưng trước các khoản đầu tư và thuế.
- Claude Code: Công cụ lập trình bằng AI của Anthropic, tích hợp trực tiếp vào quy trình phát triển phần mềm của doanh nghiệp.
2. OpenAI nộp hồ sơ IPO bí mật, đặt mục tiêu niêm yết vào tháng 9
Ngày 22/05, OpenAI chính thức nộp hồ sơ IPO bí mật lên Ủy ban Chứng khoán Mỹ (SEC), với Goldman Sachs và Morgan Stanley là ngân hàng tư vấn. Công ty nhắm ra mắt công khai vào tháng 9/2026. Các nhà đầu tư tư nhân hiện định giá OpenAI trên 850 tỷ USD. Trong khi đó, giới phân tích dự báo định giá OpenAI khi IPO có thể vượt 1 nghìn tỷ USD – ngang tầm Apple hay Amazon trong giai đoạn đỉnh cao tăng trưởng.
Thông tin này được đưa ra trong bối cảnh SpaceX đang chuẩn bị IPO vào ngày 12/6 với định giá 1.75 nghìn tỷ USD, trong khi Anthropic nhắm niêm yết tháng 10. Tháng 9 đến tháng 10/2026 có thể là giai đoạn mà hai trong số những công ty AI quan trọng nhất của thập kỷ đồng loạt lên sàn.
Trong khi đó, OpenAI vẫn dự báo lỗ 14 tỷ USD trong năm 2026 và không kỳ vọng có lợi nhuận trước năm 2030. Điều này cho thấy con số định giá OpenAI là cú cược của thị trường vào tiềm năng tương lai, không phản ánh sức mạnh tài chính hiện tại. Khi lên sàn, áp lực lợi nhuận theo quý từ thị trường chứng khoán sẽ ảnh hưởng trực tiếp đến những quyết định chiến lược liên quan đến định giá API, tốc độ ra tính năng mới, và những khoản đầu tư ưu tiên.
Nguồn: The Decoder
Ghi chú thuật ngữ
- IPO bí mật (confidential filing): Quy trình công ty nộp hồ sơ đăng ký niêm yết lên SEC mà không công bố công khai, thường để kiểm tra phản hồi từ cơ quan quản lý trước khi chính thức ra mắt.
3. Cohere phát hành Command A+: mã nguồn mở, 218 tỷ tham số, chạy trên 2 chiếc H100
Cohere vừa phát hành Command A+ trên Hugging Face dưới giấy phép Apache 2.0. Đây là lần đầu tiên công ty phát hành mô hình hoàn toàn mã nguồn mở. Mô hình có tổng cộng 218 tỷ tham số nhưng chỉ kích hoạt 25 tỷ trong mỗi lần sinh văn bản, nhờ kiến trúc Sparse Mixture-of-Experts.
Về triển khai thực tế, Command A+ có thể chạy trên 1 chip Nvidia Blackwell B200 hoặc chỉ 2 chiếc H100, thấp hơn đáng kể so với yêu cầu phần cứng thông thường của các mô hình cùng tầm. Mô hình hỗ trợ các định dạng BF16, FP8, và W4A4 – kỹ thuật nén 4-bit gần như không mất độ chính xác. So với phiên bản trước, benchmark năng lực tác nhân cải thiện đáng kể: τ²-Bench Telecom tăng từ 37% lên 85%, Terminal-Bench Hard từ 3% lên 25%.
Mô hình được thiết kế cho quy trình tích hợp AI agent của doanh nghiệp và sovereign AI – tức là các tổ chức cần kiểm soát dữ liệu nội bộ, triển khai tại chỗ mà không phụ thuộc dịch vụ đám mây bên thứ ba.
Nguồn: The Decoder
Ghi chú thuật ngữ
- Sparse MoE (Sparse Mixture-of-Experts): Kiến trúc mô hình chỉ kích hoạt một tập nhỏ “chuyên gia” trong mạng nơ-ron cho mỗi token, tiết kiệm tính toán mà vẫn giữ chất lượng tốt.
- Apache 2.0: Giấy phép mã nguồn mở cho phép sử dụng thương mại tự do, chỉnh sửa và phân phối lại mà không cần xin phép.
- W4A4: Định dạng nén 4-bit cho cả trọng số lẫn giá trị kích hoạt, giúp giảm yêu cầu bộ nhớ đáng kể mà hầu như không mất độ chính xác.
- Sovereign AI: Xu hướng triển khai AI hoàn toàn trong hạ tầng riêng của tổ chức, không phụ thuộc vào dịch vụ đám mây nước ngoài.
Bài viết của đội ngũ ZTO Labs, chuyên đào tạo và nghiên cứu AI tại Việt Nam.
