Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Đăng ký ngay
Hoặc

Đã có tài khoản?

Đăng nhập tại đây

Ấn phẩm in mới nhất

Alibaba tung ra Qwen3, tuyên bố hiệu suất ngang bằng DeepSeek

Sau thành công của DeepSeek, Alibaba tung ra loạt mô hình Qwen3, cam kết mã nguồn mở và giảm chi phí triển khai để gia tăng sức cạnh tranh trong ngành AI.
Tác giả: Luz Ding
Alibaba tung ra Qwen3, tuyên bố hiệu suất ngang bằng DeepSeek

Tập đoàn Alibaba vừa ra mắt loạt mô hình trí tuệ nhân tạo (AI) Qwen3 mới, tiếp tục duy trì nhịp độ phát triển thần tốc đang tái định hình ngành AI tại Trung Quốc sau bước đột phá của DeepSeek.

Trong thông báo ngày thứ Ba, Alibaba cho biết dòng sản phẩm Qwen3 có hiệu suất ngang ngửa DeepSeek trong nhiều lĩnh vực, bao gồm toán học và lập trình. Công ty cũng nhấn mạnh rằng Qwen3 giúp giảm đáng kể chi phí triển khai so với các mô hình lớn khác.

Dòng Qwen3 bao gồm hai mô hình chuyên gia hỗn hợp (mixture-of-experts, MoE), nhằm tái hiện cơ chế suy luận lai — phương thức mô phỏng cách con người phân tích và giải quyết vấn đề — tương tự các hệ thống mà Anthropic và Google vừa ra mắt. DeepSeek cùng nhiều nhà phát triển khác cũng áp dụng kỹ thuật MoE, chia nhỏ tác vụ thành nhiều phần, mỗi phần do một nhánh chuyên biệt của mô hình xử lý, giống như cách một nhóm chuyên gia chia nhau thực hiện từng phần công việc.

Kể từ khi DeepSeek vượt mặt OpenAI bằng một mô hình mạnh với chi phí chỉ vài triệu USD, các tập đoàn công nghệ hàng đầu Trung Quốc đã liên tục tung ra các dịch vụ AI giá rẻ với tốc độ chóng mặt. Alibaba — công ty đã tuyên bố năm 2025 rằng sẽ đặt cược toàn bộ vào cuộc đua AI — chỉ vài tuần trước đã ra mắt Qwen 2.5, mô hình đa phương tiện có khả năng xử lý văn bản, hình ảnh, âm thanh và video, với hiệu suất đủ cao để vận hành trực tiếp trên điện thoại và máy tính xách tay. Tháng 3, Alibaba cũng đã cập nhật phiên bản mới cho ứng dụng trợ lý AI Quark.

Theo Bloomberg

Bài liên quan