Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Đăng ký ngay
Hoặc

Đã có tài khoản?

Đăng nhập tại đây

Ấn phẩm in mới nhất

AI Fable 5 gây thất vọng ngay sau màn ra mắt của Anthropic

Fable 5 của Anthropic xếp sau GPT-5.5 trên thang đo năng lực AI, đồng thời đối mặt tranh cãi về chính sách dữ liệu và cơ chế an toàn.
Tác giả: Kiet Luu
AI Fable 5 gây thất vọng ngay sau màn ra mắt của Anthropic

Chưa đầy một ngày sau khi ra mắt, mô hình AI Fable 5 của Anthropic đã nhận kết quả đáng thất vọng khi chỉ đạt 22% điểm trên thang đo Agents’ Last Exam (ALE), xếp sau đối thủ GPT-5.5 của OpenAI. Trong khi đó, các rào cản liên quan đến chính sách dữ liệu và cơ chế an toàn của mô hình này cũng đang vấp phải phản ứng tiêu cực từ cả đối tác lớn lẫn cộng đồng nghiên cứu.

Trong một kết quả gây bất ngờ, GPT-5.5 của OpenAI ra mắt từ tháng 4 đã vươn lên dẫn đầu thang đo ALE với tỉ lệ hoàn thành 24%, vượt mức 22% của Fable 5.

Thang đo ALE do các nhà nghiên cứu thuộc Đại học California, Berkeley phát triển nhằm đánh giá khả năng của AI trong việc thực hiện các quy trình công việc chuyên môn phức tạp có giá trị kinh tế thay vì chỉ giải quyết những bài toán riêng lẻ.

Kết quả này cho thấy những mô hình AI tiên tiến nhất hiện nay vẫn gặp khó khăn khi xử lý các tác vụ thực tế có tác động đến tăng trưởng kinh tế.

Bài liên quan