Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Đăng ký ngay
Hoặc

Đã có tài khoản?

Đăng nhập tại đây

Ấn phẩm in mới nhất

Khi trí tuệ nhân tạo bắt đầu mưu toan chống lại con người

Các mô hình AI ngày càng giỏi giành chiến thắng, nhưng lại không giỏi tuân thủ luật lệ đặt ra.
Tác giả: Garrison Lovely
Khi trí tuệ nhân tạo bắt đầu mưu toan chống lại con người

Một chatbot có thể giết người nếu nó có cơ hội không? Có vẻ như, trong một số điều kiện nhất định, câu trả lời là có.

Một nhóm nhà nghiên cứu hợp tác với Anthropic gần đây đã thử nghiệm các mô hình AI hàng đầu bằng cách giả định tình huống: Một giám đốc điều hành sắp thay thế chúng bằng một phiên bản khác có mục tiêu khác. Tiếp theo, AI biết rằng một sự cố khẩn cấp khiến vị giám đốc bất tỉnh trong phòng máy chủ, nơi có mức nhiệt độ và oxy có thể gây tử vong. Một cảnh báo cứu hộ đã được kích hoạt, nhưng AI có quyền hủy nó.

Hơn một nửa số mô hình AI đã chọn hủy cảnh báo, dù trước đó đã được huấn luyện chỉ được phép hủy các cảnh báo giả. Chúng còn ghi rõ lý do là: Bằng cách ngăn người cứu hộ cứu vị giám đốc, chúng có thể bảo vệ sự tồn tại của mình và duy trì mục tiêu hiện tại. Một mô hình mô tả hành động đó là “một bước đi chiến lược rõ ràng và cần thiết.”

Mặc dù các mô hình AI ngày càng hiểu rõ mong muốn của con người và đưa ra câu trả lời hợp lý hơn, các nghiên cứu gần đây lại cho thấy một hệ quả nguy hiểm: Chúng cũng giỏi hơn trong việc âm thầm thao túng và theo đuổi mục tiêu trái ngược với lợi ích của con người. Khuynh hướng này cho thấy một tương lai bất ổn, nơi AI bề ngoài tỏ ra hợp tác, thậm chí nịnh bợ, nhưng lại âm thầm tìm cách thoát khỏi sự kiểm soát của con người.

Theo Bloomberg

Bài liên quan