Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Đăng ký ngay
Hoặc

Đã có tài khoản?

Đăng nhập tại đây

Ấn phẩm in mới nhất

AI không thể tự mình cứu lấy những ngôn ngữ đang biến mất

Dù các công cụ AI tạo sinh đang giúp thu hẹp khoảng cách ngôn ngữ, chúng vẫn bỏ lại phía sau hàng ngàn ngôn ngữ thiểu số vì thiếu dữ liệu huấn luyện chất lượng.
Tác giả: Catherine Thorbecke
AI không thể tự mình cứu lấy những ngôn ngữ đang biến mất

Liên Hiệp Quốc ước tính khoảng 40% ngôn ngữ trên thế giới đang đối mặt nguy cơ biến mất. Câu hỏi đặt ra là: Liệu trí tuệ nhân tạo có thể làm chậm lại xu hướng này không?

Dù các tập đoàn công nghệ toàn cầu vẫn tin rằng câu trả lời là có, thực tế lại phức tạp hơn nhiều. Những công cụ AI tạo sinh gần đây tuy đã góp phần thu hẹp khoảng cách ngôn ngữ và văn hóa, nhưng vẫn còn tồn tại nhiều lỗ hổng nghiêm trọng khi xử lý các “ngôn ngữ ít tài nguyên”, thường là phương ngữ vùng miền hoặc ngôn ngữ bản địa đang dần mai một vì gần như không hiện diện trên không gian mạng.

Một báo cáo của Viện Stanford về Trí tuệ Nhân tạo lấy con người làm trung tâm (HAI), công bố đầu năm nay, cho thấy hầu hết các mô hình ngôn ngữ lớn (LLM) đều hoạt động kém hiệu quả với các ngôn ngữ ngoài tiếng Anh, đặc biệt là những ngôn ngữ thiếu dữ liệu huấn luyện.

Vấn đề này không chỉ là tổn thất về mặt văn hóa, mà còn là điểm mù trong phát triển công nghệ. Cốt lõi của khó khăn nằm ở việc thiếu dữ liệu chất lượng. Những mô hình LLM mạnh nhất hiện nay đòi hỏi khối lượng dữ liệu huấn luyện khổng lồ, và phần lớn lại là tiếng Anh. Nhiều nhà nghiên cứu đã cảnh báo rằng điều này có thể khiến AI vô tình làm xói mòn sự đa dạng văn hóa và củng cố thiên kiến theo góc nhìn phương Tây. Khi một ngôn ngữ trở nên quá áp đảo, hậu quả còn nghiêm trọng hơn.

Theo Bloomberg

  • Chưa có tag

Bài liên quan