Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Hoặc

Đã có tài khoản?

Ấn phẩm in mới nhất

Tháng 05.2026

Tháng 02.2026

Tháng 12.2025

Tháng 10.2025

Tháng 09.2025

Tháng 08.2025

Tháng 07.2025

Tháng 06.2025

Tháng 05.2025

Tháng 04.2025

Từ khóa tìm kiếm thịnh hành

Tìm kiếm

Công nghệ xanh

Trước khi DeepSeek gây chấn động, Chatbot Arena đã báo hiệu sự xuất hiện của nó

Một hệ thống xếp hạng chatbot dựa trên đánh giá cộng đồng đã trở thành công cụ giúp giới trong ngành AI xác định mô hình nào hoạt động hiệu quả nhất.

Tác giả: Rachel Metz

Trước khi DeepSeek gây chấn động, Chatbot Arena đã báo hiệu sự xuất hiện của nó

Đối với phần lớn thế giới, DeepSeek dường như bùng nổ từ hư không vào tháng Một với phần mềm trí tuệ nhân tạo (AI) mã nguồn mở cạnh tranh được với các mô hình của OpenAI và Google— tất cả được phát triển có thể với chi phí chỉ bằng một góc những mô hình đi trước. Nhưng với những người hâm mộ của trang web Chatbot Arena, đây chỉ là khoảnh khắc biết trước đối với họ: Họ đã theo dõi—và đánh giá—tiến bộ của các mô hình từ công ty Trung Quốc đứng sau DeepSeek suốt nhiều tháng qua.

Là dự án nghiên cứu được lập ra đầu năm 2023 ở phòng thí nghiệm Sky Computing, đại học California (UC) ở Berkeley, trang này cho phép người dùng thử các con chatbot của nhiều mô hình AI khác nhau và bỏ phiếu bình chọn. Họ đóng vai trò “một bên thứ ba độc lập có động lực đo lường trung thực tiến trình phát triển của AI,” theo Wei-Lin Chiang, lãnh đạo Chatbot Arena và nghiên cứu sinh sau tiến sĩ ở UC Berkeley. “Ai cũng nói mô hình của họ là nhất, nên rất cần sự minh bạch và đánh giá độc lập.”

2000x1334-2--11 — Wei-Lin Chiang và Anastasios Angelopoulos của Chatbot Arena trong phòng thí nghiệm của họ ở Berkeley, California. *Hình ảnh: Laura Morton/Wall Street Journal*

Chatbot Arena đã sớm trở thành nơi đánh giá đi đầu trong lĩnh vực đánh giá AI đang thay đổi nhanh chóng: Họ có một triệu lượt người dùng mỗi tháng. Cả các công ty AI hàng đầu lẫn những tay chơi mã nguồn mở mới xuất hiện đều đổ về đó để thử nghiệm mô hình mới của họ. Một số công ty thậm chí đưa mô hình thử nghiệm lên đó trước khi công bố cho đại chúng (như OpenAI với GPT-4o mùa Xuân năm ngoái).

Khi mọi chuyện diễn ra suôn sẻ, thì đó là nơi để họ tự hào, giống như DeepSeek (dù cũng gây tiếng vang ở tầm quốc tế, không phải lúc nào cũng tích cực). Người dùng Chatbot Arena đã dùng thử một số mô hình mã nguồn mở của DeepSeek, cái sau lại được đánh giá cao hơn cái trước. Mô hình mới nhất của công ty này là V3, thuộc loại ngôn ngữ lớn như ChatGPT, và R1, tốn nhiều thời gian tính toán hơn trước khi xuất ra câu trả lời. Họ đưa các mô hình đó lên Chatbot Arena lần lượt vào cuối tháng 12.2024 và tháng 1.2025, cả hai đều leo hạng nhanh chóng.

Theo quy định của Luật Xuất Bản của Việt Nam, Bloomberg L.P. và Công ty Cổ phần Beacon Asia Media đạt thỏa thuận với Báo Tài Nguyên và Môi Trường (nay là Báo Nông Nghiệp và Môi Trường) (là cơ quan báo chí chịu sự quản lý của Bộ Nông Nghiệp và Môi Trường) để báo là đơn vị chính thức tại Việt Nam chịu trách nhiệm phát hành ấn phẩm Phát Triển Xanh có nội dung trao đổi và hợp tác với Bloomberg Businessweek Vietnam

PHÁT TRIỂN XANH - Chuyên trang của Báo điện tử Tài nguyên và Môi trường

Trụ sở: Số 10, đường Tôn Thất Thuyết, phường Mỹ Đình, quận Nam Từ Liêm, thành phố Hà Nội

Giấy phép xuất bản số 37/GP-CBC do Bộ Thông tin và Truyền thông cấp ngày 21/10/2024

Tổng biên tập: Hoàng Mạnh Hà

Phó tổng biên tập phụ trách báo điện tử: Lê Xuân Dũng

Phó tổng biên tập: Lý Thị Hồng Điệp

Mỹ áp thuế 12,5% lên hàng Việt Nam, rủi ro vẫn còn ở phía trước

Để hạ tầng Việt Nam thu hút dòng vốn nước ngoài

Argentina – Cabo Verde: Doanh nghiệp đầu ngành đối đầu startup tinh gọn

Trước khi DeepSeek gây chấn động, Chatbot Arena đã báo hiệu sự xuất hiện của nó

#Premium

Cách ông Trump hủy diệt cơ quan tư vấn giá trị nhất của doanh nghiệp Mỹ

Ông chủ người Đức của Politico muốn thâu tóm truyền thông Mỹ

Tiền và niềm tin vào tiền

Lần thứ hai, UOB nâng dự báo tăng trưởng GDP Việt Nam trong năm nay

Đội tàu Hải An vươn ra biển lớn

Trung tâm trung chuyển quốc tế: Lắm cơ hội, nhiều thách thức

Thí điểm thị trường tài sản mã hóa ở Việt Nam: Cơ hội và những bài toán chờ giải

Cơn sốt búp bê Labubu là gì và còn có thể kéo dài được bao lâu?

Việt Nam có cơ hội xây dựng kinh tế biển bền vững

Sản phẩm có cấu trúc hồi sinh mạnh mẽ giữa cơn sốt trị giá 200 tỉ USD

Ngành du thuyền tới thời "xuôi gió"

Khủng hoảng nhà ở Mỹ hay khủng hoảng bộ Nhà ở?

Mùi hương của các sản phẩm gia dụng đang ngày càng nồng nàn hơn

Thảm cảnh Jeep và những toan tính đằng sau hậu trường của Stellantis

Giới nhà giàu Mỹ lại lao vào cuộc chơi buôn lậu hàng hiệu

CEO Ironman: Từ cuộc đua thành thương hiệu phong cách sống

Coin98 Wallet và KyberSwap tạm ngừng phục vụ người dùng Việt Nam theo đúng tinh thần của quy định mới về tài sản mã hóa

PTSC từng bước tham gia nhiều hơn vào điện gió ngoài khơi toàn cầu

Tiền lương bằng stablecoin? Ác mộng của các ngân hàng địa phương

Mỹ siết xuất khẩu chip, buộc Samsung và SK Hynix phải xin giấy phép hằng năm

Fed đã lường trước các số liệu việc làm lần này

Tiêu dùng trong nước phục hồi nhờ nhóm hàng hóa không thiết yếu

Thách thức lớn tiếp theo của Việt Nam là tiền tệ

Switch 2 chứng minh Nintendo vẫn là "thiên tài lập dị" của ngành game

Hollywood đã kết thúc kỷ nguyên Technicolor

Có lẽ chúng ta đang hiểu sai về cách phát triển công nghệ AI

Mỹ cắt giảm nghiên cứu không gian, Trung Quốc hưởng lợi

Cách Bombas xây dựng một đế chế sản xuất vớ doanh thu 500 triệu USD

Bất động sản Mỹ: Dân bản xứ lép vế trước dân nước ngoài

Nỗ lực đưa AI vào các trường học Mỹ đang phát huy tác dụng