Đăng ký Hội viên Premium

Bạn cần có tài khoản thu phí để truy cập nội dung này.

Đăng ký ngay
Hoặc

Đã có tài khoản?

Đăng nhập tại đây

Ấn phẩm in mới nhất

Viettel AI phát triển mô hình 120 tỉ tham số phục vụ cho hành chính công và doanh nghiệp

Viettel AI đang phát triển AI Agent và Trợ lý AI Pháp luật, hướng tới các ứng dụng AI chuyên biệt cho doanh nghiệp và cơ quan nhà nước tại Việt Nam. Những sản phẩm này dựa trên một mô hình ngôn ngữ lớn do chính đơn vị này huấn luyện trên dữ liệu bản địa.
Tác giả: Giang Lê
Viettel AI phát triển mô hình 120 tỉ tham số phục vụ cho hành chính công và doanh nghiệp

Trong định hướng phát triển AI tại Việt Nam, trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) tự xây mô hình nền tảng thay vì chỉ dựa vào công nghệ nước ngoài. Đơn vị này đang phát triển AI Agent dành cho người Việt, do đội ngũ kỹ sư trong nước huấn luyện trên dữ liệu hành chính, nghiệp vụ và văn bản chuyên ngành. Nền tảng đứng sau các sản phẩm này là một mô hình ngôn ngữ lớn tiếng Việt quy mô 120 tỉ tham số, có tên VT-Super-120B-A12B. Ứng dụng đầu tiên là Trợ lý AI Pháp luật, được kỳ vọng hỗ trợ phân tích hồ sơ, đối chiếu quy định và đề xuất phương án xử lý cho từng tình huống cụ thể trong hệ thống hành chính và tư pháp

Theo Viettel AI, VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super và do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện, nhằm tối ưu hóa khả năng xử lý tiếng Việt trong các bối cảnh nghiệp vụ phức tạp.

Trong mô hình ngôn ngữ lớn, quy mô 120 tỉ tham số, theo ông Nguyễn Hồng Phúc, giám đốc Khoa học của Neurons AI, "không còn là đột phá lớn về mặt khoa học." Mô hình của Viettel được phát triển dưới dạng huấn luyện tiếp tục dựa trên mô hình nền tảng của Nvidia. "Giá trị cốt lõi ở đây nằm ở nguồn lực và công sức mà đội ngũ Viettel AI đã đổ vào việc xây dựng tập dữ liệu tiếng Việt," ông Phúc nói. "Tuy nhiên, do Viettel chưa công bố chi tiết về bộ dữ liệu (data card) cũng như các kết quả thử nghiệm hiệu năng (benchmark) tiêu chuẩn, thị trường hiện vẫn chưa có đủ cơ sở để đánh giá chính xác chất lượng thực sự của mô hình này.” 

Mô hình được huấn luyện trên các nguồn dữ liệu bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và văn bản chuyên ngành tại Việt Nam. Viettel AI cho biết hệ thống được tối ưu để nâng cao khả năng xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng “quên” kiến thức đã học trong quá trình huấn luyện tiếp.

Bài liên quan