Công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí cho các mô hình AI Việt Nam

nh-Thumbnail.jpg

(vfo.vn) Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding).



VMLU do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt.

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau.

Sự phát triển bùng nổ của chat GPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm chat GPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tự như chat GPT ra đời. Không đứng ngoài xu thế đó, nhiều nhóm nghiên cứu tại Việt Nam có quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Trên thị trường hiện nay, hầu hết nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình.

Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding). Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt. Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới.

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì? Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt. Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp - cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp.

Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản.​
Cac-buc-s-dng-VMLU.jpg
Lưu ý: VMLU giới hạn 5 lần thử nghiệm/tài khoản/ngày. Kết quả được ghi nhận từ lịch sử đánh giá gần nhất.

Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.​

Thông tin được cung cấp bởi Zing (VNG)

 
  • Chủ đề
    jaist mô hình generative ai tiếng việt vmlu zalo ai đánh giá năng lực tiếng việt
  • Top