Đề thi cho Zalo AI Challenge được xây dựng từ sự đóng góp của hơn 1.000 người với thời gian 4 tháng

(vfo.vn) Sau hơn 4 tháng làm việc, 7 thành viên ban cố vấn và hơn 20 kỹ sư thuộc ban tổ chức chương trình cũng đã hoàn thành 3 đề bài và bộ dữ liệu huấn luyện với sự tham gia đóng góp của hơn 1.000 người. Zalo hy vọng mang đến ý nghĩa lớn trong nghiên cứu và thực hành cho cộng đồng AI Việt Nam.

Ngày 04/11/2022, Zalo AI Challenge 2022 chính thức công bố bộ 3 đề thi và mở cổng cho các đội đăng ký tham gia thi đấu. Mỗi đề bài tương ứng với một mảng đang là xu hướng trong lĩnh vực AI. Cụ thể, đề bài thuộc lĩnh vực xử lý ảnh số/video là Liveness Detection - xác định khuôn mặt người trong video là thật hay giả mạo. Mảng xử lý ngôn ngữ tự nhiên có đề E2E Question Answering - tìm câu trả lời chính xác nhất từ Wikipedia cho một câu hỏi. Đề bài Lyric Alignment - tìm giải pháp để cân chỉnh trùng khớp lời bài hát và nhạc - thuộc mảng xử lý âm thanh.​
hinh-anh-1.jpg
3 đề bài giải quyết nhu cầu thực tế của người Việt

Theo ông Châu Thành Đức - Data Science Manager tại Zalo AI, đồng thời làm phó trưởng ban tổ chức chương trình, các đề bài 2022 dựa trên các vấn đề “nóng hổi” của xã hội Việt Nam và cũng là nhu cầu thiết thực trong cuộc sống thường ngày.

Điểm nổi bật nhất ở Zalo AI Challenge 2022 là yếu tố thời sự của đề bài. Hiện nay, các hoạt động chuyển đổi số định danh bằng khuôn mặt đang diễn ra ở nhiều lĩnh vực quan trọng như ngân hàng, y tế, giáo dục... Thông qua xác minh khuôn mặt trên điện thoại, người dân không cần trực tiếp đến các cơ sở để giải quyết một số thủ tục, từ đó có thể tiết kiệm thời gian và công sức. Tuy nhiên, việc làm giả khuôn mặt trong hình ảnh, video đang trở nên ngày càng tinh vi.

Với đề bài Liveness Detection, các đội tham gia phải vượt qua thử thách xây dựng mô hình AI có khả năng phân loại các video chứa khuôn mặt thu trực tiếp từ người thật, video giả mạo từ khuôn mặt giả hay video giả đã thu từ trước. Với thí sinh, đây là đề bài thách thức nhất; còn với ban tổ chức, Liveness Detection chính là bài toán cần chuẩn bị cầu kỳ nhất bởi dữ liệu được thu thập từ người thật. Để tăng kịch tính, ban tổ chức đã nâng độ khó của đề thi bằng cách cho các tình nguyện viên mang khẩu trang. Sau đó, nguồn dữ liệu giả được tạo ra tương ứng. Nhiệm vụ của các đội là phân loại các dữ liệu giống hệt nhau về mặt hiển thị.

Một thử thách gay cấn khác dành cho các đội thi năm nay là tìm được giải pháp cho đề bài E2E Question Answering. Khi nhập câu hỏi trên internet, mọi người thường sẽ nhận về hàng triệu kết quả, trong đó có rất nhiều kết quả không đúng như mong muốn. Trong thử thách này, các đội tham gia phải xây dựng được hệ thống có thể đưa ra câu trả lời chính xác cho một câu hỏi cụ thể từ nguồn dữ liệu Wikipedia, giúp người hỏi có được đúng thông tin đang cần.

Về đề bài E2E Question Answering, ông Nguyễn Trường Sơn - Research Science Manager tại Zalo AI - thành viên ban tổ chức cho biết, vẫn là dạng xử lý ngôn ngữ tự nhiên nhưng đề bài năm 2022 thách thức hơn các năm trước. Ông Sơn giải thích: “Kho dữ liệu của Wikipedia tương đối lớn, các đội phải xây dựng hệ thống gồm nhiều thành phần một cách khéo léo, mỗi thành phần phải hoạt động cho hiệu quả cao thì mới có thể tìm được câu trả lời chính xác trong thời gian cho phép”. Ông cũng chia sẻ, bài toán này rất thực tế bởi hệ thống hỏi đáp là một phần quan trọng của các sản phẩm AI hiện nay như giao tiếp người-máy, các trợ lý giọng nói hoạt động trong các sản phẩm như loa thông minh, nhà thông minh...

Lyric Alignment là bài toán đáp ứng được hình thức giải trí rất phổ biến của người dân Việt Nam, đó là karaoke. Điểm khó là làm sao căn chỉnh phần lời hiển thị (lyric) trùng khớp với phần giai điệu (audio). Trong thử thách này, các đội thi sẽ xây dựng mô hình AI có khả năng căn chỉnh trùng khớp lời bài hát chạy trên nền âm nhạc.

Thành viên ban cố vấn - PGS.TS Quản Thành Thơ - Phó trưởng khoa Khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách Khoa, Đại học Quốc gia TP.HCM nhận định: “Bài toán Lyric Alignment có tính học thuật ở cả xử lý âm thanh và xử lý ngôn ngữ tự nhiên. Tính thực tế cũng khá cao khi có thể ứng dụng nhiều hoàn cảnh thực tế, chẳng hạn hỗ trợ sách nói, học phát âm…” Theo ban tổ chức, bài toán này còn có thể mở rộng ra áp dụng tạo phụ đề (subtitle) cho các bộ phim, chương trình truyền hình...​
hinh-anh-2.jpg
Ngoài 4 thành viên ban cố vấn Zalo, chương trình còn có sự góp mặt của 3 chuyên gia trong lĩnh vực AI

Kết quả thi đấu của các đội tham gia trong Zalo AI Challenge 2022 sẽ được chấm điểm tự động và được xếp hạng trên leaderboard real-time tương tự thể thức thi đấu của các nền tảng uy tín trên thế giới. Thời gian thi đấu diễn ra liên tục từ 04/11 đến 06/12/2022.

Năm nay, chương trình nâng tổng giá trị giải thưởng lên 15.000USD. Trong đó, 3 đội quán quân tương ứng với 3 bảng thi đấu sẽ nhận được phần thưởng 3.500USD/giải, 3 đội á quân sẽ giành về 1.500USD/giải.​

Thông tin được cung cấp bởi Zalo

 
  • Chủ đề
    e2e question answering liveness detection lyric alignment zalo ai challenge đề thi
  • Top