Khát vọng của kỹ sư GenZ tại Zalo AI qua bài thuyết trình ở hội nghị khoa học Interspeech

(vfo.vn) Trở về Việt Nam sau bài thuyết trình trong Hội nghị khoa học thế giới Interspeech tại Hy Lạp, Lê Duy Khánh - kỹ sư AI trẻ của Zalo đã có những chia sẻ về trải nghiệm học tập đáng nhớ.
Hinh-anh-bai-viet-1.jpg
Lê Duy Khánh - kỹ sư AI trẻ tài năng của Zalo

Lê Duy Khánh là kỹ sư trẻ sinh năm 2000 đến từ Zalo AI. Dưới sự hướng dẫn của TS. Châu Thành Đức - Trưởng bộ phận Nghiên cứu và phát triển tại Zalo AI, Giảng viên trường ĐH Khoa học tự nhiên, ĐH Quốc gia TP.HCM, công trình nghiên cứu của Duy Khánh với đề tài "Improving Streaming Speech Recognition With Time-Shifted Contextual Attention And Dynamic Right Context Masking" (Tạm dịch: Cải thiện nhận dạng tiếng nói thời gian thực bằng cơ chế chú ý dịch chuyển theo thời gian và mặt nạ ngữ cảnh tương lai động) đã được chọn để công bố tại Hội nghị khoa học Interspeech - Hội thảo quốc tế lâu đời, toàn diện và uy tín hàng đầu về lĩnh vực Xử lý tiếng nói (Speech Processing), do Hiệp hội Giao tiếp tiếng nói Quốc tế (International Speech Communication Association) tổ chức.

Với chủ đề "Speech and beyond" (Tạm dịch: Tiếng nói và hơn thế nữa), hội nghị năm nay tập trung vào các phương thức tiếp cận đa dạng nhằm giải quyết các vấn đề liên quan đến khoa học, công nghệ về tiếng nói và ngôn ngữ của con người, từ lý thuyết đến ứng dụng thực tiễn.

Công trình Nghiên cứu của Duy Khánh và các đồng sự có đóng góp quan trọng giúp nâng cấp các mô hình nhận dạng tiếng nói và tăng độ chính xác của tính năng soạn tin nhắn bằng giọng nói (dictation) và tính năng chuyển tin nhắn thoại thành văn bản (voice-to-text) trên ứng dụng Zalo.​
Hinh-anh-bai-viet-2.jpg
Nâng cấp các mô hình nhận dạng tiếng nói giúp tăng độ chính xác của tính năng soạn tin nhắn bằng giọng nói (dictation) và chuyển tin nhắn thoại thành văn bản trên Zalo

Chàng kỹ sư trẻ Lê Duy Khánh đã dành tổng cộng 9 tháng để nghiên cứu, viết bài báo khoa học và ứng dụng vào thực tiễn. Để hoàn thành đề tài, chàng kỹ sư trẻ đã phải đối mặt với nhiều thách thức, vì huấn luyện mô hình nhận dạng tiếng nói đòi hỏi cấu hình phần cứng mạnh, đồng thời tiếng nói là dạng dữ liệu khó xử lý vì có thể gặp các trường hợp không rõ chữ, nói nhanh và thường trong môi trường thực tế nhiều tiếng ồn. Thông thường tỷ lệ thành công của các thí nghiệm chỉ khoảng 10% - nghĩa là trong 10 thí nghiệm chỉ có 1 thí nghiệm đạt được mục tiêu đề ra.

Về bài thuyết trình tại hội nghị Interspeech, Duy Khánh cho biết:

“Hội nghị diễn ra 5 ngày với khoảng 2.000 bài thuyết trình hội thảo của các kỹ sư, nhà nghiên cứu công nghệ và AI từ khắp nơi trên thế giới. Có 2 hình thức thuyết trình chính: thuyết trình miệng (oral presentation) và thuyết trình poster (poster presentation). Với việc thuyết trình miệng như tôi, mỗi người thuyết trình sẽ có khoảng 20 phút, bao gồm cả thời gian thuyết trình lẫn đặt câu hỏi, để giới thiệu công trình nghiên cứu của mình tới người xem. Với những người chọn thuyết trình poster, họ sẽ có khoảng 2 tiếng đứng cạnh poster của mình và giới thiệu nội dung trên poster tới người tham gia hội nghị...".

Việc tham gia hội nghị Interspeech mang đến cho Duy Khánh nhiều trải nghiệm ý nghĩa. Một trong những điều Duy Khánh tâm đắc nhất sau chuyến đi là niềm tin được củng cố về tầm quan trọng của nghiên cứu AI.​

Nguồn: Zalo (ZingVNG)

 
Sửa lần cuối bởi điều hành viên:
  • Chủ đề
    zalo ai
  • Thống kê

    Chủ đề
    101,573
    Bài viết
    468,818
    Thành viên
    340,143
    Thành viên mới nhất
    Miiu201
    Top