Viettel AI lần thứ 4 chiến thắng tại cuộc thi về xử lý tiếng nói tiếng Việt

Trường Thịnh

(Dân trí) - Tham gia cuộc thi Vietnamese Language and Speech Processing 2023, Viettel AI tiếp tục chứng minh năng lực dẫn đầu trong công nghệ xử lý tiếng nói khi giành giải nhất 2 hạng mục nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói; dịch máy Việt - Lào.

Cuộc thi Vietnamese Language and Speech Processing (VLSP) thuộc khuôn khổ hội thảo quốc tế thường niên về xử lý ngôn ngữ và tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức.

VLSP 2023 tổ chức 10 cuộc thi về xử lý tiếng nói và xử lý văn bản, quy tụ các nhà nghiên cứu, chuyên gia và đơn vị phát triển công nghệ hàng đầu. Đây là năm thứ 4 Viettel AI giành chiến thắng tại hạng mục nhận dạng tiếng nói - hạng mục luôn ghi nhận sự cạnh tranh khốc liệt giữa các đội thi đến từ các đơn vị lớn.

Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng của xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Năm nay, với điểm đổi mới trong cơ cấu các hạng mục của cuộc thi, các đội thi đã phải thực hiện cùng lúc hai bài toán về nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói.

Viettel AI không chỉ vượt qua thử thách này để giành giải nhất mà còn gây ấn tượng về điểm số vượt trội so với các đối thủ là 89,18% (các đội theo sau lần lượt là 83,4% và 78,45%).

Điểm then chốt dẫn đến kết quả vượt trội về độ chính xác này là bởi Viettel AI đã làm chủ công nghệ từ sớm. Thay vì sử dụng mô hình từ các kết quả nghiên cứu có sẵn, Viettel AI đã tự phát triển từ đầu một mô hình dành riêng cho xử lý tiếng nói tiếng Việt và liên tục cập nhật, tối ưu hiệu quả.

Kết hợp với việc thiết lập chu trình huấn luyện có thể xử lý toàn bộ dữ liệu ở các điều kiện chất lượng khác nhau, các kỹ sư đã thành công xây dựng mô hình nhận dạng được cả văn bản và cảm xúc của câu nói với độ chính xác cao, trong điều kiện dữ liệu hạn chế.

Viettel AI lần thứ 4 chiến thắng tại cuộc thi về xử lý tiếng nói tiếng Việt - 1

Các kỹ sư Khối Nền tảng trợ lý ảo, Viettel AI tham gia hạng mục nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói.

Công nghệ xử lý tiếng nói tiên tiến đã mang lại những hiệu quả đáng kể cho các sản phẩm của Viettel AI như hệ thống trợ lý ảo, tổng đài ảo có thể nhận dạng giọng nói chính xác đến 95% và nhận diện ý định của khách hàng chính xác lên tới 96%.

Kết quả nghiên cứu công nghệ về nhận diện tiếng nói và cảm xúc từ cuộc thi sẽ mở ra những ứng dụng mới trong việc chăm sóc khách hàng, khai thác thông tin từ các cuộc gọi tổng đài… Những cuộc gọi phàn nàn, tiêu cực từ khách hàng gọi lên tổng đài thường chiếm số ít trong các cuộc gọi mỗi ngày nhưng có ảnh hưởng lớn đến chất lượng dịch vụ. Thay vì tốn chi phí thuê người nghe lại và đánh dấu những cuộc gọi này như trước đây, tổng đài ảo Viettel Cyberbot sẽ có thể tự động nhận diện để xử lý các trường hợp khiếu nại của khách hàng ngay khi nhận cuộc gọi.

Năm 2023, cuộc thi thu hút sự cạnh tranh sôi nổi của các đội đến từ các trường đại học nổi tiếng như Đại học Stanford - Mỹ, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản và các đội đến từ các doanh nghiệp công nghệ hàng đầu như Viettel AI, VinBigData, FPT Smart Cloud, VCCorp, Bosch…

Đây là năm thứ 4 và năm thứ 3 liên tiếp Viettel AI giành chiến thắng tại cuộc thi VLSP, khẳng định quyết tâm tiên phong trong việc phát triển và ứng dụng các công nghệ xử lý tiếng nói tiên tiến nhất nhằm nâng cao chất lượng sản phẩm và dịch vụ.