(KHCN)-Các nhà khoa học thuộc Viện Công nghệ thông tin (Viện Hàn lâm Khoa học và Công nghệ Việt Nam) đã nghiên cứu, làm chủ công nghệ dịch tiếng nói cho ngôn ngữ Việt – Anh và xây dựng thành công hệ thống dịch tiếng nói hai chiều Anh - Việt, Việt - Anh cho lĩnh vực hội thoại.
Chủ nhiệm đề tài: PGS.TS. Lương Chi Mai. Cơ quản chủ trì: Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Cơ quan phối hợp chính: Khoa Công nghệ thông tin, Đại học Công nghệ, ĐHQG Hà nội; AI Lab, Trường Đại học Khoa học Tự nhiên, ĐHQG TP. HCM
Mục tiêu chính của đề tài là làm chủ công nghệ nền cho dịch tiếng nói, tập trung cho cặp ngôn ngữ Việt–Anh, Anh– Việt và có khả năng mở rộng cho nhiều cặp ngôn ngữ khác. Xây dựng được một hệ thống dịch tiếng nói 2 chiều Anh–Việt, Việt–Anh cho một lĩnh vực cụ thể. Lĩnh vực cụ thể được lựa chọn ở đây là Hội thoại (giao tiếp, du lịch). Đây là chủ đề được thế giới quan tâm và có giá trị sử dụng cao, phù hợp với nhu cầu giao tiếp quốc tế, hạn chế rào cản ngôn ngữ, dễ dàng phát triển mở rộng cho các cặp ngôn ngữ khác. Ngoài ra, từng engines cụ thể sau khi phát triển có thể đứng độc lập và dễ dàng tích hợp cho các ứng dụng khác.
Sản phẩm đã đạt được:
Sản phẩm dạng 1:
Hệ thống dịch tiếng nói hai chiều Việt –Anh, Anh – Việt định hướng ứng dụng cho lĩnh vực Hội thoại (giao tiếp, du lịch).
- Hệ thống phần mềm được cài đặt trên dòng thiết bị điện thoại di động có cài đặt Hệ điều hành Android
- Môi trường cài đặt sản phẩm: khách/chủ (client/server) có kết nối Internet.
- Môi trường giao tiếp:
+ Khách ở trên đường, trong khách sạn,… mục tiêu giao tiếp để nhận được thông tin hữu ích, nên khách tránh những địa điểm quá ồn – đó chính là thực tế .
+ Giao tiếp cơ sở: chào hỏi, câu hỏi, một số mục đích hỏi nhất định
+ Gặp khó khăn: hành lý, trợ giúp y tế, lạc đường...
+ Mua bán: giá cả, chất lượng hàng hóa, gói hàng,
+ Di chuyển (sân bay, nhà ga): mua vé, thuê xe, hỏi đường, khó khăn...
+ Khách sạn: đặt hoặc thay đổi đặt chỗ, check-in, khó khăn, yêu cầu dịch vụ khách sạn...
+ Tham quan: địa điểm du lịch nổi tiếng, đường đi...
+ Thời tiết, khí hậu
+ Nhà hàng: ăn uống, các món ăn, đặt chỗ...
+ Đổi tiền (exchange)
- Khả năng mở rộng trên các thiết bị ứng dụng và các cặp ngôn ngữ khác: Hệ thống được thiết kế để có thể chuyển đổi dễ dàng như chạy trên các thiết bị di động dùng Hệ điều hành khác như Linux, iOS. Hệ thống có khả năng chuyển đổi sang các cặp ngôn ngữ khác như Việt – Nhật, Nhật – Việt, Việt – Trung, Trung – Việt...
Sản phẩm bài báo, sách: Số lượng công trình công bố: 12 bài gồm 04 bài tạp chí, trong đó có 2 bài trong tạp chí SCIE, 08 bài Hội nghị Quốc tế. Hai bài trên tạp chí SCIE gồm Trung-Nghia PHUNG, Thanh-Son PHAN, Thang TAT VU, Mai CHI LUONG, and Masato AKAGI, “Improving naturalness of HMM-based TTS trained with limited data by Temporal Decomposition”, IEICE Transactions on Information and Systems, Vol. E96-D, No.11, Nov. 2013; Sakriani Sakti, Michael Paul, Andrew Finch, Shinsuke Sakai, Thang Tat Vu, Noriyuki Kimura, Chiori Hori, Eiichiro Sumita, Satoshi Nakamura, Jun Park, Chai Wutiwiwatchai, Bo Xu, Hammam Riza, Karunesh Arora, Chi Mai Luong, Haizhou Li, “A-STAR: Toward translating Asian spoken language”, Computer Speech and Language”, ELSEVIER, Vol.27, Issue 2, February 2013, ISSN:0885-2303; pp 509-527.
TH