Đề tài

Thiết kế chip nhận dạng tiếng nói tiếng Việt trên nền công nghệ FPGA (KC.01.TN15/11-15)

(KHCN)- Ngày 23/03/2013 tại TP. Hồ Chí Minh, Ban chủ nhiệm Chương trình KC.01/11-15 phối hợp với Văn phòng các Chương trình trọng điểm cấp Nhà nước tổ chức nghiệm thu cấp nhà nước đề tài KH&CN tiềm năng "Thiết kế chip nhận dạng tiếng nói tiếng Việt trên nền công nghệ FPGA" (Mã số: KC.01.TN15) do TS. Hoàng Trang - Trường Đại học Bách khoa TP. Hồ Chí Minh làm chủ nhiệm đề tài.

1. Chủ nhiệm đề tài: Hoàng Trang

2. Cơ quan chủ trì theo hồ sơ: Trường Đại học Bách khoa TP. Hồ Chí Minh

3. Cơ quan chủ trì hiện tại: Trường Đại học Bách khoa TP. Hồ Chí Minh

4. Cơ quan phối hợp thực hiện:

5. Mục tiêu thực hiện:

- Mục tiêu tổng quát:
+ Mục tiêu tổng quát của đề tài này là nghiên cứu, thiết kế IC nhận dạng tiếng nói tiếng Việt với tập tiếng nhận dạng là 20 tiếng, trên nền công nghệ FPGA dựa trên việc trích đặc trưng MFCC và bộ nhận dạng dùng mô hình Markov ẩn (HMM) với nhiều cải tiến mới. Lý do chọn phương pháp tiếp cận này được trình bày trong mục 10.2. Đề tài sẽ được kiểm nghiệm trên FPGA của Altera. Số lượng tiếng được nhận dạng là 20 tiếng. Các tiếng tùy thuộc vào dữ liệu huấn luyện và có thể thay đổi dễ dàng.
+ Đào tạo đội ngũ nghiên cứu, góp phần nâng cao chất lượng nghiên cứu-giảng dạy trong lĩnh vực thiết kế chip và nhận dạng giọng nói tiếng Việt (là 2 hướng công nghệ cao số 1 và số 3 trong quyết định 49/2010/QĐ-TTg ngày 19 tháng 7 năm 2010 của Thủ Tướng Chính Phủ phê duyệt danh sách 46 công nghệ cao được ưu tiên đầu tư phát triển)
- Mục tiêu cụ thể:
+ Thiết kế được IC nhận dạng tiếng nói tiếng Việt, gồm 20 tiếng đơn. Khả năng nhận dạng 20 tiếng nói. Khi cần thiết, có thể thay đổi dễ dàng tập 20 tiếng nói khác. Thể hiện thiết kế của đề tài là nhận dạng 20 tiếng nói sau: “không”, “một”, “hai”, “ba”, “bốn”, “năm”, “sáu”, “bảy”, “tám”, “chín”, “trái”, “phải”, “trên”, “dưới”, “tới”, “lui”, “chạy”, “dừng”, “gọi”, “đứng”. Kết quả nhận dạng hiển thị trên LCD. Mô hình có tính dễ dàng phát triển được về sau khi ứng dụng trong thực tế, tùy theo yêu cầu thị trường.
+ Độ chính xác nhận dạng (trong môi trường ít nhiễu, cùng điều kiện nhiễu với khi xây dựng thiết kế và huấn luyện) là tối thiểu 80%. Đánh giá độ chính xác nhận dạng qua mô hình kiểm tra bằng phần mềm, số lần thử nghiệm là đủ lớn (ít nhất 200 lần thử nghiệm).
+ Đào tạo 1 thạc sĩ, 2 kỹ sư.

6. Các sản phẩm chính:
1. Mẫu thiết kế, thử nghiệm trên FPGA nhận dạng tiếng nói tiếng Việt.
2. Báo cáo phân tích về thiết kế IC nhận dạng tiếng nói tiếng Việt.

7. Thời gian thực hiện: 01/01/2012 - 01/12/2012

8. Đánh giá
    Hội đồng nghiệm thu đề nghị Bộ KH&CN xem xét, công nhận kết quả đánh giá đề tài và kiến nghị đề tài được tiếp tục phát triển ở quy mô lớn hơn.
   Kết quả đánh giá: điểm trung bình: 84; xếp loại: Xuất sắc.

TH

Thông tin website

Chuyên trang Bản tin khoa học công nghệ.
Thực hiện : Phòng Khoa học - Công nghệ, Trung Tâm CNTT, BộVăn hoá,Thể thao & Du lịch.
Người chịu trách nhiệm chính: Nguyễn Thanh Liêm - Giám đốc.

Địa chỉ: Ngõ 2 số 20, Vân Hồ, Hoa Lư, Hà Nội;
Tel: 0243 9745845
Email: khoahoccongnghe@cinet.gov.vn
Ghi rõ nguồn khi phát lại thông tin từ website này.

Liên hệ Tòa soạn