Speech to text là một công nghệ giúp máy tính nhận dạng âm thanh của tiếng nói người và tạo ra chuỗi văn bản tương ứng. Với giải pháp này, bạn chỉ cần nói, hệ thống sẽ tự động chuyển đổi sang văn bản. Hơn thế, phần mềm còn hỗ trợ chuyển đổi giọng nói ở khoảng cách xa với độ chính xác cao, vì thế giải pháp được ứng dụng trong rất nhiều lĩnh vực, từ cơ quan nhà nước, doanh nghiệp, đến phóng viên, học sinh, sinh viên – những người có nhu cầu ghi chép và soạn thảo lớn..
Giải pháp chuyển đổi giọng nói sang văn bản gồm các thành phần chính sau:
- Hệ thống xử lý lọc nhiễu âm thanh, tạp âm
+ Thực hiện chức năng tiền xử lý, lọc nhiễu tạp âm, giảm tiếng vang, tiếng ồn…trong các tệp tin audio file trước khi đưa vào hệ thống xử lý và chuyển đổi giọng nói thành văn bản để tăng cường khả năng nhận diện.
+ Giao diện đồ họa và các mô đun lọc kéo thả, có thể kết hợp nhiều mô đun với nhau.
+ Có thể chỉnh sửa và lưu lại file âm thanh sau khi chỉnh sửa.
+ Xử lý được nhiều loại tạp âm, méo tiếng khác nhau
+ Xử lý ở chế độ thời gian thực
- Hệ thống xử lý và chuyển đổi giọng nói thành văn bản.
+ Hệ thống hỗ trợ các các tệp tin âm thanh (audio) và phim ảnh (video). Đặc biệt, giải pháp còn hỗ trợ chuyển đổi các dạng âm thanh thu trực tiếp và cho ra kết quả ngay lập tức.
+ Hỗ trợ tiếng Việt với cả giọng chuẩn và các giọng vùng miền.
+ Hỗ trợ các ngôn ngữ tiếng nước ngoài, kể cả các ngôn ngữ tượng hình (tiếng Trung, tiếng Nhật, tiếng Hàn) hoặc các ngôn ngữ khó (tiếng Ả Rập).
+ Áp dụng công nghệ trí tuệ nhân tạo, học máy tiên tiến nhất hiện nay
+ Áp dụng giải thuật xử lý dữ liệu lớn BigData để tăng tốc độ xử lý, làm giàu và khai phá dữ liệu
+ Hỗ trợ xử lý các âm thanh, phim ảnh thu trực tiếp: thu và thực hiện chuyển đổi gần như theo thời gian thực.