Mục lục:
2025 Tác giả: John Day | [email protected]. Sửa đổi lần cuối: 2025-01-13 06:58
Đối với khóa học TfCD của IPD Master tại TU Delft.
Đây là hướng dẫn về cách tạo hệ thống nhận dạng giọng nói. Chúng tôi giải thích những điều cơ bản và cách thiết lập dự án này với sự trợ giúp của Arduino và BitVoicer. Sau khi hoàn thành những điều cơ bản, chúng tôi tin rằng bạn có thể sử dụng hệ thống này theo ý thích của mình.
Bước 1: Chuẩn bị đầu ra: Arduino và hộp của bạn
Bạn cần Arduino của mình, một số dây và đèn LED (ba cái sẽ làm được). Chúng tôi đã nối đèn LED vào chân 3, 5 và 6 (tất cả các chân PWM, mặc dù chúng tôi không sử dụng chúng). Hãy nhớ rằng, đối với hướng dẫn này, chúng tôi tập trung vào phương thức nhập: nhận dạng giọng nói. Do đó, chúng tôi không tập trung vào đầu ra của hệ thống này và giữ nó khá đơn giản.
Để chứng minh việc sử dụng công nghệ này, chúng tôi đã làm một chiếc hộp trong đó chúng tôi đặt các vòng bi in 3D để cấy ghép đầu gối. Ý tưởng là bạn có rất nhiều mặt hàng khác nhau và bạn cần phải tìm đúng thứ. Chúng tôi chọn để chứng minh điều này bằng một vật thể nhỏ, vừa và lớn tượng trưng cho ổ đỡ cho việc cấy ghép đầu gối. Để làm cho mọi thứ rõ ràng hơn, chúng tôi quyết định sử dụng đèn LED màu xanh lá cây cho kích thước nhỏ, đèn LED màu vàng cho kích thước trung bình và màu đỏ cho kích thước lớn.
Bước 2: Thiết lập BitVoicer
Điều đầu tiên bạn muốn làm là kích hoạt sản phẩm của bạn dưới phần trợ giúp> kích hoạt. Điều này cho phép bạn gửi dữ liệu từ Bitvoicer đến bộ vi điều khiển (Arduino) của bạn.
Tiếp theo, bạn muốn thiết lập Bitvoicer để nó thực sự sử dụng Arduino để định cấu hình đầu ra của nó. Đi tới tệp> tùy chọn. Ở đây bạn thấy một số tùy chọn:
Đừng bận tâm đến đoạn đầu tiên. Đó là những tùy chọn hiển nhiên, cho phép bạn mở và khởi động hệ thống nhận dạng giọng nói ngay khi máy tính của bạn khởi động. Sau đó, bạn có thể cân nhắc điều này bằng cách sử dụng Raspberry Pi và tạo một hệ thống độc lập.
Tiếp theo, bạn thấy tùy chọn sau:
Ngôn ngữ nhận dạng giọng nói: xác định ngôn ngữ mà BitVoicer sẽ nhận dạng, Mức độ tin cậy có thể chấp nhận được: Hãy lưu ý rằng nhận dạng giọng nói 'dự đoán' những gì đã được nói. Nó có thể không bao giờ đạt 100%, nhưng 40% có thể đã đủ để hoạt động hiệu quả. Điều này phụ thuộc vào giọng của người dùng, âm lượng của giọng nói hoặc micrô. Chúng ta sẽ quay lại vấn đề này sau.
Mức âm thanh tối thiểu: Mức âm thanh tối thiểu mà máy tính phải nghe
Khoảng thời gian kích hoạt mức âm thanh (mili giây): khoảng thời gian mà nó có thể nghe sau khi đạt đến mức âm thanh tối thiểu
Khoảng thời gian chờ: Độ trễ giữa lệnh thoại và đầu ra của bạn.
Trong đoạn tiếp theo, bạn nên bỏ chọn vô hiệu hóa giao tiếp. Điều này cho phép Bitvoicer giao tiếp với Arduino. Các cài đặt sau là Tên cổng, Bit trên giây, chẵn lẻ, bit dừng, điều khiển luồng. Đặt Tên cổng thành cổng nối tiếp bên phải (cái này được đặt tên là COMX với X là một số, bạn có thể tìm thấy nó trong phần trợ giúp> cổng trong Arduino). Đảm bảo Bit / giây của bạn là 9600. Bạn có thể để các tùy chọn khác làm mặc định.
Đối với đoạn tiếp theo, chúng ta sẽ sử dụng micrô của máy tính.
Bây giờ bạn đã sẵn sàng để chơi với Bitvoicer.
Bước 3: Sử dụng Bitvoicer
Trong video này, chúng tôi giải thích cách sử dụng Bitvoicer.
Bước 4: Mã Arduino
Chúng tôi đã sử dụng một mã nguồn khác và đơn giản hóa nó để sử dụng nó. Bạn có thể tìm thấy phiên bản đơn giản với hướng dẫn trong mã Arduino Đính kèm. (Bạn có thể xem nguồn tại đây
Đó là nó! Bây giờ bạn có thể sử dụng lệnh thoại làm đầu vào và quyết định đầu ra bạn muốn trong mã arduino.
www.youtube.com/watch?v=u8QUKTFdQgU