Mục lục:

Thêm Trigger Start Sound vào Google AIY Voice Kit: 6 bước (có Hình ảnh)
Thêm Trigger Start Sound vào Google AIY Voice Kit: 6 bước (có Hình ảnh)

Video: Thêm Trigger Start Sound vào Google AIY Voice Kit: 6 bước (có Hình ảnh)

Video: Thêm Trigger Start Sound vào Google AIY Voice Kit: 6 bước (có Hình ảnh)
Video: MÌnh đã làm VIDEO dùng AI "FREEEE" - KIẾM TIỀN ONLINE từ CÔNG NGHỆ 2023 2024, Tháng mười một
Anonim
Image
Image
Bước 2: Kiểm tra tệp Voicehat.py để biết thêm thông tin
Bước 2: Kiểm tra tệp Voicehat.py để biết thêm thông tin

Hướng dẫn này khá đơn giản. Tôi thực sự rất thích Google AIY Voice Kit, nhưng thực sự giống như trên Google Home bình thường của tôi, tiếng ồn mà chúng tạo ra để xác nhận rằng chúng đang tích cực lắng nghe. Điều này không được thiết lập theo mặc định trong bất kỳ ví dụ nào được tải sẵn trên hình ảnh AIY Voice Kit.

Tôi cũng bao gồm một liên kết đến các tiếng ồn Bắt đầu và Xác nhận chứng khoán mà tôi đã ghi lại từ Google Home thực tế bằng máy ghi Zoom của tôi.

Đây là hướng dẫn đầu tiên của tôi!

Bước 1: Vật liệu & tệp cần thiết

  1. Google AIY Voice Kit đầy đủ chức năng-để thiết lập bộ công cụ của bạn, hãy truy cập trang AIY Voice Kit chính thức.
  2. Khả năng truy cập thiết bị đầu cuối Pi của bạn qua SSH, VNC hoặc bằng màn hình và bàn phím
  3. Tệp. Wav mà bạn muốn phát khi Pi đang nghe để nhập liệu bằng giọng nói-Nếu không sử dụng tệp tùy chỉnh, hãy tải tệp "St art Talking" tiêu chuẩn tại đây hoặc tải xuống từ liên kết đính kèm.
  4. (Tùy chọn) Trình chỉnh sửa âm thanh có thể chuyển đổi tệp và thay đổi tốc độ bit và mẫu của chúng

Bước 2: Bước 2: Kiểm tra tệp Voicehat.py để biết thêm thông tin

QUAN TRỌNG

Tôi không sử dụng hình ảnh mới nhất trên bộ giọng nói của mình, bao gồm mã cho cả bộ giọng nói và thị giác (tức là aiyprojects-2018-01-03.img). Tôi đang sử dụng mã từ nhánh Bộ công cụ thoại có thể tìm thấy trên Google AIY Raspbian GitHub. Ý kiến cá nhân của tôi là chỉ sử dụng nhánh Bộ giọng nói cho đơn giản và không cần phải xử lý mã Vision khi bạn đang làm việc với bộ giọng nói của mình

Tiếp tục…

Bước này không hoàn toàn bắt buộc, nhưng nó sẽ cho bạn biết nơi Google đã chôn cất các hướng dẫn để làm cho điều này hoạt động nếu bạn muốn thực hiện thêm một bước hoặc hiểu tại sao mã mà tôi đang thêm hoạt động.

pi @ raspberry: cd AIY-voice-kit-python / src / aiy /

Sau đó, chúng tôi sẽ kiểm tra tệp voicehat.py trong thư mục đó:

pi @ raspberry: ~ / AIY-voice-kit-python / src / aiy / sudo nano voicehat.py

Hình ảnh đính kèm cho thấy nơi bạn có thể tìm hiểu về Giao diện người dùng trạng thái và cách sử dụng âm thanh trong khi kích hoạt.

Được rồi, bây giờ hãy thêm một số mã vào một trong các tệp ví dụ để làm cho thứ này hoạt động.

Bước 3: Bước 3: Thêm mã âm thanh kích hoạt vào mã demo

Bước 3: Thêm mã âm thanh kích hoạt vào mã demo
Bước 3: Thêm mã âm thanh kích hoạt vào mã demo

Đầu tiên, điều hướng đến thư mục AIY-voice-kit-python và chạy mã nguồn

cd AIY-voice-kit-python

nguồn env / bin / kích hoạt

cd src

Sau đó, sử dụng 'sudo nano' vào 'Assistant_grpc_demo.py' hoặc 'Assistant_library_demo.py'

Sự khác biệt giữa hai tệp là Assistant_grpc_demo.py sử dụng nút để kích hoạt Trợ lý Google và Assistant_library_demo.py sử dụng từ kích hoạt "Ok, Google" để kích hoạt Trợ lý Google.

Đối với cả hai tệp này, bạn chỉ cần thêm MỘT dòng mã:

status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav')

Điều này giả sử bạn đã đặt âm thanh bắt đầu của mình trong thư mục / home / pi / và đặt tên là googlestart.wav. Thay đổi những điều này dựa trên bất cứ điều gì bạn đặt tên tệp của mình và bất cứ nơi nào bạn đặt nó.

Dòng mã chúng tôi đang tìm kiếm dưới đây:

status_ui.status ('đang nghe')

Chúng tôi muốn thêm dòng mã mới của mình TRƯỚC dòng mã đó…

Đối với ví dụ 'Assistant_library_demo.py', bạn có thể tìm thấy nó ở đây:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# Và bây giờ hãy thêm mã status_ui.set_trigger_sound_wave ('home / pi / googlestart.wav') status_ui.status ('đang nghe') của chúng tôi

Đối với ví dụ 'Assistant_grpc_demo.py', bạn có thể tìm thấy nó ở đây:

button.wait_for_press ()

# Và bây giờ hãy thêm mã status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav') status_ui.status ('đang nghe') của chúng tôi

Điều này giả sử bạn đã đặt âm thanh bắt đầu của mình trong thư mục / home / pi / và đặt tên là googlestart.wav. Thay đổi những điều này dựa trên bất cứ điều gì bạn đặt tên tệp của mình và bất cứ nơi nào bạn đặt nó.

Nhấn CTRL-X & Y để lưu mọi thứ.

*** LƯU Ý: Tôi đã tìm thấy một cái gì đó hơi ngốc nghếch. Đối với 'Assistant_library_demo.py', việc thêm âm thanh kích hoạt dường như không tạo ra bất kỳ sự khác biệt nào trong chức năng nhận dạng giọng nói. Tuy nhiên, đối với 'Assistant_grpc_demo.py', có vẻ như khi bạn triển khai âm thanh kích hoạt, nó sẽ cắt bỏ một hoặc hai từ đầu tiên mà bạn nói. Không hoàn toàn chắc chắn tại sao. Vẫn đang cố để giải quyết.

Bước 4: Bước 4: Chạy mã và chắc chắn rằng mọi thứ vẫn tốt để tiếp tục

pi @ raspberry: cd AIY-voice-kit-python

và tải lên virtualenv

pi @ raspberry: ~ / AIY-voice-kit-python $ source env / bin / active

và chạy nó!

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / Assistant_library_demo.py

hoặc

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / Assistant_grpc_demo.py

Bây giờ hãy nói "Ok, Google" hoặc Nhấn nút đó và xem nó có hoạt động không!

Trang tiếp theo sẽ giúp bạn nếu bạn có tệp tùy chỉnh của riêng mình và tốc độ bit và mẫu thích hợp cho tệp.wav của bạn

Bước 5: Bước 5: Tạo tệp.wav của riêng bạn

Bước 5: Tạo tệp.wav của riêng bạn
Bước 5: Tạo tệp.wav của riêng bạn

Nếu bạn không quan tâm đến việc sử dụng tệp.wav của tôi về âm thanh khởi động Google Home chuẩn, bạn sẽ cần tạo tệp.wav của riêng mình. Phải mất một chút thử và sai để có được bit và tỷ lệ mẫu chính xác phù hợp với tôi.

Tôi đã sử dụng Logic Pro X để thực hiện tất cả các chỉnh sửa của mình (trong hình), đây là một DAW chính thức để tạo và sản xuất âm nhạc. Hai tùy chọn tôi thấy có thể phù hợp là Switch hoặc MediaHuman Audio Converter. Tôi cho rằng bạn có thể làm điều này với Garageband nếu bạn có máy Mac, nhưng tôi chưa thử.

Có ba phần chính trong tệp của bạn cần thiết để tệp hoạt động với mã demo.

  1. Phải là tệp âm thanh MONO
  2. Tỷ lệ mẫu phải là 32000
  3. Phải là tệp.wav
  4. (Tùy chọn) Độ phân giải 16 bit phù hợp nhất với tôi

Bước 6: Bước 6: Thêm âm thanh xác nhận?

Đây là nơi tôi đang mắc kẹt nếu bất kỳ ai có bất kỳ suy nghĩ. Tôi muốn thêm tiếng ồn xác nhận nếu hệ thống nhận dạng được đầu vào bằng giọng nói như trên Google Home bình thường.

Mình có kèm theo nhiễu Xác nhận chứng khoán bên dưới để các bạn tiện theo dõi.

Thưởng thức!

Đề xuất: