Mục lục:
- Bước 1: Nhận tài khoản API Google
- Bước 2: Nhập thông tin thanh toán
- Bước 3: Mở Thư viện API
- Bước 4: Tìm kiếm API Google Vision
- Bước 5: Điều hướng đến Thông tin đăng nhập
- Bước 6: Tạo khóa API Google Vision
- Bước 7: Thiết lập bên Raspberry Pi
- Bước 8: Thiết lập dự án
- Bước 9:
- Bước 10:
- Bước 11: Và nhiều hơn thế nữa…
2025 Tác giả: John Day | [email protected]. Sửa đổi lần cuối: 2025-01-23 15:15
Đây là hướng dẫn bắt đầu sử dụng API Google Vision. Nó sử dụng những thứ sau
- Raspberry Pi Zero W
- Arch Linux
- NodeJS
- kết nối Internet
Bạn không biết Arch Linux? Hoặc làm thế nào để thiết lập Raspberry Pi? Đừng lo lắng, tôi đã viết một loạt các bài báo đề cập đến vấn đề này khá nhanh chóng. Nó dễ thiết lập hơn bạn nghĩ rất nhiều. Vì vậy, đừng để nó làm mất lòng bạn.
- Cài đặt Arch Linux trên Raspberry Pi với quyền truy cập WiFi ngay lập tức
- Thiết lập i2c trên Raspberry Pi Zero W bằng Arch Linux
- Thiết lập không gian dự án NodeJS trên Raspberry Pi Zero W
- Chuyển mã trình điều khiển động cơ DRV8830 I2C sang NodeJS
- Chỉnh sửa mã Raspberry Pi từ xa từ mã Visual Studio
- Robot 1B1
Ảnh bìa của Andy Kelly trên Unsplash
Bước 1: Nhận tài khoản API Google
Đáng buồn thay, Google Vision API không phải là một dịch vụ hoàn toàn miễn phí. Tại thời điểm viết, tài khoản API cung cấp 1000 lệnh gọi API Google Vision miễn phí mỗi tháng. Sau đó, đó là $ 1,00 cho mỗi 1000 cuộc gọi.
Tôi biết, tôi biết, không quá tệ. Nhưng đây không phải là một dự án thương mại. Tôi muốn sử dụng nó cho một con bot nhỏ. Nếu vợ tôi nhận được hóa đơn 40 đô la vì tôi quyết định truyền hình ảnh lên API, thì đó sẽ là một con bot chết. Dù sao, tôi nghĩ tôi vẫn sẽ khám phá dịch vụ dành cho những người cười khúc khích.
Để có được một tài khoản, hãy truy cập
Bảng điều khiển Google
Và đăng nhập bằng tài khoản Google hiện có hoặc tạo một tài khoản.
Bước 2: Nhập thông tin thanh toán
Bây giờ, đây là phần đáng sợ, bạn phải nhập thông tin thanh toán của mình trước khi bắt đầu. Hãy nhớ rằng bạn sẽ bị tính phí nếu thực hiện hơn 1000 cuộc gọi. Một lần nữa, nếu bạn vượt quá 1.000 cuộc gọi miễn phí, bạn sẽ bị tính phí. (Cái gì? Tôi đã nói rồi mà? Ồ.)
Bước 3: Mở Thư viện API
Sau khi thiết lập thông tin thanh toán, chúng tôi vẫn cần bật API Cloud Vision. Đây là một tính năng bảo mật, về cơ bản, tất cả các API của Google đều bị vô hiệu hóa theo mặc định, vì vậy nếu ai đó vô tình có quyền truy cập, họ sẽ không phát hiện ra địa ngục ở khắp mọi nơi.
Bước 4: Tìm kiếm API Google Vision
Bây giờ tìm kiếm Vision và nhấp vào nút. Ở đây sẽ có một nút Bật sáng rõ. Nhấn nó.
Bước 5: Điều hướng đến Thông tin đăng nhập
Điều cuối cùng chúng ta cần làm là lấy khóa API. Điều này cần được bao gồm trong tiêu đề cuộc gọi API để xác thực.
Không để bất kỳ ai lấy khóa API của bạn. Và đừng mã hóa nó trong mã của bạn. Hãy tin tôi, điều này sẽ cắn bạn. Nếu điều này vô tình được đưa lên web, một trình thu thập thông tin web sẽ nhanh chóng tìm thấy nó và bạn sẽ phải trả rất nhiều đô la.
Hãy để bài viết này làm bạn sợ một chút.
Nhà phát triển đặt các khóa AWS trên Github
Vâng! Hãy bắt đầu lấy Khóa API của bạn. Tìm phần Thông tin xác thực
Bước 6: Tạo khóa API Google Vision
Bạn có thể sẽ không thấy bất kỳ thông tin đăng nhập nào được tạo, vì bạn có thể chưa tạo bất kỳ thông tin đăng nhập nào.
Hãy tạo một Khóa API mới. Tôi đặt tên khóa có ý nghĩa và giới hạn nó chỉ trong API đám mây của Google. Hãy tiếp tục và sao chép khóa API của bạn, vì chúng tôi sẽ cần nó trong bước tiếp theo.
Bước 7: Thiết lập bên Raspberry Pi
Các bài viết được liệt kê ở đầu bài viết này sẽ giúp bạn thiết lập Raspberry Pi cho bước này. Nhưng nếu bạn đang làm những điều khác biệt, hầu hết điều này vẫn sẽ hiệu quả với bạn. Tuy nhiên, khi chúng ta đi đến phần về các biến môi trường, điều đó sẽ khác đối với các phiên bản Linux khác.
Bắt đầu bằng cách SSH vào số Pi của bạn.
Và cập nhật tất cả các gói
sudo pacman -Syu
Chúng tôi sẽ tạo một biến môi trường cho API Google Cloud Vision. Điều này là để tránh mã hóa khóa API của bạn vào mã sâu hơn. Điều đó sẽ hiệu quả, nhưng tôi thực sự khuyên bạn nên gắn bó với tôi và thiết lập một trình quản lý biến môi trường để xử lý API.
Chuyển sang người dùng root bằng cách nhập
su
Nhập mật khẩu của bạn.
Điều tiếp theo chúng tôi làm là thêm Khóa API Google Vision của bạn làm biến môi trường cho
/ etc / profile
điều này sẽ khiến nó được phức tạp hóa khi khởi động.
Nhập, thay thế
YOUR_API_KEY
với Khóa API thực tế của bạn.
echo 'xuất GOOGLE_CLOUD_VISION_API_KEY = YOUR_API_KEY' >> / etc / profile
Bây giờ khởi động lại Pi để điều đó có hiệu lực.
khởi động lại sudo
Đăng nhập lại. Hãy kiểm tra để đảm bảo rằng nó đang tải khóa API.
echo $ GOOGLE_CLOUD_VISION_API_KEY
Nếu khóa API của bạn được gửi lại, bạn nên thực hiện.
Bước 8: Thiết lập dự án
Hãy tạo một thư mục dự án.
mkdir google-vis
cd google-vis
Bây giờ hãy khởi tạo một dự án Node mới.
npm init
Hãy tùy chỉnh các chi tiết gói nếu bạn muốn. Nếu bạn lười biếng như tôi, hãy nhấn enter cho đến khi bạn quay lại dấu nhắc lệnh.
Hãy thêm các thư viện Node cần thiết. Đó là một. Thư viện axios, cho phép các yêu cầu web không đồng bộ.
npm axios
Ngoài ra, hãy tạo một thư mục tài nguyên và tải xuống hình ảnh thử nghiệm đáng yêu của chúng tôi. À, cô Hepburn!
Đảm bảo rằng bạn đang ở trong
google-vis / resources
thư mục dự án khi tải xuống hình ảnh.
tài nguyên mkdir
Bước 9:
Tạo một tệp trong
go-vis
thư mục được gọi là
app.js
nano app.js
Sau đó, dán mã bên dưới và lưu tệp bằng cách gõ CTRL + O và thoát bằng CTRL + X.
//
const const axios = demand ('axios'); const fs = request ('fs');
const API_KEY = process.env. GOOGLE_CLOUD_VISION_API_KEY
if (! API_KEY) {
console.log ('Không cung cấp khóa API')}
function base64_encode (file) {
// đọc dữ liệu nhị phân var bitmap = fs.readFileSync (file); // chuyển đổi dữ liệu nhị phân thành chuỗi mã hóa base64 trả về Bộ đệm mới (bitmap).toString ('base64'); } var base64str = base64_encode ('./ resources / audrey.jpg');
const apiCall = `https://vision.googleapis.com/v1/images:annotate?key=$ {API_KEY}`;
const reqObj = {
yêu cầu: [{"image": {"content": base64str}, "features": [{"type": "LABEL_DETECTION", "maxResults": 5}, {"type": "FACE_DETECTION", "maxResults": 5}, {"type": "IMAGE_PROPERTIES", "maxResults": 5}]}]}
axios.post (apiCall, reqObj).then ((response) => {
console.log (phản hồi); console.log (JSON.stringify (response.data.responses, undefined, 4)); }). catch ((e) => {console.log (e.response);});
Mã này lấy biến môi trường khóa API và tạo một hằng số chương trình từ đó.
const API_KEY = process.env. GOOGLE_CLOUD_VISION_API_KEY
Đây là cách chúng tôi tránh mã hóa cứng khóa API.
Bước 10:
Hãy chạy chương trình.
node app.js
Nếu mọi việc suôn sẻ, bạn sẽ nhận được đầu ra tương tự như bên dưới
data: {response:
Bước 11: Và nhiều hơn thế nữa…
Bài viết này ngắn - một bước khởi đầu tốt. Tuy nhiên, có rất nhiều tiềm năng ở đây. Ví dụ: gửi hình ảnh của riêng bạn bằng Máy ảnh Raspberry Pi
- raspicam
- pi-camera
Vui lòng đặt bất kỳ câu hỏi nào liên quan đến cách sử dụng đầu ra.
Có các yêu cầu phát hiện tính năng khác.
API Google Vision - Các tính năng khác
Tuy nhiên, tôi sẽ kết thúc bài viết và chuyển sang giới thiệu các hệ thống phát hiện tầm nhìn. Ngay sau khi tôi tìm ra sự giảm dần độ dốc ngẫu nhiên.
Đề xuất:
Làm việc với API URL trong Node-RED: 10 bước
Làm việc với URL API trong Node-RED: Tài liệu hướng dẫn này sẽ dạy bạn cách sử dụng URL URL (http get) trong node-RED. Nó là đơn giản có chủ ý. Và nếu bạn chưa quen với node-RED thì ví dụ này phù hợp với bạn. Tôi sẽ dạy bạn cách sử dụng môi trường node-RED và là gì, và h
Nhận dạng giọng nói bằng cách sử dụng API giọng nói của Google và Python: 4 bước
Nhận dạng giọng nói bằng cách sử dụng API giọng nói của Google và Python: Nhận dạng giọng nói Nhận dạng giọng nói là một phần của Xử lý ngôn ngữ tự nhiên, một trường con của Trí tuệ nhân tạo. Nói một cách đơn giản, nhận dạng giọng nói là khả năng của một phần mềm máy tính để xác định các từ và cụm từ trong ngôn ngữ nói
Kiểm soát thiết bị gia dụng bằng Node MCU và Trợ lý Google - IOT - Blynk - IFTTT: 8 bước
Kiểm soát thiết bị gia dụng bằng Node MCU và Trợ lý Google | IOT | Blynk | IFTTT: Một dự án đơn giản để kiểm soát các thiết bị bằng Google Assistant: Cảnh báo: Xử lý nguồn điện Điện có thể nguy hiểm. Xử lý cẩn thận. Thuê một thợ điện chuyên nghiệp khi làm việc với các mạch hở. Tôi sẽ không chịu trách nhiệm về da
Tạo ứng dụng Android cho doanh nghiệp nhỏ bằng ứng dụng MIT và Google Fusion Table: 7 bước
Tạo ứng dụng Android cho doanh nghiệp nhỏ bằng ứng dụng MIT và Google Fusion Table: Bạn đã bao giờ muốn tạo Ứng dụng của riêng mình có thể có sẵn tại cửa hàng google play chưa !!! Nếu bạn đang kinh doanh thì hướng dẫn này sẽ thay đổi cuộc đời bạn. Sau khi đọc kỹ phần này, bạn sẽ có thể làm Đơn đăng ký của riêng mình. Befo
Node MCU với mô-đun chuyển tiếp 4 cổng, ứng dụng Blynk, IFTTT và Google Home. Lợi nhuận ?: 5 bước
Node MCU với mô-đun chuyển tiếp 4 cổng, ứng dụng Blynk, IFTTT và Google Home. Lợi nhuận ?: Bài đăng này là tất cả về cách kết nối google home với NodeMCU và ứng dụng blynk, bạn có thể điều khiển các thiết bị của mình bằng công tắc NodeMCU được điều khiển bằng blynk và trợ lý google