Mục lục:
- Bước 1: Giới thiệu
- Bước 2: Tài nguyên được sử dụng
- Bước 3:
- Bước 4: Điều kiện tiên quyết
- Bước 5: Yêu cầu máy tính
- Bước 6: Thiết lập YOLO
- Bước 7: Sửa đổi MakeFile
- Bước 8: Chờ nó hoàn thành
- Bước 9: Đối với máy tính không phù hợp với yêu cầu
- Bước 10: YOLO V3
- Bước 11: Chạy YOLO
- Bước 12: YOLO V3 - Hình ảnh
- Bước 13: YOLO V3 - Hình ảnh đầu vào
- Bước 14: YOLO V3 - Hình ảnh đầu ra
- Bước 15: YOLO V3 - Nhiều hình ảnh
- Bước 16: YOLO V3 - WebCam
- Bước 17: YOLO V3 - Video
- Bước 18: YOLO V3 - EXPO3D Video 1
- Bước 19: YOLO V3 - Video EXPO3D 2
- Bước 20: YOLO V3 - Video EXPO3D 3
- Bước 21: PDF để tải xuống
2025 Tác giả: John Day | [email protected]. Sửa đổi lần cuối: 2025-01-13 06:58
Đây là môn học mà tôi mê mẩn đến mức khiến tôi mất ăn mất ngủ: Thị giác máy tính, phát hiện đồ vật và con người thông qua một mô hình được đào tạo trước.
Bước 1: Giới thiệu
Chúng tôi sẽ sử dụng thuật toán YoloV3, để chạy một ứng dụng và chạy dự án.
Tôi đã làm việc với mạng nơ-ron cách đây 15 năm và tôi có thể nói rằng đó là những thời điểm “khó khăn”, với các nguồn lực sẵn có vào thời điểm đó.
Bước 2: Tài nguyên được sử dụng
· Máy ảnh Logitech C270
· Máy vi tính
· NVIDIA GeForce GTX 1660
Bước 3:
Bước 4: Điều kiện tiên quyết
Để chạy mạng thần kinh sâu (DNN), cần sử dụng tính toán song song với GPU.
Vì vậy, bạn sẽ cần một card màn hình mạnh mẽ từ NVIDIA và chạy thuật toán bằng API CUDA (tập lệnh ảo GPU).
Để chạy thuật toán, trước tiên bạn phải cài đặt các gói sau:
- Ổ đĩa thẻ video NVIDIA
- CUDA
- CUDNN (Thư viện mạng thần kinh sâu CUDA)
- OpenCV
Bước 5: Yêu cầu máy tính
Bước 6: Thiết lập YOLO
Phát hiện bằng cách sử dụng mô hình được đào tạo trước
Mở thiết bị đầu cuối và nhập các lệnh trên.
Bước 7: Sửa đổi MakeFile
Sửa đổi tệp “MakeFile” như trong hình trên, vì chúng tôi sẽ sử dụng xử lý GPU, CUDNN và OpenCV. Sau khi sửa đổi, hãy chạy lệnh ‘make’.
Bước 8: Chờ nó hoàn thành
Lệnh 'make' trong Bước 7 sẽ biên dịch mọi thứ để các thuật toán sử dụng và phải mất một lúc để chạy.
Bước 9: Đối với máy tính không phù hợp với yêu cầu
Nếu máy tính và thẻ video của bạn không mạnh hoặc bạn muốn hiệu suất tốt hơn, hãy thay đổi tệp 'cfg /yolov3.cfg'.
Cấu hình trên đã được sử dụng trong dự án này.
Bước 10: YOLO V3
Các hệ thống phát hiện thường áp dụng mô hình cho một hình ảnh ở một số vị trí và tỷ lệ khác nhau.
YOLO áp dụng một mạng nơ-ron duy nhất cho toàn bộ hình ảnh. Mạng này chia hình ảnh thành các vùng và cung cấp các hộp giới hạn và xác suất cho từng vùng.
YOLO có một số lợi thế. Nó nhìn thấy toàn bộ hình ảnh, vì vậy các dự đoán của nó được tạo ra bởi bối cảnh chung trong hình ảnh.
Nó đưa ra dự đoán với một đánh giá mạng duy nhất, không giống như R-CNN đưa ra hàng nghìn đánh giá cho một hình ảnh duy nhất.
Nó nhanh hơn tới 1000 lần so với R-CNN và nhanh hơn 100 lần so với Fast R-CNN.
Bước 11: Chạy YOLO
Để chạy YOLO, chỉ cần mở terminal trong thư mục “darknet” và nhập lệnh.
Bạn có thể chạy YOLO theo 4 cách:
· Hình ảnh
· Nhiều hình ảnh
· Truyền trực tuyến (Webcam)
· Băng hình
Bước 12: YOLO V3 - Hình ảnh
Đặt hình ảnh bạn muốn vào thư mục “dữ liệu” bên trong darknet và sau đó chạy lệnh trên để sửa đổi tên hình ảnh.
Bước 13: YOLO V3 - Hình ảnh đầu vào
Bước 14: YOLO V3 - Hình ảnh đầu ra
Bước 15: YOLO V3 - Nhiều hình ảnh
Đặt hình ảnh vào một số thư mục và thay vì cung cấp đường dẫn hình ảnh, hãy để trống và chạy lệnh như bạn có thể thấy ở trên (ở bên trái).
Sau đó, một cái gì đó giống như hình bên phải sẽ xuất hiện, chỉ cần đặt đường dẫn hình ảnh và nhấp vào “enter” và lặp lại các bước này cho một số hình ảnh.
Bước 16: YOLO V3 - WebCam
Chạy lệnh trên và sau khi tải mạng, webcam sẽ hiện ra.
Bước 17: YOLO V3 - Video
Đặt video bạn muốn vào thư mục “dữ liệu” bên trong darknet và sau đó chạy lệnh trên để sửa đổi tên video.
Bước 18: YOLO V3 - EXPO3D Video 1
Bước 19: YOLO V3 - Video EXPO3D 2
Bước 20: YOLO V3 - Video EXPO3D 3
Bước 21: PDF để tải xuống
TẢI XUỐNG PDF (Bằng tiếng Bồ Đào Nha Braxin)