Cách phát hiện bệnh hại cây trồng bằng máy học: 6 bước
Cách phát hiện bệnh hại cây trồng bằng máy học: 6 bước
Anonim
Cách phát hiện bệnh hại cây trồng bằng máy học
Cách phát hiện bệnh hại cây trồng bằng máy học

Quá trình phát hiện và nhận biết cây bị bệnh luôn là một quá trình thủ công và tẻ nhạt, đòi hỏi con người phải kiểm tra bằng mắt thường trên cơ thể thực vật, điều này có thể dẫn đến chẩn đoán không chính xác. Người ta cũng dự đoán rằng khi các hình thái thời tiết toàn cầu bắt đầu thay đổi do biến đổi khí hậu, các dịch bệnh trên cây trồng có khả năng trở nên trầm trọng hơn và lan rộng hơn. Do đó, điều quan trọng là phải phát triển các hệ thống phân tích cây trồng nhanh chóng và dễ dàng và xác định một loại bệnh cụ thể để hạn chế thiệt hại về cây trồng.

Trong tài liệu hướng dẫn này, chúng ta sẽ khám phá một khái niệm máy học được gọi là "Học chuyển giao" để phân loại ảnh của cây lúa bị bệnh. Phương pháp tương tự có thể được sử dụng lại cho bất kỳ bài toán phân loại ảnh nào khác.

Bước 1: Các loại bệnh hại lúa

Các loại bệnh hại lúa
Các loại bệnh hại lúa

Lúa là một trong những loại cây lương thực phổ biến được trồng chủ yếu trên khắp châu Á, châu Phi và Nam Mỹ nhưng rất dễ bị nhiễm nhiều loại sâu bệnh. Các đặc điểm vật lý như sự khử màu của lá có thể được sử dụng để xác định một số bệnh có thể ảnh hưởng đến cây lúa. Ví dụ, đối với bệnh đốm nâu, một loại bệnh nấm ảnh hưởng đến lớp vỏ bảo vệ của lá, lá bị bao phủ bởi một số đốm nâu hình bầu dục nhỏ với tâm màu xám trong khi đối với bệnh đạo ôn, lá bị bao phủ. với các vết bệnh lớn hơn màu nâu. Tương tự, các lá bị ảnh hưởng bởi dịch hại lúa Hispa có thể được xác định bằng các vết dài phát triển trên bề mặt của lá.

Bước 2: Các phương pháp trước phát hiện bệnh như thế nào?

Các phương pháp trước phát hiện bệnh như thế nào?
Các phương pháp trước phát hiện bệnh như thế nào?

Các phương pháp trước đây để tự động phân loại hình ảnh cây bị bệnh, chẳng hạn như bộ phân loại dựa trên quy tắc như được sử dụng trong [1], dựa vào một bộ quy tắc cố định để phân loại lá thành các vùng bị ảnh hưởng và không bị ảnh hưởng. Một số quy tắc để trích xuất các đối tượng địa lý liên quan đến việc quan sát sự thay đổi giá trị trung bình và độ lệch chuẩn giữa màu của vùng bị ảnh hưởng và vùng không bị ảnh hưởng. Các quy tắc để trích xuất các đặc điểm hình dạng liên quan đến việc đặt riêng lẻ một số hình dạng nguyên thủy lên trên vùng bị ảnh hưởng và xác định hình dạng bao phủ diện tích tối đa của vùng bị ảnh hưởng. Sau khi các tính năng được trích xuất từ các hình ảnh, một tập hợp các quy tắc cố định được sử dụng để phân loại các hình ảnh tùy thuộc vào loại bệnh có thể đã ảnh hưởng đến cây trồng. Hạn chế chính của bộ phân loại như vậy là nó sẽ yêu cầu một số quy tắc cố định cho mỗi bệnh, do đó có thể làm cho nó dễ bị nhiễu dữ liệu. Các hình ảnh trên cho thấy cách cây quyết định dựa trên quy tắc có thể được sử dụng để phân đoạn hình ảnh thành hai vùng.

1. Santanu Phadikar và cộng sự, “Phân loại bệnh hại lúa bằng kỹ thuật chọn đặc điểm và tạo quy luật,” Máy tính và Điện tử trong Nông nghiệp, tập. 90, tháng 1 năm 2013.

Bước 3: Chuyển giao học tập

Chuyển giao học tập
Chuyển giao học tập

Kỹ thuật phân loại hình ảnh được mô tả trong Các tài liệu hướng dẫn này sử dụng cấu trúc cơ bản của CNN bao gồm một số lớp phức hợp, một lớp tổng hợp và một lớp cuối cùng được kết nối đầy đủ. Các lớp phức hợp hoạt động như một tập hợp các bộ lọc trích xuất các tính năng cấp cao của hình ảnh. Tổng hợp tối đa là một trong những phương pháp phổ biến được sử dụng trong gộp các lớp để giảm kích thước không gian của các đối tượng được trích xuất do đó giảm sức mạnh tính toán cần thiết để tính toán trọng số cho mỗi lớp. Cuối cùng, dữ liệu trích xuất được chuyển qua một lớp được kết nối đầy đủ cùng với chức năng kích hoạt softmax xác định lớp của hình ảnh.

Nhưng đào tạo CNN tùy chỉnh từ đầu có thể không tạo ra kết quả mong muốn và có thể có thời gian đào tạo rất dài.

Để tìm hiểu các tính năng của hình ảnh đào tạo, chúng tôi sử dụng phương pháp gọi là Học chuyển giao trong đó các lớp ‘trên cùng’ của mô hình được đào tạo trước sẽ bị xóa và thay thế bằng các lớp có thể tìm hiểu các tính năng dành riêng cho tập dữ liệu đào tạo. Học chuyển đổi làm giảm thời gian đào tạo khi so sánh với các mô hình sử dụng trọng lượng khởi tạo ngẫu nhiên. Phương pháp của chúng tôi sử dụng sáu mô hình được đào tạo trước khác nhau là AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet và MobileNet-v2.

Hình ảnh cho thấy kiến trúc GoogLeNet trong đó màu xanh lam được sử dụng cho các lớp phức hợp, màu đỏ cho các lớp gộp, màu vàng cho các lớp softmax và màu xanh lá cây cho các lớp concat. Bạn có thể tìm hiểu thêm về hoạt động bên trong của CNN tại đây.

Bộ dữ liệu bệnh hại lúa bao gồm các hình ảnh về lá của cả cây lúa khỏe mạnh và cây lúa bị bệnh. Các hình ảnh có thể được phân loại thành bốn loại khác nhau là đốm nâu, lúa Hispa, đạo ôn lá và bệnh khỏe mạnh. Tập dữ liệu bao gồm 2092 hình ảnh khác nhau với mỗi lớp chứa 523 hình ảnh. Mỗi hình ảnh bao gồm một lá khỏe mạnh hoặc bị bệnh được đặt trên nền trắng.

Chúng tôi chia tập dữ liệu hình ảnh thành các tập hình ảnh đào tạo, xác nhận và thử nghiệm. Để tránh trang bị quá nhiều, chúng tôi tăng cường các hình ảnh đào tạo bằng cách chia tỷ lệ và lật các hình ảnh đào tạo để tăng tổng số mẫu đào tạo.

Mã và các phần phụ thuộc là mã nguồn mở và có thể được tìm thấy tại đây: Mã GitHub

Đối với các ứng dụng phân loại hình ảnh khác nhau, chúng ta có thể chỉ cần thay đổi tập dữ liệu hình ảnh đào tạo.

Bước 4: Đào tạo người mẫu

Đào tạo người mẫu
Đào tạo người mẫu
Đào tạo người mẫu
Đào tạo người mẫu
Đào tạo người mẫu
Đào tạo người mẫu

Tùy thuộc vào kích thước bộ nhớ theo yêu cầu của từng mô hình, các mô hình được đào tạo trước được phân loại thành các mô hình lớn hơn và nhỏ hơn. Các mô hình nhỏ hơn tiêu thụ ít hơn 15MB và do đó phù hợp hơn cho các ứng dụng di động.

Trong số các mô hình lớn hơn, Inception-v3 có thời gian đào tạo dài nhất khoảng 140 phút trong khi AlexNet có thời gian đào tạo ngắn nhất khoảng 18 phút. Trong số các mô hình định hướng di động nhỏ hơn, MobileNet-v2 có thời gian đào tạo dài nhất khoảng 73 phút trong khi ShuffleNet có thời gian đào tạo ngắn nhất khoảng 38 phút.

Bước 5: Kiểm tra mô hình

Kiểm tra mô hình
Kiểm tra mô hình
Kiểm tra mô hình
Kiểm tra mô hình
Kiểm tra mô hình
Kiểm tra mô hình

Trong số các mô hình lớn hơn, Inception-v3 có độ chính xác kiểm tra cao nhất khoảng 72,1% trong khi AlexNet có độ chính xác kiểm tra thấp nhất khoảng 48,5%. Trong số các mô hình hướng tới di động nhỏ hơn, MobileNet-v2 có độ chính xác kiểm tra cao nhất là 62,5% trong khi ShuffleNet có độ chính xác kiểm tra thấp nhất là 58,1%.

MobileNet-v2 hoạt động tốt đáng kể khi phân loại các hình ảnh của đốm nâu, đạo ôn và lá khỏe mạnh trong khi thực hiện một số phân loại sai đối với Rice Hispa với độ chính xác chỉ 46,15%.

Inception-v3 cho kết quả phân loại tương tự như MobileNet-v2.

Bước 6: Kiểm tra bổ sung

Các bài kiểm tra bổ sung
Các bài kiểm tra bổ sung
Các bài kiểm tra bổ sung
Các bài kiểm tra bổ sung

Hình ảnh trên cho thấy cách mô hình MobileNet-v2 phân loại sai hình ảnh một chiếc lá cỏ trên nền trắng là Rice Hispa.

Chúng tôi cũng đã kiểm tra độ chính xác của MobileNet-v2 trên ảnh cắt của Rice Hispa, trong đó nền trắng được thu nhỏ sao cho chiếc lá chiếm diện tích tối đa trong ảnh. Đối với hình ảnh đã cắt của Rice Hispa, chúng tôi quan sát thấy độ chính xác khoảng 80,81%, tức là đối với hình ảnh được cắt của Rice Hispa, chúng tôi đã quan sát thấy sự gia tăng đáng kể về độ chính xác phân loại so với các mẫu thử nghiệm chưa được cắt. Do đó, chúng tôi đề xuất rằng việc triển khai phát hiện bệnh hại lúa trong thế giới thực bằng cách sử dụng mạng nơ-ron phức hợp phải cắt các hình ảnh thử nghiệm để loại bỏ nhiễu nền nhằm cải thiện độ chính xác.