news

Phân loại rác bằng phương pháp học sâu

Thứ năm, 25/4/2024, 14:54 (GMT+7)
logo Phân loại rác luôn là vấn đề quan trọng bảo vệ môi trường, tái chế tài nguyên và sinh kế xã hội. Tuy nhiên, việc phân loại rác tốn rất nhiều thời gian và công sức. Hơn nữa, việc phân loại rác còn ảnh hưởng trực tiếp tới sức khỏe của người lao động. Để nâng cao hiệu quả phân loại rác, trong bài báo này chúng tôi đề xuất phương pháp phân loại rác dựa trên phương pháp học sâu.

Từ khóa: Phân loại rác, mạng nơ ron tích chập, tối ưu bầy đàn

Abstract: Waste classification is always an important issue to protect the environment, recycle resources and social livelihoods. However, classifying waste takes a lot of time and effort. Furthermore, waste classification also directly affects the health of workers.

To improve the efficiency of waste classification, in this article we propose a waste classification method based on deep learning.

Keywords: Garbage classification, convolutional neural network, swarm optimization.

Giới thiệu

Với sự phát triển của các thành phố thông minh trên khắp thế giới, hệ thống quản lý rác thông minh là rất cần thiết. Bởi lượng rác thải ngày một tăng lên. Điều cần thiết là phải đưa ra cách tiếp cận tốt nhất để quản lý vấn đề này vì rác thải phát sinh vượt quá nhiều. Các công ty môi trường đô thị hiện có ở nước ta thực hiện thu gom rác thải sinh hoạt và công nghiệp rồi đổ vào các bãi rác lớn. Việc phân loại chất thải rắn do người lao động thực hiện không mang tính hệ thống, tốn nhiều thời gian và thậm chí không thể thực hiện được do lượng rác thải quá lớn. Mục đích của nghiên cứu này là xây dựng một ứng dụng thời gian thực có khả năng nhận biết loại chất thải và phân loại nó thành các danh mục xác định. Bằng cách triển khai hệ thống phân loại rác này, chúng tôi muốn giảm bớt những nỗ lực thể chất và phân loại rác thải thành các loại khác nhau một cách hiệu quả. Mô hình được sử dụng cho nghiên cứu này là mạng nơ ron tích chập (Convolutional Neural Network - CNN), một thuật toán học máy (Machine Learning) được sử dụng trên tập dữ liệu chứa hình ảnh rác. Hệ thống này đảm bảo cách tốt nhất để quản lý chất thải và cũng sẽ đẩy nhanh quá trình phân loại với độ chính xác cao hơn. [2][3]

Hình 1: Mô tả cấu trúc mô hình mạng nơ ron tích chập
Phân loại rác bằng phương pháp học sâu

Mạng nơ ron tích chập

Mạng nơ ron tích chập là một trong những mô hình học sâu (deep learning) phổ biến nhất và có ảnh hưởng nhiều nhất trong cộng đồng Computer Vision. CNN được dùng trong trong nhiều bài toán như nhận dạng ảnh, phân tích video, ảnh MRI, hoặc cho các bài của lĩnh vực xử lý ngôn ngữ tự nhiên, và hầu hết đều giải quyết tốt các bài toán này. [1]

CNN là một kiến trúc mạng neuron rất thích hợp cho các bài toán mà dữ liệu là ảnh hoặc video.

Tích chập được sử dụng đầu tiên trong xử lý tín hiệu số. Nhờ vào nguyên lý biến đổi thông tin, các nhà khoa học đã áp dụng kĩ thuật này vào xử lý ảnh và video số. Để dễ hình dung, ta có thể xem tích chập như một cửa sổ trượt áp đặt lên một ma trận.

Tập dữ liệu

Tập dữ liệu sử dụng trong nghiên cứu này được lấy từ trang Kaggle và bao gồm 2467 hình ảnh khác nhau của 6 loại rác bao gồm: thủy tinh (491), kim loại (400), giấy (584), nhựa (472), rác (127). các tông (393).

Thực nghiệm

Xử lý dữ liệu:

Phân loại rác bằng phương pháp học sâu

Bước 1: Thay đổi kích thước tất cả các hình ảnh trong tập dữ liệu thành 28 x 28 pixel để phù hợp với lớp đầu vào của mô hình.

Bước 2: Chuyển đổi tất cả các ảnh màu về ảnh đa cấp xám để đơn giản hóa thuật toán của mô hình và các yêu cầu tính toán.

Bước 3: Chuẩn hóa tập dữ liệu hình ảnh bằng cách chia mỗi giá trị pixel cho 255. Giá trị pixel nằm trong khoảng từ 0 đến 255 cho mỗi kênh (RGB). Chia giá trị của các pixel cho 255 để chuẩn hóa về phạm vi từ 0 đến 1.

Bước 4: Chia dữ liệu thành ba tập - tập dữ liệu huấn luyện (training datasets), tập dữ liệu kiểm tra (test datasets) và và tập dữ liệu đánh giá (validation datasets).

Để tăng độ chính của mô hình chúng tôi sử dụng phương pháp tối ưu bầy đàn để lựa chọn giá trị tối ưu cho các tham số như số epoch, kích thước của tập batch, tốc độ học (learning rate), hàm tối ưu (optimizer), số lớp ẩn (hidden layer) của mô hình.

Kết quả thử nghiệm trên tập dữ liệu kiểm thử cho độ chính xác là 89%

Kết luận

Trong bài báo này, chúng tôi đã đề xuất một hệ thống phân loại rác thải có thể phân tách các thành phần chất thải khác nhau bằng cách sử dụng các công cụ Mạng nơ ron tích chập. Hệ thống này có thể được sử dụng để tự động phân loại rác thải và giúp giảm sự can thiệp của con người cũng như ngăn ngừa nhiễm trùng và ô nhiễm. Từ kết quả, khi kiểm tra với tập dữ liệu rác, chúng tôi đạt được độ chính xác là 89%. Quá trình phân loại chất thải sẽ nhanh hơn và thông minh hơn khi sử dụng hệ thống của chúng tôi mà không cần hoặc giảm bớt sự tham gia của con người. Nếu thêm nhiều hình ảnh vào tập dữ liệu, độ chính xác của hệ thống có thể được cải thiện.

Tài liệu tham khảo

1. A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep convolutional neural networks,” in Advances in Neural Information Processing Systems 25, F. Pereira, C. J. C. Burges, L. Bottou, and K. Q. Weinberger, Eds. Curran Associates, Inc., 2012, pp. 1097–1105;

2. Thung, Gary and M. Yang. “Classification of Trash for Recyclability Status.” (2016);

3. Zhang, Y., Gao, H., Fan, H., & Zhu, W. (2018). Automatic waste sorting system based on image recognition technology. In 2018 International Conference on Computer, Mechatronics, Control and Electronic Engineering (CMCE) (pp. 1-4). IEEE.

BÙI THỊ VÂN ANH, ĐẶNG HỮU NGHỊ, PHẠM ĐỨC HẬU
Trường Đại học Mỏ - Địa chất
Nguồn: Tạp chí Tài nguyên và Môi trường