
Giới thiệu
Có nhiều nghiên cứu về dự báo cháy rừng ở Việt Nam. Các loại Các phương pháp dự báo cháy rừng trong nước chủ yếu là theo chỉ số tổng hợp (P) của Nesterov [4] được tính từ giá trị của các yếu tố khí tượng gồm nhiệt độ, độ ẩm không khí và lượng mưa, hoặc có cải tiến để phù hợp với điều kiện Việt Nam [3] bằng cách sử dụng thêm các yếu tố như kiểu rừng, sức gió và mức sương mù. Có thể thấy rằng, các phương pháp dự báo cháy rừng này không sử dụng các yếu tố quan trọng khác như các chỉ số thảm thực vật (NDVI, NDWI, NDMI), chỉ số thời tiết cháy rừng (FWI) [5] hay chỉ số ẩm địa hình (TWI), khoảng cách tới đường giao thông, khoảng cách tới khu dân cư, độ dốc, hướng dốc, là những yếu tố đã được chứng minh có khả năng dự báo cao trong cháy rừng [2].
Mô tả dữ liệu
Lựa chọn các yếu tố đánh lửa thích hợp cho mô hình cháy rừng là một vấn đề quan trọng [6] có ảnh hưởng chất lượng của các mô hình dự đoán kết quả. Các đám cháy không chỉ bị ảnh hưởng bởi các yếu tố phi vật chất, ví dụ như địa hình, đặc điểm thực vật và cả các yếu tố con người [1], mà còn về yếu tố khí hậu, ví dụ nhiệt độ, độ ẩm, lượng mưa và gió, do đó những yếu tố này nên được xem xét. Trong bài báo này, bộ dữ liệu thử nghiệm được sử dụng lấy mẫu từ đám cháy ở công viên tự nhiên Montesinho [5], các tham số của tập dữ liệu bao gồm:
1. X - tọa độ không gian trục x trong bản đồ công viên Montesinho: 1 đến 9
2. Y - tọa độ không gian trục y trong bản đồ công viên Montesinho: 1 đến 9
3. month - tháng trong năm: "jan" thành "dec"
4. day - ngày trong tuần: "mon" thành "sun"
5. FFMC - Chỉ số FFMC từ hệ thống FWI: 18,7 đến 96,20
6. DMC - Chỉ số DMC từ hệ thống FWI: 1.1 đến 291.3
7. DC - Chỉ số DC từ hệ thống FWI: 7.9 đến 860.6
8. ISI - Chỉ số ISI từ hệ thống FWI: 0,0 đến 56.10
9. temp - nhiệt độ tính theo độ C: 2.2 đến 33.30
10. RH - độ ẩm tương đối tính theo%: 15.0 đến 100
11. wind - tốc độ gió tính theo km / h: 0,40 đến 9,40
12. rain - mưa ngoài trời tính bằng mm / m2: 0,0 đến 6,4
13. area - diện tích rừng bị đốt cháy (tính bằng ha): 0,00 đến 1090,84
Hình 1: Cấu trúc chỉ số cháy rừng
Hình 1 miêu tả chỉ số thời tiết cháy rừng - Fire Weather Index (FWI) là hệ thống của Canada để đánh giá mức độ nguy hiểm của hỏa hoạn và nó bao gồm sáu thành phần [5]: Mã độ ẩm nhiên liệu mịn - Fine Fuel Moisture Code (FFMC), Mã độ ẩm không tốt (DMC), Mã hạn hán (DC), Chỉ số lây lan ban đầu (ISI), Chỉ số tích lũy (BUI) và FWI. Ba tham số đầu tiên liên quan đến mã nhiên liệu: FFMC biểu thị độ ẩm bề mặt và ảnh hưởng đến sự bắt lửa và lan truyền lửa, trong khi DMC và DC đại diện cho độ ẩm của các lớp hữu cơ nông và sâu, ảnh hưởng đến cường độ lửa. ISI là một điểm tương quan với sự lan truyền tốc độ lửa, trong khi BUI đại diện cho lượng nhiên liệu có sẵn. Chỉ số FWI là một chỉ số về cường độ lửa và nó kết hợp hai thành phần trước đó. Mặc dù các thang đo khác nhau được sử dụng cho từng yếu tố FWI, các giá trị cao cho thấy các điều kiện cháy nghiêm trọng hơn. Ngoài ra, các mã độ ẩm nhiên liệu yêu cầu bộ nhớ (độ trễ thời gian) của các điều kiện thời tiết trong quá khứ: 16 giờ đối với FFMC, 12 ngày đối với DMC và 52 ngày đối với DC.
Hình 2: Bản đồ công viên tự nhiên Montesinho (nguồn [5])
Nghiên cứu này sẽ xem xét dữ liệu cháy rừng từ công viên tự nhiên Montesinho, từ khu vực phía đông bắc Tr´as-os-Montes của Bồ Đào Nha (Hình 2). Công viên này có sự đa dạng động thực vật cao. Được đưa vào trong vùng khí hậu Địa Trung Hải, nhiệt độ trung bình hàng năm nằm trong khoảng 8 đến 120C. Dữ liệu được sử dụng trong các thí nghiệm được thu thập từ tháng 1/2000 đến tháng 12/2003 và nó được xây dựng từ hai nguồn. Nguồn đầu tiên được thu thập bởi người thanh tra chịu trách nhiệm cho các vụ hỏa hoạn Montesinho. Hằng ngày, mỗi khi xảy ra cháy rừng, một số tính năng đã được đăng ký, chẳng hạn như thời gian, ngày tháng, vị trí không gian trong lưới 9 × 9 (trục x và y của Hình 2), loại thảm thực vật có liên quan, sáu loại các thành phần của hệ thống FWI và tổng diện tích bị cháy. Nguồn dữ liệu thứ hai được thu thập bởi Viện Bách khoa Bragana, chứa một số quan sát thời tiết (ví dụ: Tốc độ gió) được ghi lại trong khoảng thời gian 30 phút bởi một trạm khí tượng nằm ở trung tâm của công viên Montesinho. Hai cơ sở dữ liệu được lưu trữ trong hàng chục bảng tính riêng lẻ, dưới các định dạng riêng biệt và tích hợp một cách thủ công vào một tập dữ liệu duy nhất với tổng số 517 mục. Dữ liệu có thể được tải từ đường link sau: http://www.dsi.uminho.pt/˜pcortez/forestfires/.
Phương pháp sử dụng
Trong nghiên cứu này, các thuật toán khác nhau đã được sử dụng, các thuật toán bao gồm: Vector hồi quy hỗ trợ - 'SVR', Cây quyết định - 'Decision Tree', Rừng ngẫu nhiên - 'Random Forest', và Mạng nơron sâu- 'Deep NN'. Sau đó, kết quả dự đoán nguy cơ cháy rừng với cùng bộ dữ liệu được đem so sánh để thấy được thuật toán nào có độ chính xác cao nhất. Các bước so sánh bao gồm: Tìm diện tích thực sự đã bị cháy; Dự đoán lỗi (số ha cháy); Tìm sai số toàn phương trung bình; Tìm lỗi tuyệt đối (dung sai) trong dự đoán; Tỷ lệ dự đoán đúng.
Một số kết quả
Hình 3: Kết quả cuối cùng khi so sánh độ chính xác dự đoán của 4 thuật toán
Hình 3 thể hiện kết quả cuối cùng cho thấy quan hệ giữa dung sai trong dự đoán, tỷ lệ phần trăm dự đoán đúng của 4 thuật toán. Khi nhận kết quả tính toán Sai số toàn phương trung bình (RMSE), SVR cho kết quả xấu nhất với RMSE là 0.671031657615, Cây quyết định là 0.624177314982, Random Forest là 0.614885707514 và Deep NN là 0.610289206294.
Kết luận
Với bộ dữ liệu [5], thực nghiệm cho thấy thuật toán Deep NN có sai số thấp nhất so với các thuật toán khác, hứa hẹn sẽ cho kết quả tốt hơn khi áp dụng ở các bài toán tương tự khác, sử dụng học sâu (Deep learning). Ngoài ra, chất lượng của mô hình cháy rừng có thể được cải thiện khi các thuật toán tối ưu hóa mới khác được chọn để tìm kiếm các tham số tốt nhất cho mô hình Deep NN. Những cải tiến khác có thể có của nghiên cứu này bao gồm điều tra các mô hình máy học mới để cải thiện khả năng dự đoán của mô hình dự báo cháy rừng. Kết luận cuối cùng, kết quả trong nghiên cứu này rất hữu ích cho việc lập kế hoạch và quản lý rừng ở các khu vực dễ bị cháy rừng.
Lời cảm ơn
Nghiên cứu này được tài trợ bởi Trường Đại học Mỏ - Địa chất trong khuôn khổ đề tài NCKH số T19-01 của ThS. Hoàng Anh Đức chủ nhiệm: “Nghiên cứu ứng dụng phương pháp học sâu trong đánh giá nguy cơ cháy rừng, áp dụng thí điểm cho một tỉnh miền núi Việt Nam”
TÀI LIỆU THAM KHẢO
[1] Eastaugh, C.S., Hasenauer, H., 2014. Deriving forest fire ignition risk with biogeo
chemical process modelling. Environ. Model. Softw. 55, 132–142.
[2] Ganteaume, A. et al., 2013. A review of the main driving factors of forest fire ignition over Europe. Environ. Manage., 51(3), p. 651–662.
[3] Hưng, P. N., 2004. Quản lý cháy rừng ở Việt Nam. s.l.:Nhà xuất bản Nghệ An.
[4] McGrattan, K. et al., 2013. Fire Dynamics Simulator Technical Reference Guide, Volume 1: Mathematical Model. s.l.:National Institute of Standards and Technology, U.S. Department of Commerce.
[5] P. Cortez and A. Morais. “A Data Mining Approach to Predict Forest Fires using Meteorological Data”, In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence, Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December, Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9.
[6] Verde, J., Zêzere, J., 2010. Assessment and validation of wildfire susceptibility and hazard in Portugal. Nat. Hazards Earth Syst. Sci. 10 (3), 485–497.
HOÀNG ANH ĐỨC
Đại học Mỏ - Địa Chất Hà Nội