
Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory
24/03/2024TN&MTMô hình Bộ nhớ gần xa (Long Short-Term Memory - LSTM) được sử dụng để cảnh báo tổng lượng nước mùa cạn vào vùng Đồng bằng sông Cửu Long mà không cần các số liệu địa hình và dự báo mưa. Dữ liệu cần thiết cho việc cảnh báo sớm tổng lượng là lượng nước theo tháng tại các trạm Kratie, Tân Châu và Châu Đốc. Mô hình được thiết lập để dự báo tổng lượng nước đến cho trạm Kratie, Tân Châu và Châu Đốc với thời đoạn cảnh báo 6 tháng. Kết quả cho thấy, mô hình LSTM mà các tác giả đề xuất dự báo chính xác về tổng lượng nước khá cao, có thể áp dụng mô hình này để cảnh báo sớm nguồn lượng nước mùa cạn vào vùng Đồng bằng sông Cửu Long.
Mở đầu
Bài báo này, nghiên cứu sử dụng mô hình LSTM để cảnh báo sớm nguồn nước mặt mùa cạn tại khu vực ĐBSCL dựa trên dữ liệu về tổng lượng dòng chảy tại các trạm thủy văn, mà không cần các thông tin dự báo lượng mưa, cũng như số liệu địa hình,... Mô hình này được áp dụng để cảnh báo nguồn nước mặt mùa cạn tại các trạm Kratie, Tân Châu và Châu Đốc nhằm góp phần nâng cao hiệu quả hoạt động phòng chống hạn hán cho khu vực.
Dữ liệu và phương pháp
Dữ liệu: Các số liệu sử dụng được thu thập từ dự án của Ủy ban sông Mê Công Việt Nam, Ủy hội sông Mê Công quốc tế [9-11] bao gồm số liệu thủy văn về lưu lượng, mực nước tại các trạm đại điện gồm: Trạm Kratie, Tân Châu và Châu Đốc được cập nhật đến 2022.
Phương pháp: Mô hình LSTM: Mạng bộ nhớ dài-ngắn là một mạng nơ-ron nhân tạo được sử dụng trong lĩnh vực trí tuệ nhân tạo và học sâu. LSTM được giới thiệu bởi Hochreiter & Schmidhuber (1997) và sau đó đã được cải tiến bởi rất nhiều tác giả khác. Mạng LSTM là dạng cải tiến của mạng nơ ron tự hồi quy (Recurrent Neural Network-RNN) nhằm giải quyết vấn đề nhớ các bước tính dài của RNN. Không giống như các mạng nơron truyền thẳng tiêu chuẩn, LSTM có các kết nối phản hồi. Một mạng nơ-ron tuần hoàn như vậy có thể xử lý không chỉ các điểm dữ liệu đơn lẻ (chẳng hạn như hình ảnh), mà còn toàn bộ chuỗi dữ liệu (chẳng hạn như lời nói hoặc video).
Thuộc tính này cho phép các LSTM xử lý toàn bộ chuỗi dữ liệu (ví dụ: chuỗi thời gian) mà không xử lý từng điểm trong chuỗi một cách độc lập, mà giữ lại thông tin hữu ích về dữ liệu trước đó trong chuỗi để giúp xử lý các điểm dữ liệu mới. Kết quả là, LSTM đặc biệt tốt trong việc xử lý các chuỗi dữ liệu như văn bản, giọng nói và chuỗi thời gian nói chung.
Hình 1. Cấu trúc của mô hình LSTM
(Nguồn: Internet)
Kết quả tính toán của một LSTM tại một thời điểm cụ thể phụ thuộc vào ba điều: Bộ nhớ dài hạn hiện tại của mạng - được gọi là trạng thái tế bào; Đầu ra tại thời điểm trước đó - được gọi là trạng thái ẩn trước đó; Dữ liệu đầu vào ở bước thời gian hiện tại.
Trạng thái tế bào là một dạng giống như băng truyền. Nó chạy xuyên suốt tất cả các mắt xích (các nút mạng) và chỉ có tương tác tuyến tính. Vì vậy, mà các thông tin có thể dễ dàng truyền đi thông suốt mà không sợ bị thay đổi.
LSTM có khả năng bỏ đi hoặc thêm vào các thông tin cần thiết cho trạng thái tế báo, chúng được điều chỉnh cẩn thận bởi các nhóm được gọi là cổng (gate).
Các cổng là nơi sàng lọc thông tin đi qua nó, chúng được kết hợp bởi một tầng mạng sigmoid và một phép nhân.
LSTM sử dụng một loạt các cổng kiểm soát cách thông tin trong chuỗi dữ liệu đi vào, được lưu trữ trong và rời khỏi mạng. Có ba cổng trong một LSTM điển hình: cổng quên, cổng đầu vào và cổng đầu ra. Các cổng này có thể được coi là bộ lọc và mỗi cổng là mạng nơ-ron của riêng chúng. Các bước thực hiện trong mô hình như sau: Bước 1: quyết định xem thông tin nào cần bỏ đi từ trạng thái tế bào. Quyết định này được đưa ra bởi tầng sigmoid - gọi là “tầng cổng quên” (forget gate layer). Bước 2: quyết định xem thông tin mới nào sẽ lưu vào trạng thái tế bào. Việc này gồm 2 phần. Đầu tiên là sử dụng một tầng sigmoid được gọi là “tầng cổng vào” (input gate layer) để quyết định giá trị nào ta sẽ cập nhập. Tiếp theo là một tầng tanh tanh tạo ra một véc-tơ cho giá trị mới (tạm gọi là Ct) nhằm thêm vào cho trạng thái. Trong bước tiếp theo, ta sẽ kết hợp 2 giá trị đó lại để tạo ra một cập nhập cho trạng thái. Sau đó trạng thái tế bào cũ (Ct-1) sẽ được cập nhật thành trạng thái mới Ct. Bước 3: xác định trạng thái ẩn mới tại tầng cổng ra (output gate) dựa trên trạng thái tế bào mới, trạng thái ẩn cũ và đầu vào mới. Giá trị đầu ra sẽ dựa vào trạng thái tế bào và được tiếp tục sàng lọc.
LSTM được thiết kế để tránh được vấn đề phụ thuộc xa. Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định của chúng, chứ ta không cần phải huấn luyện nó để có thể nhớ được. Tức là ngay nội tại của nó đã có thể ghi nhớ được mà không cần bất kì can thiệp nào.
Phương pháp đánh giá sai số: Để đánh giá hiệu quả của mô hình dự báo, bài báo sử dụng trị số NSE (Nash Sutcliffe Efficiency – hệ số Nash):
Trong đó, là giá trị dự báo, yi là giá trị đo đạc,
là trung bình số liệu đo đạc, n là độ dài chuỗi số.
Kết quả và thảo luận
Thiết lập mô hình LSTM
Mô hình mạng nơ ron tự hồi quy LSTM được sử dụng để cảnh báo tổng lượng nước báo dòng chảy đến Kratie, Tân Châu và Châu Đốc. Đầu vào của mô hình là số liệu tổng lượng dòng chảy tháng từ 01/1996 đến 10/2021 tại Kratie, Tân Châu và Châu Đốc. Chuỗi số liệu đầu vào chia thành 2 phần: 70% giá trị được sử dụng luyện mạng LSTM và 30% giá trị được sử dụng để kiểm tra mạng nơ ron. Tiêu chí đánh giá sai số dự báo được sử dụng là hệ số NASH nhằm đánh giá sự khác biệt giữa các giá trị dự báo và đo đạc. NASH càng gần 1 có nghĩa tính toán càng sát với thực đó.
Cấu trúc của mạng hồi quy được minh họa trong sơ đồ sau. Trong đó, mạng LSTM bắt đầu với Lớp đầu vào chuỗi thời gian và một lớp LSTM. Mạng kết thúc với một lớp kết nối đầy đủ và một lớp đầu ra hồi quy.
Hình 2: Cấu trúc mạng LSTM cho bài toán hồi quy
Mô hình cảnh báo tổng lượng nước theo tháng tại Kratie/Tân Châu/Châu Đốc được xác định thông qua quá trình đào tạo nhiều lần để tìm ra mạng LSTM có NSE lớn nhất. Mạng LSTM này sau đó được sử dụng để dự báo cho các tháng tiếp theo. Quá trình cập nhật mạng LSTM có thể được thực hiện hàng năm hoặc vào đầu mùa cạn nhằm tận dụng được hết các chuỗi số liệu thực đo đã có mà vẫn giảm thời gian luyện mạng.
Hình 3. Sơ đồ xây dựng mạng LSTM dự báo tổng lượng nước
Các bước tính toán như sau:
Bước 1: Từ số liệu về thực đo tại Kratie tiến hành thiết lập và huấn luyện mô hình mạng LSTM, trình tự thực hiện như sau: Phân chia dữ liệu luyện và kiểm tra mạng; Chuẩn hóa dữ liệu về phân phối chuẩn với trung bình bằng 0 và phương sai bằng 1 N(0,1); Thiết lập và luyện mạng LSTM trên môi trường MATLAB 2019a; Tiến hành phi chuẩn hóa và kiểm tra mạng thông qua tiêu chí NSE.
Bước 2: Tiến hành luyện mạng nhiều lần để lựa chọn mạng LSTM tối ưu nhất với NSE lớn nhất.
Trong quá trình dự báo có thể tiến hành cập nhật dữ liệu thực đo mới và luyện lại mạng. Khuyến nghị chỉ luyện mạng theo mỗi mùa dự báo khi có chuỗi dữ liệu mới. Mạng LSTM tìm được sẽ được sử dụng cho cả mùa dự báo mà không cần cập nhật, huấn luyện lại.
Bước 3: Dự báo tổng lương nước tại các trạm địa diện cho các bước thời gian tiếp theo.
Kết quả dự báo: Trong đề tài, mô hình LSTM được huấn luyện với thời gian trễ dt=1, tức dòng chảy tháng W #(t+1) được dự báo dựa trên dòng chảy 1 tháng trước đó W(t), dòng chảy tháng W #(t+2) được tính toán từ dòng chảy dự báo tháng trước W #(t+1). Kết quả huấn luyện tại các trạm như sau.
Kết quả dự báo tại trạm Kratie
Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Kratie từ 01/1985 đến 9/2022 (453 số liệu) để tiến hành luyện mạng (407 số liệu, đến 11/2018) và kiểm tra mạng (45 số liệu).
Kết quả dự báo tại trạm Tân Châu
Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Tân Châu từ tháng 1/1996 đến tháng 7/2022 (319 số liệu) để tiến hành luyện mạng (287 số liệu, đến 11/2018) và kiểm tra mạng (32 số liệu). Kết quả huấn luyện mạng được thể hiện như sau:
Hình 4. Kết quả luyện mạng LSTM trạm Tân Châu (dt=1)
Kết quả dự báo tại trạm Châu Đốc
Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Tân Châu từ 01/1996 đến 7/2022 (319 số liệu) để tiến hành luyện mạng (287 số liệu, đến 11/2018) và kiểm tra mạng (32 số liệu). Kết quả luyện mạng được thể hiện như sau:
Hình 5. Kết quả luyện mạng LSTM trạm Châu Đốc (dt=1)
Các kết quả tính toán cho thấy sai số đánh giá tổng lượng các tháng mùa cạn tại trạm Kratie ở mức dưới 10 % chỉ có tháng 5 sai số ở mức 11%, tại trạm Tân Châu tháng có sai số lớn nhất rời vào tháng 3 với sai số khoảng 21%, trạm Châu Đốc có sai số lớn nhất rơi vào tháng 2, 4 và 3 với sai số lần lượt là 15%, 26%,12%.
Kết luận
Bài báo này đã mô tả chi tiết quá trình xây dựng mô hình mạng thần kinh LSTM để cảnh báo tổng lượng nước mặt các tháng trước 6 tháng tại trạm Kratie, Tân Châu và Châu Đốc. Mô hình mà các tác giả đề xuất không sử dụng các dữ liệu dự báo mưa, chỉ sử dụng thông tin về lượng nước thực đo đã có tại các trạm thủy văn để phục vụ cảnh báo. Kết quả tính toán của mô hình LSTM cho thấy sự ổn định và độ chính xác trong cảnh báo nguồn nước. Có thể thấy rằng, không có quy tắc cụ thể nào cho việc lựa chọn các thông số của mô hình như hệ số học, số lượng chuỗi, số lượng lớp ẩn, số lượng Epoch cũng như cấu trúc của mô hình. Việc lựa chọn các thông số này dựa vào quá trình thử và đánh giá sai số. Các thông số tốt nhất đã được chọn và đánh giá qua quá trình hiệu chỉnh và kiểm định mô hình.
Mạng thần kinh sâu có ưu điểm là đơn giản hơn so với các mô hình thủy văn, thủy lực, đặc biệt nó có thể cảnh báo cho vùng bị ảnh hưởng của thủy triều trong trường hợp thiếu số liệu địa hình, khi mà không thể sử dụng các mô hình thủy lực, thủy văn. Lúc đó, mô hình mạng thần kinh LSTM là giải pháp tốt cho việc dự tổng lượng nước thay thế các mô hình đã có.
Bài báo này được thực hiện trên cơ sở nhiệm vụ TNN.2023.03 và đề tài cấp bộ mã số TNMT.2023.562.02 và nhiệm vụ . Tập thể tác giả xin trân trọng cảm ơn!
TÀI LIỆU THAM KHẢO
1. S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory,” Neural Comput., vol. 9, no. 8, pp. 1735–1780, Nov. 1997, doi: 10.1162/neco.1997.9.8.1735;
2. Y. Wang, J. Zhou, K. Chen, Y. Wang, and L. Liu, “Water quality prediction method based on LSTM neural network,” in 2017 12th International Conference on Intelligent Systems and Knowledge Engineering (ISKE), Nov. 2017, pp. 1–5. doi: 10.1109/ISKE.2017.8258814;
3. W. Xu, Y. Jiang, X. Zhang, Y. Li, R. Zhang, and G. Fu, “Using long short-term memory networks for river flow prediction,” Hydrol. Res., vol. 51, no. 6, pp. 1358–1376, Dec. 2020, doi: 10.2166/NH.2020.026;
4. T. Lees et al., “Hydrological concept formation inside long short-term memory (LSTM) networks,” Hydrol. Earth Syst. Sci., vol. 26, no. 12, pp. 3079–3101, 2022, doi: 10.5194/HESS-26-3079-2022;
5. Z. Xiang, J. Yan, and I. Demir, “A Rainfall- Runoff Model With LSTM-Based Sequence-to- Sequence Learning,” Water Resour. Res., vol. 56, no. 1, p. e2019WR025326, Jan. 2020, doi: 10.1029/ 2019WR025326;
6. X. H. Le, V. H. Ho, G. H. Lee, and S. H. Jung, “A Deep Neural Network Application for Forecasting the Inflow into the Hoabinh Reservoir in Vietnam,” 2018.
(1)TRẦN ĐỨC THIỆN, (1)NGUYỄN QUANG CHIẾN, (2)CÁI ANH TÚ, (3)NGUYỄN THỊ BÍCH, (4)LÊ VĂN QUY
(1)Viện Khoa học Tài nguyên nước
(2)Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
(3)Viện Địa lý, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
(4)Viện Khoa học Khí tượng Thủy văn và Biến đổi khí hậu
Nguồn: Tạp chí Tài nguyên và Môi trường số 23 (Kỳ 1 tháng 12) năm 2023