Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

24/03/2024

TN&MTMô hình Bộ nhớ gần xa (Long Short-Term Memory - LSTM) được sử dụng để cảnh báo tổng lượng nước mùa cạn vào vùng Đồng bằng sông Cửu Long mà không cần các số liệu địa hình và dự báo mưa. Dữ liệu cần thiết cho việc cảnh báo sớm tổng lượng là lượng nước theo tháng tại các trạm Kratie, Tân Châu và Châu Đốc. Mô hình được thiết lập để dự báo tổng lượng nước đến cho trạm Kratie, Tân Châu và Châu Đốc với thời đoạn cảnh báo 6 tháng. Kết quả cho thấy, mô hình LSTM mà các tác giả đề xuất dự báo chính xác về tổng lượng nước khá cao, có thể áp dụng mô hình này để cảnh báo sớm nguồn lượng nước mùa cạn vào vùng Đồng bằng sông Cửu Long.

Mở đầu

Bài báo này, nghiên cứu sử dụng mô hình LSTM để cảnh báo sớm nguồn nước mặt mùa cạn tại khu vực ĐBSCL dựa trên dữ liệu về tổng lượng dòng chảy tại các trạm thủy văn, mà không cần các thông tin dự báo lượng mưa, cũng như số liệu địa hình,... Mô hình này được áp dụng để cảnh báo nguồn nước mặt mùa cạn tại các trạm Kratie, Tân Châu và Châu Đốc nhằm góp phần nâng cao hiệu quả hoạt động phòng chống hạn hán cho khu vực.

Dữ liệu và phương pháp

Dữ liệu: Các số liệu sử dụng được thu thập từ dự án của Ủy ban sông Mê Công Việt Nam, Ủy hội sông Mê Công quốc tế [9-11] bao gồm số liệu thủy văn về lưu lượng, mực nước tại các trạm đại điện gồm: Trạm Kratie, Tân Châu và Châu Đốc được cập nhật đến 2022.

 Phương pháp: Mô hình LSTM: Mạng bộ nhớ dài-ngắn là một mạng nơ-ron nhân tạo được sử dụng trong lĩnh vực trí tuệ nhân tạo và học sâu. LSTM được giới thiệu bởi Hochreiter & Schmidhuber (1997) và sau đó đã được cải tiến bởi rất nhiều tác giả khác. Mạng LSTM là dạng cải tiến của mạng nơ ron tự hồi quy (Recurrent Neural Network-RNN) nhằm giải quyết vấn đề nhớ các bước tính dài của RNN. Không giống như các mạng nơron truyền thẳng tiêu chuẩn, LSTM có các kết nối phản hồi. Một mạng nơ-ron tuần hoàn như vậy có thể xử lý không chỉ các điểm dữ liệu đơn lẻ (chẳng hạn như hình ảnh), mà còn toàn bộ chuỗi dữ liệu (chẳng hạn như lời nói hoặc video).

Thuộc tính này cho phép các LSTM xử lý toàn bộ chuỗi dữ liệu (ví dụ: chuỗi thời gian) mà không xử lý từng điểm trong chuỗi một cách độc lập, mà giữ lại thông tin hữu ích về dữ liệu trước đó trong chuỗi để giúp xử lý các điểm dữ liệu mới. Kết quả là, LSTM đặc biệt tốt trong việc xử lý các chuỗi dữ liệu như văn bản, giọng nói và chuỗi thời gian nói chung.

Hình 1. Cấu trúc của mô hình LSTM

Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

(Nguồn: Internet)

Kết quả tính toán của một LSTM tại một thời điểm cụ thể phụ thuộc vào ba điều: Bộ nhớ dài hạn hiện tại của mạng - được gọi là trạng thái tế bào; Đầu ra tại thời điểm trước đó - được gọi là trạng thái ẩn trước đó; Dữ liệu đầu vào ở bước thời gian hiện tại.

Trạng thái tế bào là một dạng giống như băng truyền. Nó chạy xuyên suốt tất cả các mắt xích (các nút mạng) và chỉ có tương tác tuyến tính. Vì vậy, mà các thông tin có thể dễ dàng truyền đi thông suốt mà không sợ bị thay đổi.

LSTM có khả năng bỏ đi hoặc thêm vào các thông tin cần thiết cho trạng thái tế báo, chúng được điều chỉnh cẩn thận bởi các nhóm được gọi là cổng (gate).

Các cổng là nơi sàng lọc thông tin đi qua nó, chúng được kết hợp bởi một tầng mạng sigmoid và một phép nhân.

LSTM sử dụng một loạt các cổng kiểm soát cách thông tin trong chuỗi dữ liệu đi vào, được lưu trữ trong và rời khỏi mạng. Có ba cổng trong một LSTM điển hình: cổng quên, cổng đầu vào và cổng đầu ra. Các cổng này có thể được coi là bộ lọc và mỗi cổng là mạng nơ-ron của riêng chúng. Các bước thực hiện trong mô hình như sau: Bước 1: quyết định xem thông tin nào cần bỏ đi từ trạng thái tế bào. Quyết định này được đưa ra bởi tầng sigmoid - gọi là “tầng cổng quên” (forget gate layer). Bước 2: quyết định xem thông tin mới nào sẽ lưu vào trạng thái tế bào. Việc này gồm 2 phần. Đầu tiên là sử dụng một tầng sigmoid được gọi là “tầng cổng vào” (input gate layer) để quyết định giá trị nào ta sẽ cập nhập. Tiếp theo là một tầng tanh tanh tạo ra một véc-tơ cho giá trị mới (tạm gọi là Ct) nhằm thêm vào cho trạng thái. Trong bước tiếp theo, ta sẽ kết hợp 2 giá trị đó lại để tạo ra một cập nhập cho trạng thái. Sau đó trạng thái tế bào cũ (Ct-1) sẽ được cập nhật thành trạng thái mới Ct. Bước 3: xác định trạng thái ẩn mới tại tầng cổng ra (output gate) dựa trên trạng thái tế bào mới, trạng thái ẩn cũ và đầu vào mới. Giá trị đầu ra sẽ dựa vào trạng thái tế bào và được tiếp tục sàng lọc. 

LSTM được thiết kế để tránh được vấn đề phụ thuộc xa. Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định của chúng, chứ ta không cần phải huấn luyện nó để có thể nhớ được. Tức là ngay nội tại của nó đã có thể ghi nhớ được mà không cần bất kì can thiệp nào.

Phương pháp đánh giá sai số: Để đánh giá hiệu quả của mô hình dự báo, bài báo sử dụng trị số NSE (Nash Sutcliffe Efficiency – hệ số Nash):

Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

Trong đó, Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory  là giá trị dự báo, yi là giá trị đo đạc, Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory  là trung bình số liệu đo đạc, n là độ dài chuỗi số.

Kết quả và thảo luận

Thiết lập mô hình LSTM

Mô hình mạng nơ ron tự hồi quy LSTM được sử dụng để cảnh báo tổng lượng nước báo dòng chảy đến Kratie, Tân Châu và Châu Đốc. Đầu vào của mô hình là số liệu tổng lượng dòng chảy tháng từ 01/1996 đến 10/2021 tại Kratie, Tân Châu và Châu Đốc. Chuỗi số liệu đầu vào chia thành 2 phần: 70% giá trị được sử dụng luyện mạng LSTM và 30% giá trị được sử dụng để kiểm tra mạng nơ ron. Tiêu chí đánh giá sai số dự báo được sử dụng là hệ số NASH nhằm đánh giá sự khác biệt giữa các giá trị dự báo và đo đạc. NASH càng gần 1 có nghĩa tính toán càng sát với thực đó.

Cấu trúc của mạng hồi quy được minh họa trong sơ đồ sau. Trong đó, mạng LSTM bắt đầu với Lớp đầu vào chuỗi thời gian và một lớp LSTM. Mạng kết thúc với một lớp kết nối đầy đủ và một lớp đầu ra hồi quy.

Hình 2: Cấu trúc mạng LSTM cho bài toán hồi quy

Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

Mô hình cảnh báo tổng lượng nước theo tháng tại Kratie/Tân Châu/Châu Đốc được xác định thông qua quá trình đào tạo nhiều lần để tìm ra mạng LSTM có NSE lớn nhất. Mạng LSTM này sau đó được sử dụng để dự báo cho các tháng tiếp theo. Quá trình cập nhật mạng LSTM có thể được thực hiện hàng năm hoặc vào đầu mùa cạn nhằm tận dụng được hết các chuỗi số liệu thực đo đã có mà vẫn giảm thời gian luyện mạng. 

Hình 3. Sơ đồ xây dựng mạng LSTM dự báo tổng lượng nước
Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

Các bước tính toán như sau: 

Bước 1: Từ số liệu về thực đo tại Kratie tiến hành thiết lập và huấn luyện mô hình mạng LSTM, trình tự thực hiện như sau: Phân chia dữ liệu luyện và kiểm tra mạng; Chuẩn hóa dữ liệu về phân phối chuẩn với trung bình bằng 0 và phương sai bằng 1 N(0,1); Thiết lập và luyện mạng LSTM trên môi trường MATLAB 2019a; Tiến hành phi chuẩn hóa và kiểm tra mạng thông qua tiêu chí NSE.

Bước 2: Tiến hành luyện mạng nhiều lần để lựa chọn mạng LSTM tối ưu nhất với NSE lớn nhất. 

Trong quá trình dự báo có thể tiến hành cập nhật dữ liệu thực đo mới và luyện lại mạng. Khuyến nghị chỉ luyện mạng theo mỗi mùa dự báo khi có chuỗi dữ liệu mới. Mạng LSTM tìm được sẽ được sử dụng cho cả mùa dự báo mà không cần cập nhật, huấn luyện lại.

Bước 3: Dự báo tổng lương nước tại các trạm địa diện cho các bước thời gian tiếp theo.

Kết quả dự báo: Trong đề tài, mô hình LSTM được huấn luyện với thời gian trễ dt=1, tức dòng chảy tháng W #(t+1) được dự báo dựa trên dòng chảy 1 tháng trước đó W(t), dòng chảy tháng W #(t+2) được tính toán từ dòng chảy dự báo tháng trước W #(t+1). Kết quả huấn luyện tại các trạm như sau.

Kết quả dự báo tại trạm Kratie

Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Kratie từ 01/1985 đến 9/2022 (453 số liệu) để tiến hành luyện mạng (407 số liệu, đến 11/2018) và kiểm tra mạng (45 số liệu). 

Kết quả dự báo tại trạm Tân Châu

Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Tân Châu từ tháng 1/1996 đến tháng 7/2022 (319 số liệu) để tiến hành luyện mạng (287 số liệu, đến 11/2018) và kiểm tra mạng (32 số liệu). Kết quả huấn luyện mạng được thể hiện như sau:

Hình 4. Kết quả luyện mạng LSTM trạm Tân Châu (dt=1)

Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

Kết quả dự báo tại trạm Châu Đốc

Sử dụng chuỗi dữ liệu quan trắc tổng lượng nước tháng tại Tân Châu từ 01/1996 đến 7/2022 (319 số liệu) để tiến hành luyện mạng (287 số liệu, đến 11/2018) và kiểm tra mạng (32 số liệu). Kết quả luyện mạng được thể hiện như sau:

Hình 5. Kết quả luyện mạng LSTM trạm Châu Đốc (dt=1)

Cảnh báo sớm nguồn nước mặt mùa cạn vào vùng Đồng bằng sông Cửu Long bằng mô hình mạng long short term memory 

Các kết quả tính toán cho thấy sai số đánh giá tổng lượng các tháng mùa cạn tại trạm Kratie ở mức dưới 10 % chỉ có tháng 5 sai số ở mức 11%, tại trạm Tân Châu tháng có sai số lớn nhất rời vào tháng 3 với sai số khoảng 21%, trạm Châu Đốc có sai số lớn nhất rơi vào tháng 2, 4 và 3 với sai số lần lượt là 15%, 26%,12%.

Kết luận

Bài báo này đã mô tả chi tiết quá trình xây dựng mô hình mạng thần kinh LSTM để cảnh báo tổng lượng nước mặt các tháng trước 6 tháng tại trạm Kratie, Tân Châu và Châu Đốc. Mô hình mà các tác giả đề xuất không sử dụng các dữ liệu dự báo mưa, chỉ sử dụng thông tin về lượng nước thực đo đã có tại các trạm thủy văn để phục vụ cảnh báo. Kết quả tính toán của mô hình LSTM cho thấy sự ổn định và độ chính xác trong cảnh báo nguồn nước. Có thể thấy rằng, không có quy tắc cụ thể nào cho việc lựa chọn các thông số của mô hình như hệ số học, số lượng chuỗi, số lượng lớp ẩn, số lượng Epoch cũng như cấu trúc của mô hình. Việc lựa chọn các thông số này dựa vào quá trình thử và đánh giá sai số. Các thông số tốt nhất đã được chọn và đánh giá qua quá trình hiệu chỉnh và kiểm định mô hình.

Mạng thần kinh sâu có ưu điểm là đơn giản hơn so với các mô hình thủy văn, thủy lực, đặc biệt nó có thể cảnh báo cho vùng bị ảnh hưởng của thủy triều trong trường hợp thiếu số liệu địa hình, khi mà không thể sử dụng các mô hình thủy lực, thủy văn. Lúc đó, mô hình mạng thần kinh LSTM là giải pháp tốt cho việc dự tổng lượng nước thay thế các mô hình đã có.

Bài báo này được thực hiện trên cơ sở nhiệm vụ TNN.2023.03 và đề tài cấp bộ mã số TNMT.2023.562.02 và nhiệm vụ . Tập thể tác giả xin trân trọng cảm ơn! 

TÀI LIỆU THAM KHẢO

1. S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory,” Neural Comput., vol. 9, no. 8, pp. 1735–1780, Nov. 1997, doi: 10.1162/neco.1997.9.8.1735;

2. Y. Wang, J. Zhou, K. Chen, Y. Wang, and L. Liu, “Water quality prediction method based on LSTM neural network,” in 2017 12th International Conference on Intelligent Systems and Knowledge Engineering (ISKE), Nov. 2017, pp. 1–5. doi: 10.1109/ISKE.2017.8258814;

3. W. Xu, Y. Jiang, X. Zhang, Y. Li, R. Zhang, and G. Fu, “Using long short-term memory networks for river flow prediction,” Hydrol. Res., vol. 51, no. 6, pp. 1358–1376, Dec. 2020, doi: 10.2166/NH.2020.026;

4.    T. Lees et al., “Hydrological concept formation inside long short-term memory (LSTM) networks,” Hydrol. Earth Syst. Sci., vol. 26, no. 12, pp. 3079–3101, 2022, doi: 10.5194/HESS-26-3079-2022;

5.    Z. Xiang, J. Yan, and I. Demir, “A Rainfall- Runoff Model With LSTM-Based Sequence-to- Sequence Learning,” Water Resour. Res., vol. 56, no. 1, p. e2019WR025326, Jan. 2020, doi: 10.1029/ 2019WR025326;

6.    X. H. Le, V. H. Ho, G. H. Lee, and S. H. Jung, “A Deep Neural Network Application for Forecasting the Inflow into the Hoabinh Reservoir in Vietnam,” 2018.

(1)TRẦN ĐỨC THIỆN, (1)NGUYỄN QUANG CHIẾN, (2)CÁI ANH TÚ, (3)NGUYỄN THỊ BÍCH, (4)LÊ VĂN QUY

(1)Viện Khoa học Tài nguyên nước

(2)Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội

(3)Viện Địa lý, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

(4)Viện Khoa học Khí tượng Thủy văn và Biến đổi khí hậu

Nguồn: Tạp chí Tài nguyên và Môi trường số 23 (Kỳ 1 tháng 12) năm 2023

Gửi Bình Luận

code

Tin liên quan

Tin tức

C.P. là hình mẫu lý tưởng trong phát triển chăn nuôi bền vững

Thông cáo báo chí số 09, Kỳ họp thứ 9, Quốc hội khóa XV

Đảng bộ Cục Đo đạc, bản đồ và Thông tin địa lý Việt Nam: Tổ chức thành công Đại hội điểm nhiệm kỳ 2025 - 2030

Bộ NN&MT: Đảm bảo hoàn thành chỉ tiêu tăng trưởng ngành ở mức cao nhất

Nông nghiệp

Quảng Bình: Nâng cao giá trị sản phẩm OCOP 3 - 4 sao, hướng đến phát triển bền vững

Hà Tĩnh: Nâng cao nhận thức và kỹ năng về chú trọng công tác vệ sinh môi trường trong chăn nuôi

Ứng dụng khoa học kỹ thuật trong nuôi trồng thủy sản với mô hình xen ghép tôm sú và cá rô phi đơn tính tại Hà Tĩnh

Hành trình kết nối và lan tỏa giá trị OCOP tại miền Trung thân thương của Tạp chí Nông nghiệp và Môi trường

Tài nguyên

Thời hạn huy động vốn tại Khu đô thị du lịch lấn biển Cần Giờ chưa phù hợp với tiến độ dự án

Tuần lễ Biển và Hải đảo Việt Nam năm 2025 có chủ đề: “Công nghệ xanh để đại dương bền vững”

Chuyển đổi mục đích sử dụng 6,94 ha rừng để thực hiện Dự án xây dựng đường bộ cao tốc Khánh Hòa -Buôn Ma Thuột

Phân cấp, gắn trách nhiệm quản lý tài nguyên khoáng sản

Môi trường

Tăng cường hợp tác công - tư trong quản lý chất lượng không khí và thúc đẩy tăng trưởng xanh

Nhận diện bức tranh về thiên tai, bão lũ và bài toán ứng phó, giảm thiểu

Ứng dụng khoa học công nghệ trong quản lý rủi ro lũ lụt: Giải pháp cấp thiết cho Việt Nam trong bối cảnh biến đổi khí hậu

Tăng cường hợp tác Việt Nam - Nhật Bản trong quản lý thiên tai: Hướng tới mô hình mẫu phòng, chống sạt lở đất và lũ quét

Video

Giải pháp kiểm soát nguồn gây ô nhiễm môi trường ở các thành phố lớn

Nâng cao chất lượng nội dung và điểm số khoa học trên Tạp chí in Tài nguyên và Môi trường

Nâng cao công tác quản lý nhà nước về môi trường và hỗ trợ các doanh nghiệp

Phụ nữ tiên phong trong phát triển kinh tế tuần hoàn

Khoa học

Nghiên cứu khoa học, công nghệ trong chăn nuôi, thú y, thuỷ sản, kiểm ngư: Thể chế, nhân lực, hạ tầng, dữ liệu và công nghệ là trọng tâm, cốt lõi

Hội thảo Chuyên đề 3: Nhận diện thực trạng nghiên cứu khoa học trong các lĩnh vực: Môi trường, Tài nguyên nước, Viễn thám

Khoa học công nghệ - Đòn bẩy phát triển bền vững ngành nông nghiệp và môi trường

Dự báo hạn hán, thiếu nước dựa trên công nghệ viễn thám

Chính sách

Tăng tốc hoàn thành mục tiêu hỗ trợ nhà ở đối với hộ nghèo, hộ cận nghèo năm 2025

Cục Quản lý và Xây dựng công trình thủy lợi đã kiểm tra hiện trường tình hình thực hiện các dự án thủy lợi trên địa bàn tỉnh Thanh Hóa

Xây dựng, phát triển nông nghiệp, nông dân, nông thôn Việt Nam trong giai đoạn mới

Nghiên cứu, rà soát kỹ phương án đầu tư đường kết nối Bình Phước - Đồng Nai qua cầu Mã Đà

Phát triển

Lễ ra mắt Hội Doanh nhân họ Vũ - Võ TP. Hà Nội: Cột mốc kết nối, phát triển, lan tỏa giá trị dòng họ

Bắc Ninh tăng tốc chuyển đổi số, khơi thông nguồn lực trong khoa học công nghệ

Kỷ niệm 40 năm thành lập Tạp chí Người Hà Nội và đón nhận Huân chương Lao động hạng Nhì

Ngành Nông nghiệp và Môi trường: Tốc độ tăng trưởng trong quý I cao nhất trong những năm gần đây

Diễn đàn

Quản trị biến đổi khí hậu: Chiến lược, cam kết và hành động của các doanh nghiệp

Hà Nội: Trồng nho sữa kết hợp với du lịch trải nghiệm

Thời tiết ngày 15/5: Miền Bắc bắt đầu chuỗi ngày mưa lớn cục bộ, Tây Nguyên và Nam Bộ chiều tối mưa dông

Thời tiết ngày 14/5: Miền Bắc ngày nắng, chiều tối mưa dông, vùng núi cục bộ có nơi mưa to