
Để triển khai nhiệm vụ, ngoài việc xác lập được cơ sở khoa học và thực tiễn của việc xây dựng nền tảng trí tuệ nhân tạo dùng chung ngành TN&MT, cần có các nghiên cứu về mô hình kiến trúc cũng như để xuất các giải pháp xây dựng, triển khai nền tảng này.
Nền tảng trí tuệ nhân tạo dùng chung ngành Tài nguyên và Môi trường
Quy trình AI
Quy trình AI bao gồm tập hợp các bước triển khai thực hiện, xử lý để triển khai một bài toán AI trong một hệ thống AI, bao gồm 06 bước chính sau (Hình 1), bao gồm 6 bước: (1) Cài đặt và cấu hình (Install & Configure); (2) Thu thập dữ liệu (Identify Data); (3) Chuẩn bị dữ liệu (Prepare Data); (4) Xây dựng, huấn luyện và tối ưu mô hình (Build, Train & Optimize); (5) Triển khai và suy luận (Deploy & Inter) và (6) Bảo trì (Maintain).
Nền tảng trí tuệ nhân tạo (AI platform)
Nền tảng trí tuệ nhân tạo (nền tảng AI) được hiểu là hệ thống thông tin phục vụ việc triển khai và quản lý toàn bộ quy trình thực hiện bài toán trí tuệ nhân tạo. Nền tảng trí tuệ nhân tạo sẽ cung cấp một cách có cấu trúc nhưng linh hoạt để tạo ra các giải pháp dựa trên trí tuệ nhân tạo một cách nhanh chóng, tối ưu chi phí. Nền tảng AI được thiết kế để bảo đảm thực hiện đầy đủ các bước của một quy trình hệ thống AI đã đưa ra trong Hình 1.
Hình 1: 06 bước của Quy trình AI [1]
Nền tảng trí tuệ nhân tạo dùng chung ngành TN&MT (Monre.AI) được hiểu là nền tảng trí tuệ nhân tạo tập trung phục vụ việc triển khai các bài toán về học máy trong các bài toán chuyên ngành của các lĩnh vực ngành tài nguyên và môi trường.
Đề xuất kiến trúc nền tảng trí tuệ nhân tạo Monre.AI
Kiến trúc tham chiếu nền tảng AI: Kiến trúc tham chiếu của nền tảng AI được mô tả trong Hình 2 [2], bao gồm các thành phần: Tích hợp và hợp nhất dữ liệu; Tiền xử lý và làm giàu dữ liệu; Thiết kế và huấn luyện mô hình; Triển khai mô hình và Bảo trì mô hình.
Vị trí của Nền tảng Monre.AI trong Kiến trúc CPĐT ngành Tài nguyên và môi trường
Kiến trúc CPĐT ngành TN&MT (phiên bản 2.0) theo cách tiếp cận trước đó, nên chưa có các khái niệm nền tảng. Hiện nay, Bộ TN&MT đã triển khai thực hiện cập nhật kiến trúc CPĐT theo các sự phát triển mới về chuyển đổi số, theo đó dự thảo Kiến trúc CPĐT ngành TN&MT (phiên bản 2.1) đã tiếp cận đến các nền tảng số, tuy nhiên trong danh mục các nền tảng số dùng chung chưa cập nhật Nền tảng trí tuệ nhân tạo. Do đó, nhóm thực hiện đề tài đề xuất bổ sung Nền tảng Monre.AI vào danh mục nền tảng số dùng chung của Bộ TN&MT trong dự thảo kiến trúc CPĐT phiên bản 2.1
Hình 2: Kiến trúc tham chiếu của nền tảng AI [2]
Hình 3: Vị trí, vai trò của nền tảng trí tuệ nhân tạo Monre.AI trong Kiến trúc CPĐT ngành TN&MT
Đề xuất Kiến trúc mức khái niệm niệm nền tảng Monre.AI
Mô hình đề xuất kiến trúc mức khái niệm của nền tảng Monre.AI (hình 4) bao gồm các thành phần: 1) Hạ tầng: Hạ tầng lưu trữ, tính toán (CPU/GPU) và các hạ tầng mạng; (2) Quản lý tài nguyên: các thành phần công nghệ thực hiện nhiệm vụ kết nối, điều phối hạ tầng cho các bài toán AI, mô hình học máy chạy; (3) Nguồn dữ liệu: các CSDL ngành tài nguyên môi trường, các dữ liệu quan trắc thời gian thực (Sensor Data) và các dữ liệu file phân tán, dữ liệu tại máy local của người sử dụng; (4) Ứng dụng, dịch vụ: các ứng dụng, modul tích hợp dịch vụ AI, quản lý quy trình AI, dịch vụ chia sẻ, trình diễn kết quả và môi trường cho phép người sử dụng thiết lập, quản lý các bài toán AI; (5) Người dùng: các cá nhân, tổ chức thuộc Bộ Tài nguyên môi trường sử dụng nền tảng trí tuệ nhân tạo Monre.AI và chuyên gia, người sử dụng bên ngoài có nhu cầu khai thác, sử dụng; (6) Các thành phần cốt lõi bao gồm: Quản lý nguồn dữ liệu, Dịch vụ tiền xử lý dữ liệu, các modul huấn luyện và tối ưu các mô hình học máy, kho chứa các thuật toán, các API dịch vụ AI đã được tích hợp.
Hình 4: Mô hình kiến trúc mức khái niệm của nền tảng trí tuệ nhân tạo Monre.AI
Đề xuất Kiến trúc nền tảng trí tuệ nhân tạo Monre.AI: Mô hình kiến trúc được đề xuất cho nền tảng nền tảng trí tuệ nhân tạo Monre.AI như hình dưới (Hình 5) bao gồm các thành phần:
Người dùng: các cá nhân, tổ chức thuộc Bộ Tài nguyên môi trường sử dụng nền tảng trí tuệ nhân tạo Monre.AI và chuyên gia, người sử dụng bên ngoài có nhu cầu khai thác các dữ liệu, mô hình đã được chia sẻ từ nền tảng trí tuệ nhân tạo Monre.AI, được chia làm 3 nhóm: người dùng xây dựng mô hình, người sử dụng và người quản trị.
Kênh giao tiếp: là các hình thức, phương tiện qua đó người sử dụng để truy cập, khai thác thông tin mà hệ thống cung cấp, cụ thể: người dùng sẽ truy cập và sử dụng nền tảng trí tuệ nhân tạo cho các bài toán AI của ngành tài nguyên môi trường qua môi trường mạng Internet.
Ứng dụng, dịch vụ: Đây là thành phần cốt lõi của nền tảng Monre.AI, cung cấp công cụ và một bộ khung phát triển để chuẩn hóa vòng đời của bài toán AI. Các bài toán AI sẽ được quản lý để có thể tái sử dụng lại các mô hình. Lớp này cho phép các đối tượng người dùng sử dụng các công cụ phát triển AI để đào tạo và triển khai các mô hình và bài toán AI.
Dịch vụ nền tảng: các dịch vụ dùng chung hỗ trợ trực tiếp cho các ứng dụng và dịch vụ trực tuyến phía trên. Lớp này cung cấp những dịch vụ nền tảng bao gồm quản lý và xác thực người dùng, dịch vụ dữ liệu và các dịch vụ hạ tầng số phục vụ việc điều phối hạ tầng cho các bài toán AI, mô hình học máy sử dụng, đảm bảo cung cấp đủ tài nguyên phục vụ việc đào tạo mô hình và thực hiện các bài toán AI.
Nguồn dữ liệu: bao gồm các CSDL ngành tài nguyên môi trường, các dữ liệu quan trắc thời gian thực (Sensor Data) và các dữ liệu file phân tán, dữ liệu tại máy local của người sử dụng. Bên cạnh đó còn bao gồm những dữ liệu của nền tảng bao gồm dữ liệu quy trình, dữ liệu mô hình và thuật toán, các dữ liệu mẫu,...
Hạ tầng: bao gồm các hạ tầng lưu trữ, tính toán (CPU/GPU) và các hạ tầng mạng, điện toán đám mây và các thiết bị lưu trữ.
Hình 5: Mô hình kiến trúc nền tảng trí tuệ nhân tạo Monre.AI
Đề xuất các giải pháp triển khai nền tảng trí tuệ nhân tạo Monre.AI
Hạ tầng số: Hạ tầng số phục vụ triển khai nền tảng Monre.AI bao gồm hạ tầng mạng, hạ tầng lưu trữ và hạ tầng tính toán thông qua thành phần quản lý hạ tầng trong kiến trúc nền tảng Monre.AI được cấp phát để chạy các bài toán AI. Hạ tầng số được sử dụng để triển khai nền tảng Monre.AI từ các trung tâm dữ liệu của Bộ Tài nguyên và Môi trường đã được đầu tư, bao gồm 02 trung tâm dữ liệu tại Hà Nội (số 28 Phạm Văn Đồng; số 10 Tôn Thất Thuyết), 01 trung tâm dữ liệu tại TP. Hồ Chí Minh (36 Lý Văn Phức) và 01 trung tâm tại TP. Cần Thơ.
Dữ liệu số: Nền tảng Monre.AI thực hiện kết nối với hệ thống cơ sở dữ liệu tài nguyên và môi trường, cơ sở dữ liệu quan trắc tài nguyên và môi trường và các hệ thống cơ sở dữ liệu quốc gia, chuyên ngành khác của ngành tài nguyên và môi trường qua nền tảng chia sẻ, tích hợp dữ liệu (LGSP) của Bộ Tài nguyên và Môi trường.
Các dữ liệu khác phục vụ triển khai các bài toán AI trên nền tảng Monre.AI được tích hợp vào Hệ thống sử dụng các công cụ tạo lập dữ liệu do Nền tảng Monre.AI cung cấp.
Nền tảng Monre.AI thực hiện việc quản lý, lưu trữ các thông tin dữ liệu dùng chung, các dữ liệu quản trị, cấu hình và dữ liệu người dùng phục vụ triển khai nền tảng Monre.AI.
Phần mềm nền tảng: Hiện nay trên thế giới và trong nước có nhiều phần mềm nền tảng AI khác nhau bao gồm phần mềm thương mại và mã nguồn mở. Qua nghiên cứu, đánh giá, nhóm thực hiện nhận thấy hiện nay phần lớn các quốc gia, tổ chức, doanh nghiệp trong nước và quốc tế đang triển khai các nền tảng AI dựa trên các nền tảng mã nguồn mở. Do vậy, nhóm thực hiện đề xuất sử dụng nền tảng mã nguồn mở H2O phục vụ xây dựng, triển khai nền tảng Monre.AI.
Kết luận
Trong phạm vi đề tài nghiên cứu KH&CN cấp Bộ “Nghiên cứu xây dựng công nghệ nền tảng trí tuệ nhân tạo phục vụ chuyển đổi số ngành tài nguyên và môi trường” (mã số: TNMT.2022.04.03), nhóm tác giả đã thực hiện nghiên cứu, đề xuất mô hình kiến trúc và các giải pháp phục vụ xây dựng, triển khai nền tảng trí tuệ nhân tạo dùng chung ngành TN&MT. Với kiến trúc đã được xây dựng, việc phát triển nền tảng AI sẽ trở nên đơn giản hơn, tuy nhiên vẫn sẽ tốn rất nhiều công sức và thời gian. Trong thời gian tới, AI sẽ là nền tảng cho việc phát triển các công nghệ khác. Việc ứng dụng thành công AI trong tổ chức sẽ định hướng và đảm bảo được sự phát triển tiếp theo của các công nghệ mới theo Chiến lược AI đã được Chính phủ ban hành.
TÀI LIỆU THAM KHẢO
1. Kelvin Lui, Jeff Karmiol: AI Infrastructure Reference Architecture. IBM Systems;
2. Quyết định số 417/QĐ-BTNMT ngày 10 tháng 3 năm 2021 của Bộ trưởng Bộ Tài nguyên và Môi trường phê duyệt Chương trình chuyển đổi số tài nguyên và môi trường đến năm 2025, định hướng đến năm 2030;
3. Hashim, Mohammed: Decrypting practical AI: Empowering or Enslaving humans?. 2018;
4. Rashed Haq, “Building an Enterprise AI Platform for Today and Tomorrow”, 2018.
Th.S. HOÀNG THU TRANG, Th.S. NGUYỄN NGỌC VŨ
Cục Chuyển đổi số và Thông tin dữ liệu tài nguyên môi trường
Nguồn: Tạp chí Tài nguyên và Môi trường số 16 (Kỳ 2 tháng 8) năm 2023