Ứng dụng mô hình Transformer để dự báo nồng độ bụi mịn PM2.5 tại Hà Nội trong giai đoạn 2022-2025
Tóm tắt :
Ô nhiễm không khí do bụi mịn PM2.5 đang trở thành một vấn đề môi trường nghiêm trọng tại nhiều đô thị lớn, đặc biệt ở các khu vực có tốc độ đô thị hóa nhanh. Việc dự báo chính xác nồng độ PM2.5 có ý nghĩa quan trọng trong công tác quản lý chất lượng không khí và xây dựng các hệ thống cảnh báo ô nhiễm môi trường. Nghiên cứu này nhằm đánh giá khả năng ứng dụng của các phương pháp học máy và học sâu trong dự báo nồng độ PM2.5 dựa trên dữ liệu chuỗi thời gian kết hợp với các yếu tố khí tượng. Dữ liệu sử dụng trong nghiên cứu bao gồm nồng độ PM2.5 cùng các biến khí tượng như nhiệt độ, độ ẩm và tốc độ gió tại khu vực Hà Nội. Các bước tiền xử lý dữ liệu được thực hiện bao gồm phát hiện và xử lý ngoại lai bằng phương pháp khoảng tứ phân vị (IQR), chuẩn hóa dữ liệu theo phương pháp Z-score và xây dựng các đặc trưng chuỗi thời gian. Các mô hình dự báo được xem xét gồm ARIMA, Random Forest, LSTM, GRU và Transformer. Kết quả thực nghiệm cho thấy các mô hình học sâu đạt hiệu suất dự báo cao hơn so với các phương pháp truyền thống. Trong đó, mô hình Transformer cho kết quả tốt nhất với sai số dự báo thấp và khả năng tái hiện xu hướng biến động của PM2.5 hiệu quả hơn so với các mô hình còn lại. Kết quả nghiên cứu cho thấy tiềm năng ứng dụng của các mô hình học sâu trong dự báo chất lượng không khí và cung cấp cơ sở khoa học cho việc xây dựng các hệ thống cảnh báo sớm ô nhiễm không khí tại các đô thị lớn.