Econ. Environ. Geol. 2024; 57(5): 551-562
Published online October 29, 2024
https://doi.org/10.9719/EEG.2024.57.5.551
© THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY
Correspondence to : *jeong.j@knu.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
Predicting groundwater levels with data-driven models like artificial neural networks typically requires a substantial amount of data. However, when groundwater monitoring wells are newly developed or when a significant portion of the data is invalid (for example, due to missing values or outliers), acquiring an adequate dataset for training prediction models becomes challenging, leading to diminished prediction accuracy. This study proposes a method based on transfer learning to address the issue of insufficient training data. The Gated Recurrent Unit (GRU) was used as the primary data-driven model for predictions. A GRU-based pretrained network for the transfer learning process was developed using groundwater level and corresponding rainfall data collected from 89 monitoring stations nationwide. Subsequently, this pretrained network was fine-tuned using a small amount of training data obtained from the target monitoring well to develop the final prediction model. To verify the effectiveness of the transfer learning algorithm, two different groundwater level prediction models were evaluated: 1) a GRU-based model trained with insufficient data from the target well, and 2) a GRU-based model utilizing the transfer learning algorithm. Comparative verification was conducted with groundwater level data obtained from wells at two different locations, where the model using the transfer learning algorithm demonstrated superior performance compared to the other. This study confirms that the transfer learning algorithm can significantly enhance the performance of groundwater level prediction models, irrespective of the amount of available training data.
Keywords groundwater level prediction, precipitation, gated recurrent unit, training data deficiency problem, transfer learning
정지호 · 정진아*
경북대학교 지질학과
인공신경망과 같은 데이터 기반 모델을 활용하여 지하수위를 예측하기 위해서는 일반적으로 충분한 양의 데이터가 필요하다. 그러나 지하수위 모니터링 관정이 새로 개발되거나 유효하지 않은 데이터(예를 들어, 결측치 또는 이상치)가 다수 관찰되는 경우, 예측 모델을 적절히 학습하기 위한 데이터셋을 확보하기가 어려우며, 이는 예측 정확도의 저하로 이어진다. 본 연구에서는 이러한 학습 데이터 부족 문제를 해결하기 위해 전이 학습(Transfer Learning)을 기반으로 하는 방법을 제안하였다. 게이트 순환유닛(Gated Recurrent Unit, GRU)을 예측을 위한 기본 데이터 기반 모델로 사용하였다. 전이학습 과정을 위한 GRU 기반 사전학습 네트워크(Pretrained network)는 국내 전역의 89개 모니터링 지점에서 수집된 지하수위 및 이에 대응하는 강우 데이터를 활용하여 개발되었다. 그 후, 타겟 모니터링 관정에서 확보된 소량의 학습 데이터를 사용하여 사전 학습된 네트워크에 대한 미세 조정(Fine-tuning) 을 통해 최종 예측 모델을 개발하였다. 전이학습 알고리즘의 효과를 검증하기 위해 두 가지 서로 다른 지하수위 예측 모델을 비교 평가하였다: 1) 타겟 관정의 불충분한 데이터를 사용하여 학습된 GRU 기반 지하수위 예측 모델 및2)전이학습 알고리즘을 기반으로 한 GRU 기반 예측 모델. 두 개의 다른 위치에 존재하는 관정에서 획득한 지하수위 자료에 대한 비교 검증이 이루어졌으며, 전이학습 알고리즘을 활용한 모델이 다른 모델에 비해 우수한 성능을 보였다. 이를 통해 사용 가능한 학습 데이터의 양에 상관없이 전이학습 알고리즘이 지하수위 예측 모델 성능 향상에 크게 기여할 수 있음을 확인하였다.
주요어 지하수위 예측, 강수량, 게이트 순환 유닛, 학습자료 부족, 전이학습
The data-driven groundwater level was estimated using precipitation data.
Transfer learning (TL) was employed to solve the training data deficiency problem.
Comparative validation of two estimation models showed the effectiveness of TL.
Data from other monitoring stations were used to develop the pretraining model.
The estimation accuracy of the model that employed TL was highly improved.
대부분의 국가에서는 적절한 지하수 자원 관리를 위해전국적인 모니터링 시스템 네트워크를 구축하여 지하수수위를 모니터링하고 있다(IGRAC, 2020). 이러한 노력의 일환으로, 국내 또한 여러 국가 기관에서 국가 지하수 관측망, 농촌 지하수 관리망, 그리고 해수 침투 관측망 등을 운영하고 있으며, 이러한 네트워크를 통해 지하수의 수량 및 수질에 관한 실시간 모니터링 데이터가 축적되고 있다.
지하수위 시계열 자료는 기상 현상이나 지하수 개발과같은 자연적 또는 인위적 사건에 의해 발생하는 다양한독립적인 수문학적 스트레스의 결과로 관측되는 자료이다. 따라서 지하수위 변화를 해석함으로써 대수층의 건전성에 대한 정보를 얻을 수 있고, 이로써 적절한 시기에 필요한 선제적 조치를 취할 수 있다. 지하수위 저하에 대한 조기 경보는 지하수 수량 관리에서 가장 비용효율적인 조치이며, 이를 위해서는 지하수위 예측이 필수이다(Cuthbert, 2010, Jeong and Park, 2017, Jeong et al., 2018, Mirarabi et al., 2019, Sun et al., 2022, Pham et al., 2022, Tao et al., 2022). 지하수위 예측 결과는 실제 모니터링 데이터와 비교하여 예상치 못한 요인으로 인한 대수층 시스템의 이상 정보를 제공하기도 한다(Zhang et al., 2018, Jeong and Park, 2019). 따라서 실제 지하수위변화를 예측하는 모델 개발은 지하수 시스템을 효과적으로 모니터링하는 데 핵심요소로 작용할 수 있다.
지하수위 예측 모델은 물리 기반 모델(physically-based model)과 데이터 기반 모델(data-driven model)로 분류할수 있다(Robert et al., 2017). 물리 기반 모델에서는 지하수의 수리학적 거동을 설명하는 편미분 방정식이 일반적으로 이용된다(Buck-Sorlin, 2013). 반면, 데이터 기반 모델은 시계열 데이터의 현상학적 패턴을 활용하는 선형또는 비선형 다변량 회귀 분석으로, 개발된 최종 모델을통해 물리적인 현상을 해석하는 데 어려움이 있다. 그러나 데이터 기반 모델은 물리 기반 모델에 비하여 보다다양한 외부 요인을 제약없이 모델 개발에 고려할 수 있다는 장점이 존재한다. 이러한 이유로, 데이터 기반 모델의 일종인 인공신경망(Artificial Neural Netowrk, ANN) 기반의 데이터 기반 모델이 지난 20년 동안 광범위하게활용되어 왔다(Maier and Dandy, 1996, Coulibaly et al., 2001, Altunkaynak, 2007, Young et al., 2015, Wunsch et al., 2018, Yoon et al., 2011, Jeong and Park, 2019, Tao et al., 2022). 최근에는 순환신경망(Recurrent Neural Network, RNN)이라는 ANN 기반 딥러닝 알고리즘이 지하수위 예측에 주로 활용되고 있다.
Coulibaly et al. (2001)은 간단한 RNN을 지하수위 예측에 성공적으로 적용하였으며, 외생 변수로 강우량과 강수위 등을 고려하여 지하수위 변동 패턴을 추정한 바 있다. Jeong and Park (2019)은 불포화대에서의 강우의 침투 지연을 고려한 지하수위 변동 예측을 위하여 RNN의일종인 장단기 메모리(Long Short-Term Memory, LSTM)를 적용한 바 있다. 이러한 연구들은 ANN 기반의 알고리즘이 지하수위를 적절히 예측함으로써 지하수량의 단기 및 장기 추세를 이해하는 데 가치 있는 정보를 제공할 수 있음을 보여주고 있다.
여러 연구들에서 다양한 외생 요인을 고려한 ANN 기반 알고리즘이 지하수위 예측에 효과적으로 적용될 수있음을 보여주었으나, 모델을 학습하기 위해서는 장기간의 시계열 데이터가 필수이다(Wen et al., 2022). 짧은 기간의 학습 데이터의 경우, 지하수위 추정 모델을 개발하는 데 필요한 관련 사전 통계 정보가 모델의 정확성을만족시키기에 충분하지 않을 수 있다. 대부분의 이전 연구에서는 일단위 지하수위 시계열 데이터를 2년 이상 사용하여 모델 네트워크를 학습시켰다(Tao et al., 2022). 예를 들어, Kisi and Shiri (2012)와 Kombo et al. (2020)은각각 7년과 2년의 일일 데이터(2,600 및 759개 데이터 포인트)를 사용하여 지하수위를 예측 한 바 있으며, 이러한연구들은 모델의 충분한 학습을 위해 대량의 학습 데이터가 필요하다는 것을 보여준다. 그러나 모니터링 관정이 최근 개발되었거나 관측된 시계열 데이터에 대규모연속 결측 데이터 또는 이상치가 포함된 경우, 상대적으로 적은 데이터셋으로 데이터 기반 모델을 학습해야 하는 경우가 빈번하게 발생한다. 이러한 경우, 데이터 기반예측 모델의 성능 저하 문제가 발생할 수 있으나, 이러한 문제를 해결하기 위한 연구는 제한적으로 수행되었다.
본 연구에서는 상대적으로 적은 학습 데이터셋을 사용하여 지하수위 예측 모델의 네트워크를 학습하기 위한효율적인 방법으로 전이 학습(Transfer Learning)을 적용하는 방법을 제안하였다. 전이학습은 관심 학습 데이터셋과 수문학적으로 유사하지만 다른 출처에서 얻은 학습데이터셋의 지식을 데이터가 부족한 모델 네트워크로 전이하는 데이터 과학(Data Science) 기술 중 하나이다. 본연구에서는 전이학습을 적용할 기본 데이터 기반 모델로 RNN 모델의 일종인 게이트 순환 유닛(Gated Recurrent Unit, GRU; Cho et al., 2014)을 이용하였다. 제안된 방법의 우수성은 한국수자원공사에서 운영하는 국가지하수관측망(Integrated Ground Water Information Service, GIMS)과 기상청의 자동기상관측시스템(Automatic Weather System, AWS)에서 확인할 수 있는 89개 관측소에서 수집된 실제 지하수위 및 강우 시계열 데이터를 통해 검증되었다.
데이터의 양과 질은 데이터 기반 모델의 학습 성능을결정하는 중요한 요소이나, 데이터 수집에는 상당한 비용과 시간이 필요하며 종종 최소한의 데이터만 가용할수 있다. 또한, 지하수위 시계열 데이터에는 많은 결측치나 이상치가 포함될 수 있다(Marchant and Bloomfield, 2018, Peterson and Western, 2018). 이러한 요인들이 데이터 기반 모델의 학습 성능을 저하시키는 요인이 된다.특히, 새롭게 개발된 모니터링 관정의 경우에는 데이터기반 지하수위 예측 모델을 학습시키기 위한 충분한 데이터를 확보하는 것이 불가능하다. 그러나 예측 모델의개발은 해당 관정 또한 필요하다. 따라서 본 연구에서는학습 데이터가 부족한 경우 모델의 예측 정확도를 향상시키기 위해 전이 학습을 적용하였다.
전이 학습은 데이터 부족 문제를 극복하기 위해 개발된 대표적인 기술로, 많은 양의 데이터가 확보된 source task(
예를 들어, 불포화대의 깊이와 이를 구성하고 있는 지질 매질은 침투된 강수가 함양될 때 까지 걸리는 지연시간에 큰 영향을 미치며, 이는 지하수위 예측 모델이 각대수층에 대하여 독립적으로 개발되어야 함을 의미한다.따라서 source task에서 학습된
제안된 방법의 성능 검증을 위해 참조 테스트 케이스가 설정되었으며, 전이학습을 활용한 지하수위 예측 모델과의 성능비교가 이루어졌다. 본 연구에서는 다음의 두가지 모델을 개발하였다: M1) 특정 target 모니터링 지점의 데이터를 이용하여 모델을 학습하는 경우(즉,
위 두 가지 지하수위 예측 모델을 개발하기 위한 네트워크 구조는 Fig. 1과 같다. 두 모델 모두 GRU를 모델 학습을 위한 기본 네트워크로 사용하였다. GRU 모델은입력변수의 이전 시퀀스 정보를 네트워크의 내부 상태에유지함으로써 데이터의 초기 부분으로부터 정보 손실 없이 데이터 시퀀스에 대한 의존성을 통합할 수 있다. 또한, GRU는 다른 유형의 RNN 모델에 비해 학습에 필요한 가중치 수가 상대적으로 적어, 데이터의 양이 적고 빈도가 낮은 특정 데이터셋에 더 나은 성능을 보이는 것으로 알려져 있다(Pan et al., 2020, Yu et al., 2021, Xu et al., 2021, Gharehbaghi et al., 2022, Li et al., 2022). GRU네트워크에 대한 보다 세부적인 사항은 Cho et al., (2014)를 참조할 수 있다. GRU 네트워크의 일반적인 학습 과정을 기반으로, M1 모델은 target 모니터링 관정의 불충분한 데이터셋(Fig. 1(a)의 target task의 데이터셋)을 사용하여 개발되었다.
전이학습 기술을 적용한 지하수위 예측 모델의 네트워크는 Fig. 1(b)와 같다. P1과정은 모든 모니터링 관정에서 획득한 source task의 데이터셋으로 사전 학습된 지하수위 예측 모델(백본 모델)을 만드는 과정이며, 백본 모델의 파라미터를 추가로 부착된 완전 연결층(fully connected layer)을 통해 미세 조정하는 과정은 P2과정에서 target task의 데이터셋을 이용하여 수행되었다. 모든 모델에 대해
본 연구에서 제안된 모델은 국내 전역에서의 모니터링을 통해 얻은 시계열 데이터(지하수위 및 강우량)에 적용되었다(Fig. 2). 지하수위 데이터는 지하수 수량 및 수질 관리를 위해 1995년부터 한국수자원공사가 관리해 온모니터링 시스템 네트워크인 GIMS로부터 확보하였다.총 668개의 모니터링 지점이 운영 중이며, 자동으로 모니터링된 지하수위 데이터는 매시간 GIMS(https://www.gims.or.kr)로 전송 및 관리된다. 한국수자원 공사는지하수 시스템의 보전을 위해 '국가 지하수 관리 기본계획(2017–2026)'을 시행하면서 새로운 모니터링 지점을 개발하고 있으며, 2019년 이후 38개의 신규 모니터링 지점이 추가로 생성되었다. 개발 연도에 따른 운영 중인 모니터링 지점은 Fig. 2(a)에 나타나 있다. 지하수위 데이터에 대응하는 일 단위 강수량 데이터는 가장 근거리에 위치한 기상관측소에서 수집되었으며, 이는 국내 기상청에서 운영중인 ASOS(https://data.kma.go.kr/cmmn/main.do)에서 획득하였다.
시계열 지하수위 모니터링 데이터에는 다양한 예상치못한 요인으로 인해 일반적으로 이상치가 포함된다. 예를 들어, 모니터링 장비의 오작동이나 대수층 시스템의갑작스러운 자연적 변화로 인해 발생하는 데이터를 모델학습에 이용할 경우, 해당 결과의 신뢰성이 저하될 수 있다. 따라서 원시 데이터의 전처리는 모델 성능을 향상시키는 데 필수이다. 본 연구에서는 먼저 사분위 범위(Interquartile range) 방법(Mood, 1950)을 사용하여 이상치를 식별하고, 이동 평균 선형 보간법(Moving average linear interpolation)을 사용하여 해당 값들을 대체하였다.보간된 데이터 값이 모델의 학습 성능 저하에 영향을 미칠 수 있으나, 본 연구에서는 결측 데이터로 인하여 발생하는 학습 자료 손실(특히, 순환 신경망이 장기 시퀀스자료를 입력자료로 활용하기 때문)을 방지하고자 하였다.본 연구에서는 이용된 관정 중, 한 개의 관정(Fig. 2(b)에서 C2)에서 학습자료에 대한 7일 단기 결측이 발생 및보간이 이루어졌다. 강수량 데이터에 결측치가 있는 경우 해당 지하수위 및 강수량 데이터는 모델 학습에서 제외하였다. 더불어 모든 데이터는 0–1 범위로 정규화되어,학습된 모델이 상대적으로 큰 값을 갖는 입력 데이터에치우치지 않도록 하였다.
전처리 과정을 거친 후, 총 89개의 지하수위 모니터링관정에서 획득한 데이터가 GRU 기반 사전 모델을 학습하는 데 사용되었다. 해당 관정의 위치는 Fig. 2(b)에 표시되었다. 그림에서 파란색 십자 기호로 나타난 지점은적용된 지하수위 데이터를 획득한 관정과 가장 가까운강수 모니터링 지점을 보여주며, 이는 모델의 입력 변수로 사용되었다. 모든 지하수위 및 강우량 모니터링 데이터에 일일 평균 시계열 데이터가 적용되었다. 본 연구에서 제안된 방법의 성능을 검증하기 위해 이용된 지하수위 모니터링 관정(C1 및 C2)의 위치는 Fig. 2(b)에 별 모양으로 표시되었다. 89개의 관정 데이터를 이용하여 학습된 사전모델이 강수와 지하수위 간의 일반적 관계성을가지며, 이를 기반으로 전이학습이 작동함을 확인하기 위해서는 다양한 강수-지하수위 반응 패턴이 예측될 수 있음이 확인되어야 한다. 가능한 다양한 패턴에 대한 검증이 필요하나, 본 연구에서는 제안된 방법의 적용 가능성을 제시하기 위한 목적으로 강수에 대한 지하수위 반응패턴이 매우 상이한 두 지점의 자료를 선택 및 검증자료로 활용하였다.
개발된 두 가지 모델의 예측 정확도는 C1 및 C2 지점(Fig. 2(b))에서 관찰된 실제 지하수위 변동 패턴을 기준으로 평가되었다. 강수량과 이에 반응하는 지하수위의 실제 변동 패턴은 Fig. 3과 같다. C1 관정 위치는 자갈과모래가 혼합된 토양층(지표면에서 4.0m 깊이까지)과 풍화암층(4.0m에서 22.2m 깊이까지)으로 구성되어 있다. 지하수위는 지표면에서 6.2m 깊이에 위치하고 있어 불포화대가 두꺼움에도 불구하고 불투수층(예: 점토층)의 방해없이 비교적 효과적으로 강수가 침투 및 함양되고 있다.또한 포화대가 자갈과 모래로 구성된 높은 투수성을 갖고 있기 때문에 포화대의 투수성이 비교적 높으며, 이로인해 지하수위 변동 패턴은 C2 지점에 비해 강수량 패턴에 더 빠르게 반응하는 것으로 나타난다. 이는 포화대에서의 빠른 유속과 높은 유체 흐름 속도에 기인한 결과이다.
C2 관정 위치의 구성 매질은 C1 관정과 조성 측면에서 유사하지만(모래가 혼합된 자갈과 풍화암층), 지하수위의 깊이가 지표면에서 38.11m로 매우 깊기 때문에 강수 사건과 침투된 강수가 함양되는 데 까지 시간 지연이발생할 수 있다. 이러한 측면은 Fig. 3(b)에서 강수 사건이후 지하수위의 느린 상승 및 하강 패턴으로 관찰된다. C1 관정과 C2 관정에 대해 각각 10년 및 9년의 시계열데이터가 이용 가능하였으며, C1 지점의 경우 예측 모델학습을 위해 360일의 데이터가 사용되었으며, C2 지점의경우 460일의 데이터가 모델 학습에 이용되었다(Fig. 3(a)및 3(b)에서 파란색 사각형으로 표시된 기간).
모델의 성능은 실제 지하수위와 예측된 지하수위 간의평균 제곱근 오차(Root Mean Squared Error, RMSE)와상관 계수(Correlation Coefficient, CC)를 사용하여 평가되었으며, RMSE는 모델 학습을 위한 목표 함수로 또한활용되었다. 개발된 모델의 최적의 값을 얻기 위해 다양한 네트워크 구조를 체계적으로 하이퍼파라미터(Hyper-parameter)를 변화시키며 반복적으로 평가했으며, 과적합을 방지하기 위해 각 학습 단계에서 조기 종료(Early Stopping)가 적용되었다. 최종 개발된 예측 모델의 최적하이퍼파라미터는 Table 1에 제시되었다. 본 연구에서는전이학습의 유무가 성능에 어떠한 영향을 미치는지를 평가하기 위하여 M1 및 M2 모델 모두 동일한 네트워크 구조를 활용하여 예측 모델의 복잡도가 동일한 상황을 가정 및 성능을 비교 검증하였다.
Table 1 Hyperparameters used for developing the two groundwater level estimation models for C1 and C2 monitoring stations
C1/C2 | Timesteps ( | Number of features in the hidden state | Number of recurrent layers | Activation function for fully connected neural network (FCNN) |
---|---|---|---|---|
M1 | 60 | 30 | 2 | tanh |
M2 | 60 | 30 | 2 | tanh |
모델 M1 및 M2의 지하수위 예측 결과는 각각 Figs. 4(a) 및 4(b)에 있다. 우기에 대하여 모델 M1을 통해 추정된지하수위 변동(빨간색 실선) 패턴은 실제와 유사하게 나타난다. 그러나 M1은 건기 동안의 실제 지하수위(검은색점)의 최저수위를 적절히 모사하지 못한다(Fig. 4(a)). 이는 지하수위 감소 패턴에 대한 정보를 제공하는 학습 데이터가 부족하기 때문이다. 학습에 이용된 2005년의 최저 지하수위가 2006년에서 2009년 동안 보여준 최저 지하수위 보다 높게 나타나고 있어, 테스트 기간 동안의 낮은 지하수위를 예측하는 데 어려움이 있는 것으로 보인다. 한편, source task에서 학습된 백본 모델에 전이학습을 적용한 M2 모델은 실제 지하수위와 높은 상관관계의예측결과를 보였으며, M1 모델이 모사하지 못한 지하수위 최저수위 또한 보다 정확하게 추정하고 있음을 확인할 수 있다.
제안된 M2 모델의 비교적 높은 성능은 Fig. 5에 나타난 실제 지하수위와 모델 예측 지하수위 간의 산점도를통해 추가적으로 확인할 수 있다. 그림에서 x축과 y축은각각 예측된 지하수위와 실제 지하수위를 나타내며, 점선 빨간색 선은 실제값과 예측값 간의 1:1 대응을 나타낸다. 모든 모델의 산점도를 비교하였을 때, M1 모델은실제값에 대하여 다소 과대추정(특히, 낮은 값에 대하여) 양상을 보였다. 한편, M2 모델에서 추정된 대부분의 값들은 1:1 대응선에 근접해 있어, 예측된 지하수위와 실제지하수위 간의 일치도가 높음을 알 수 있다. 결과에 대한 보다 정량적인 평가는 Table 2에 제시되었다. 표에서보는 바와 같이 M2 모델에 대한 결과가 비교적 높은 CC값(0.6389)와 낮은 RMSE 값(0.2261 m)을 보임을 통해전이학습 기술이 지하수위 예측 성능 향상에 효과적으로적용될 수 있음을 확인할 수 있다.
Table 2 Correlation coefficient (CC) and root mean squared error (RMSE) between the actual and estimated groundwater levels for the two different models.
M1 | M2 | |
C1 | ||
CC | 0.6029 | 0.6389 |
RMSE (m) | 0.2433 | 0.2261 |
C2 | ||
CC | 0.6543 | 0.8969 |
RMSE (m) | 2.2336 | 0.8186 |
C2 관정의 데이터셋에 대하여 개발된 모델들의 지하수위 예측 결과는 Fig. 6와 같다 target task 데이터만을 기반으로 학습된 M1 모델의 성능은 C1에 대한 결과에 비해 크게 저하되었다. 특히, C2 관정에서의 연간 지하수위 변동폭이 상당히 크며(약 5m 이상, 이는 C1 지점의변동폭인 약 2m보다 큼), 건기 동안의 낮은 지하수위 값을 포함한 학습 데이터가 있음에도 불구하고 M1 모델로는 이러한 변동을 제대로 표현하기 어려운 것으로 나타났다. 이에 비해 M2 모델은 C2 관정에서의 지하수위 변동 패턴을 적절하게 예측하고 있다(Fig. 6(c)). 특히, 백본모델을 미세 조정하기 위해 적은 양(C1 360일 및 C2 460일)의 지하수위 변동 패턴만을 적용했음에도 불구하고, M2 모델이 실제 지하수위의 높은 수위에서의 부드러운변동 패턴을 잘 표현하고 있다.
두 모델의 실제 지하수위와 예측 지하수위 간의 산점도는 Fig. 7에 나타나 있으며, M2 모델의 우수성을 명확하게 보여준다. 모델들의 정량적 성능 검증 결과는 Table 2에 제시되어 있으며, 이 중, M2 모델은 가장 높은 CC 값(0.8969)과 가장 낮은 RMSE 값(0.8186m)을 보여주었다.한편, M1 모델의 CC 값은 0.6543로, 다소 과대 추정하는 결과를 보여주었다(Fig. 7(a)). 또한 해당 모델의 RMSE는 2.2336m 로, M2 모델보다 약 두 배 높은 값을 보였다. 종합적으로, 이 결과는 전이 학습을 활용한 제안된예측 방법이 데이터 기반 모델의 학습 데이터가 불충분할 때 효과적으로 적용될 수 있음을 나타낸다. 따라서 지하수 수량 감시 및 관리를 위해 새롭게 개발된 모니터링지점에 대해서도 보다 정확한 데이터 기반 지하수위 예측 모델을 개발할 수 있다는 가능성을 본 연구를 통해확인할 수 있었다.
기상 조건의 변화에 따른 지하수위 예측은 지속 가능한 지하수 자원 관리에 있어 매우 중요하다. ANN 기반의 딥러닝 알고리즘은 지하수위 예측 모델을 개발하는데 널리 활용되어 왔으나 딥러닝 알고리즘은 예측 모델을 개발하기 위해 충분한 학습 데이터를 필요로 하며, 이는 학습 데이터가 부족하거나 유효하지 않은 데이터가많이 포함된 경우에 중요한 제약이 될 수 있다. 전이 학습은 이러한 학습 데이터 부족 문제를 해결하는 효과적인 솔루션이 될 수 있다. 따라서 본 연구에서는 전이학습의 효과를 검증하기 위해 짧은 기간에 해당하는 자료만을 학습에 적용할 수 있다는 가정을 바탕으로 전이학습이 활용된 모델과 이용하지 않은 모델을 개발 및 이들의 성능을 비교 평가하였다.
실제 지하수위 및 강수량 모니터링 데이터는 전이학습과정의 사전 학습 네트워크를 개발하는 데 사용되었으며,이는 한국의 89개의 지하수위 및 강수량 모니터링 지점에서 수집 및 연구에 이용되었다. 서로 다른 지하수위 변동 패턴을 보이는 두 개의 지점에서의 데이터가 검증에이용되었다. 그 결과, 전이학습을 적용한 예측 모델이target task 관정에서의 소량의 학습 데이터를 사용하였음에도 우수한 예측 성능을 보이는 것을 확인하였다. 이는 전이학습 과정이 지하수위 패턴과 강수량 간의 관계에대한 사전 학습 모델의 정보를 효과적으로 전이하여 목표 문제를 해결할 수 있음을 보여주며, 본 연구에서 제안된 방법을 기반으로, 가용 시계열 데이터 기간에 제약없이 보다 정확한 지하수위 예측 모델을 효과적으로 개발할 수 있음을 보여준다. 그러나 본 연구에서 제안한 방법은 단일 유형의 데이터를 입력 변수로 사용하는 경우에 대해서만 검증이 이루어짐에 따라 지하수위 예측에더 많은 외부 요인(예: 지하수 펌핑)이 통합될 수 있도록제안된 방법이 확장될 필요가 있다. 또한 본 연구에 이용된 관정 외, 다른 지하수위 변동 패턴을 가지는 자료에 전이학습의 효과를 검토할 필요가 있으며, 변동 유형별 적용의 차이가 있는지에 대해서 연구할 필요가 있다.
이 논문은 2023학년도 경북대학교 연구년 교수 연구비에 의하여 연구되었음
Econ. Environ. Geol. 2024; 57(5): 551-562
Published online October 29, 2024 https://doi.org/10.9719/EEG.2024.57.5.551
Copyright © THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY.
Jiho Jeong, Jina Jeong*
Department of Geology, Kyungpook National University, Daegu, Republic of Korea
Correspondence to:*jeong.j@knu.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
Predicting groundwater levels with data-driven models like artificial neural networks typically requires a substantial amount of data. However, when groundwater monitoring wells are newly developed or when a significant portion of the data is invalid (for example, due to missing values or outliers), acquiring an adequate dataset for training prediction models becomes challenging, leading to diminished prediction accuracy. This study proposes a method based on transfer learning to address the issue of insufficient training data. The Gated Recurrent Unit (GRU) was used as the primary data-driven model for predictions. A GRU-based pretrained network for the transfer learning process was developed using groundwater level and corresponding rainfall data collected from 89 monitoring stations nationwide. Subsequently, this pretrained network was fine-tuned using a small amount of training data obtained from the target monitoring well to develop the final prediction model. To verify the effectiveness of the transfer learning algorithm, two different groundwater level prediction models were evaluated: 1) a GRU-based model trained with insufficient data from the target well, and 2) a GRU-based model utilizing the transfer learning algorithm. Comparative verification was conducted with groundwater level data obtained from wells at two different locations, where the model using the transfer learning algorithm demonstrated superior performance compared to the other. This study confirms that the transfer learning algorithm can significantly enhance the performance of groundwater level prediction models, irrespective of the amount of available training data.
Keywords groundwater level prediction, precipitation, gated recurrent unit, training data deficiency problem, transfer learning
정지호 · 정진아*
경북대학교 지질학과
인공신경망과 같은 데이터 기반 모델을 활용하여 지하수위를 예측하기 위해서는 일반적으로 충분한 양의 데이터가 필요하다. 그러나 지하수위 모니터링 관정이 새로 개발되거나 유효하지 않은 데이터(예를 들어, 결측치 또는 이상치)가 다수 관찰되는 경우, 예측 모델을 적절히 학습하기 위한 데이터셋을 확보하기가 어려우며, 이는 예측 정확도의 저하로 이어진다. 본 연구에서는 이러한 학습 데이터 부족 문제를 해결하기 위해 전이 학습(Transfer Learning)을 기반으로 하는 방법을 제안하였다. 게이트 순환유닛(Gated Recurrent Unit, GRU)을 예측을 위한 기본 데이터 기반 모델로 사용하였다. 전이학습 과정을 위한 GRU 기반 사전학습 네트워크(Pretrained network)는 국내 전역의 89개 모니터링 지점에서 수집된 지하수위 및 이에 대응하는 강우 데이터를 활용하여 개발되었다. 그 후, 타겟 모니터링 관정에서 확보된 소량의 학습 데이터를 사용하여 사전 학습된 네트워크에 대한 미세 조정(Fine-tuning) 을 통해 최종 예측 모델을 개발하였다. 전이학습 알고리즘의 효과를 검증하기 위해 두 가지 서로 다른 지하수위 예측 모델을 비교 평가하였다: 1) 타겟 관정의 불충분한 데이터를 사용하여 학습된 GRU 기반 지하수위 예측 모델 및2)전이학습 알고리즘을 기반으로 한 GRU 기반 예측 모델. 두 개의 다른 위치에 존재하는 관정에서 획득한 지하수위 자료에 대한 비교 검증이 이루어졌으며, 전이학습 알고리즘을 활용한 모델이 다른 모델에 비해 우수한 성능을 보였다. 이를 통해 사용 가능한 학습 데이터의 양에 상관없이 전이학습 알고리즘이 지하수위 예측 모델 성능 향상에 크게 기여할 수 있음을 확인하였다.
주요어 지하수위 예측, 강수량, 게이트 순환 유닛, 학습자료 부족, 전이학습
The data-driven groundwater level was estimated using precipitation data.
Transfer learning (TL) was employed to solve the training data deficiency problem.
Comparative validation of two estimation models showed the effectiveness of TL.
Data from other monitoring stations were used to develop the pretraining model.
The estimation accuracy of the model that employed TL was highly improved.
대부분의 국가에서는 적절한 지하수 자원 관리를 위해전국적인 모니터링 시스템 네트워크를 구축하여 지하수수위를 모니터링하고 있다(IGRAC, 2020). 이러한 노력의 일환으로, 국내 또한 여러 국가 기관에서 국가 지하수 관측망, 농촌 지하수 관리망, 그리고 해수 침투 관측망 등을 운영하고 있으며, 이러한 네트워크를 통해 지하수의 수량 및 수질에 관한 실시간 모니터링 데이터가 축적되고 있다.
지하수위 시계열 자료는 기상 현상이나 지하수 개발과같은 자연적 또는 인위적 사건에 의해 발생하는 다양한독립적인 수문학적 스트레스의 결과로 관측되는 자료이다. 따라서 지하수위 변화를 해석함으로써 대수층의 건전성에 대한 정보를 얻을 수 있고, 이로써 적절한 시기에 필요한 선제적 조치를 취할 수 있다. 지하수위 저하에 대한 조기 경보는 지하수 수량 관리에서 가장 비용효율적인 조치이며, 이를 위해서는 지하수위 예측이 필수이다(Cuthbert, 2010, Jeong and Park, 2017, Jeong et al., 2018, Mirarabi et al., 2019, Sun et al., 2022, Pham et al., 2022, Tao et al., 2022). 지하수위 예측 결과는 실제 모니터링 데이터와 비교하여 예상치 못한 요인으로 인한 대수층 시스템의 이상 정보를 제공하기도 한다(Zhang et al., 2018, Jeong and Park, 2019). 따라서 실제 지하수위변화를 예측하는 모델 개발은 지하수 시스템을 효과적으로 모니터링하는 데 핵심요소로 작용할 수 있다.
지하수위 예측 모델은 물리 기반 모델(physically-based model)과 데이터 기반 모델(data-driven model)로 분류할수 있다(Robert et al., 2017). 물리 기반 모델에서는 지하수의 수리학적 거동을 설명하는 편미분 방정식이 일반적으로 이용된다(Buck-Sorlin, 2013). 반면, 데이터 기반 모델은 시계열 데이터의 현상학적 패턴을 활용하는 선형또는 비선형 다변량 회귀 분석으로, 개발된 최종 모델을통해 물리적인 현상을 해석하는 데 어려움이 있다. 그러나 데이터 기반 모델은 물리 기반 모델에 비하여 보다다양한 외부 요인을 제약없이 모델 개발에 고려할 수 있다는 장점이 존재한다. 이러한 이유로, 데이터 기반 모델의 일종인 인공신경망(Artificial Neural Netowrk, ANN) 기반의 데이터 기반 모델이 지난 20년 동안 광범위하게활용되어 왔다(Maier and Dandy, 1996, Coulibaly et al., 2001, Altunkaynak, 2007, Young et al., 2015, Wunsch et al., 2018, Yoon et al., 2011, Jeong and Park, 2019, Tao et al., 2022). 최근에는 순환신경망(Recurrent Neural Network, RNN)이라는 ANN 기반 딥러닝 알고리즘이 지하수위 예측에 주로 활용되고 있다.
Coulibaly et al. (2001)은 간단한 RNN을 지하수위 예측에 성공적으로 적용하였으며, 외생 변수로 강우량과 강수위 등을 고려하여 지하수위 변동 패턴을 추정한 바 있다. Jeong and Park (2019)은 불포화대에서의 강우의 침투 지연을 고려한 지하수위 변동 예측을 위하여 RNN의일종인 장단기 메모리(Long Short-Term Memory, LSTM)를 적용한 바 있다. 이러한 연구들은 ANN 기반의 알고리즘이 지하수위를 적절히 예측함으로써 지하수량의 단기 및 장기 추세를 이해하는 데 가치 있는 정보를 제공할 수 있음을 보여주고 있다.
여러 연구들에서 다양한 외생 요인을 고려한 ANN 기반 알고리즘이 지하수위 예측에 효과적으로 적용될 수있음을 보여주었으나, 모델을 학습하기 위해서는 장기간의 시계열 데이터가 필수이다(Wen et al., 2022). 짧은 기간의 학습 데이터의 경우, 지하수위 추정 모델을 개발하는 데 필요한 관련 사전 통계 정보가 모델의 정확성을만족시키기에 충분하지 않을 수 있다. 대부분의 이전 연구에서는 일단위 지하수위 시계열 데이터를 2년 이상 사용하여 모델 네트워크를 학습시켰다(Tao et al., 2022). 예를 들어, Kisi and Shiri (2012)와 Kombo et al. (2020)은각각 7년과 2년의 일일 데이터(2,600 및 759개 데이터 포인트)를 사용하여 지하수위를 예측 한 바 있으며, 이러한연구들은 모델의 충분한 학습을 위해 대량의 학습 데이터가 필요하다는 것을 보여준다. 그러나 모니터링 관정이 최근 개발되었거나 관측된 시계열 데이터에 대규모연속 결측 데이터 또는 이상치가 포함된 경우, 상대적으로 적은 데이터셋으로 데이터 기반 모델을 학습해야 하는 경우가 빈번하게 발생한다. 이러한 경우, 데이터 기반예측 모델의 성능 저하 문제가 발생할 수 있으나, 이러한 문제를 해결하기 위한 연구는 제한적으로 수행되었다.
본 연구에서는 상대적으로 적은 학습 데이터셋을 사용하여 지하수위 예측 모델의 네트워크를 학습하기 위한효율적인 방법으로 전이 학습(Transfer Learning)을 적용하는 방법을 제안하였다. 전이학습은 관심 학습 데이터셋과 수문학적으로 유사하지만 다른 출처에서 얻은 학습데이터셋의 지식을 데이터가 부족한 모델 네트워크로 전이하는 데이터 과학(Data Science) 기술 중 하나이다. 본연구에서는 전이학습을 적용할 기본 데이터 기반 모델로 RNN 모델의 일종인 게이트 순환 유닛(Gated Recurrent Unit, GRU; Cho et al., 2014)을 이용하였다. 제안된 방법의 우수성은 한국수자원공사에서 운영하는 국가지하수관측망(Integrated Ground Water Information Service, GIMS)과 기상청의 자동기상관측시스템(Automatic Weather System, AWS)에서 확인할 수 있는 89개 관측소에서 수집된 실제 지하수위 및 강우 시계열 데이터를 통해 검증되었다.
데이터의 양과 질은 데이터 기반 모델의 학습 성능을결정하는 중요한 요소이나, 데이터 수집에는 상당한 비용과 시간이 필요하며 종종 최소한의 데이터만 가용할수 있다. 또한, 지하수위 시계열 데이터에는 많은 결측치나 이상치가 포함될 수 있다(Marchant and Bloomfield, 2018, Peterson and Western, 2018). 이러한 요인들이 데이터 기반 모델의 학습 성능을 저하시키는 요인이 된다.특히, 새롭게 개발된 모니터링 관정의 경우에는 데이터기반 지하수위 예측 모델을 학습시키기 위한 충분한 데이터를 확보하는 것이 불가능하다. 그러나 예측 모델의개발은 해당 관정 또한 필요하다. 따라서 본 연구에서는학습 데이터가 부족한 경우 모델의 예측 정확도를 향상시키기 위해 전이 학습을 적용하였다.
전이 학습은 데이터 부족 문제를 극복하기 위해 개발된 대표적인 기술로, 많은 양의 데이터가 확보된 source task(
예를 들어, 불포화대의 깊이와 이를 구성하고 있는 지질 매질은 침투된 강수가 함양될 때 까지 걸리는 지연시간에 큰 영향을 미치며, 이는 지하수위 예측 모델이 각대수층에 대하여 독립적으로 개발되어야 함을 의미한다.따라서 source task에서 학습된
제안된 방법의 성능 검증을 위해 참조 테스트 케이스가 설정되었으며, 전이학습을 활용한 지하수위 예측 모델과의 성능비교가 이루어졌다. 본 연구에서는 다음의 두가지 모델을 개발하였다: M1) 특정 target 모니터링 지점의 데이터를 이용하여 모델을 학습하는 경우(즉,
위 두 가지 지하수위 예측 모델을 개발하기 위한 네트워크 구조는 Fig. 1과 같다. 두 모델 모두 GRU를 모델 학습을 위한 기본 네트워크로 사용하였다. GRU 모델은입력변수의 이전 시퀀스 정보를 네트워크의 내부 상태에유지함으로써 데이터의 초기 부분으로부터 정보 손실 없이 데이터 시퀀스에 대한 의존성을 통합할 수 있다. 또한, GRU는 다른 유형의 RNN 모델에 비해 학습에 필요한 가중치 수가 상대적으로 적어, 데이터의 양이 적고 빈도가 낮은 특정 데이터셋에 더 나은 성능을 보이는 것으로 알려져 있다(Pan et al., 2020, Yu et al., 2021, Xu et al., 2021, Gharehbaghi et al., 2022, Li et al., 2022). GRU네트워크에 대한 보다 세부적인 사항은 Cho et al., (2014)를 참조할 수 있다. GRU 네트워크의 일반적인 학습 과정을 기반으로, M1 모델은 target 모니터링 관정의 불충분한 데이터셋(Fig. 1(a)의 target task의 데이터셋)을 사용하여 개발되었다.
전이학습 기술을 적용한 지하수위 예측 모델의 네트워크는 Fig. 1(b)와 같다. P1과정은 모든 모니터링 관정에서 획득한 source task의 데이터셋으로 사전 학습된 지하수위 예측 모델(백본 모델)을 만드는 과정이며, 백본 모델의 파라미터를 추가로 부착된 완전 연결층(fully connected layer)을 통해 미세 조정하는 과정은 P2과정에서 target task의 데이터셋을 이용하여 수행되었다. 모든 모델에 대해
본 연구에서 제안된 모델은 국내 전역에서의 모니터링을 통해 얻은 시계열 데이터(지하수위 및 강우량)에 적용되었다(Fig. 2). 지하수위 데이터는 지하수 수량 및 수질 관리를 위해 1995년부터 한국수자원공사가 관리해 온모니터링 시스템 네트워크인 GIMS로부터 확보하였다.총 668개의 모니터링 지점이 운영 중이며, 자동으로 모니터링된 지하수위 데이터는 매시간 GIMS(https://www.gims.or.kr)로 전송 및 관리된다. 한국수자원 공사는지하수 시스템의 보전을 위해 '국가 지하수 관리 기본계획(2017–2026)'을 시행하면서 새로운 모니터링 지점을 개발하고 있으며, 2019년 이후 38개의 신규 모니터링 지점이 추가로 생성되었다. 개발 연도에 따른 운영 중인 모니터링 지점은 Fig. 2(a)에 나타나 있다. 지하수위 데이터에 대응하는 일 단위 강수량 데이터는 가장 근거리에 위치한 기상관측소에서 수집되었으며, 이는 국내 기상청에서 운영중인 ASOS(https://data.kma.go.kr/cmmn/main.do)에서 획득하였다.
시계열 지하수위 모니터링 데이터에는 다양한 예상치못한 요인으로 인해 일반적으로 이상치가 포함된다. 예를 들어, 모니터링 장비의 오작동이나 대수층 시스템의갑작스러운 자연적 변화로 인해 발생하는 데이터를 모델학습에 이용할 경우, 해당 결과의 신뢰성이 저하될 수 있다. 따라서 원시 데이터의 전처리는 모델 성능을 향상시키는 데 필수이다. 본 연구에서는 먼저 사분위 범위(Interquartile range) 방법(Mood, 1950)을 사용하여 이상치를 식별하고, 이동 평균 선형 보간법(Moving average linear interpolation)을 사용하여 해당 값들을 대체하였다.보간된 데이터 값이 모델의 학습 성능 저하에 영향을 미칠 수 있으나, 본 연구에서는 결측 데이터로 인하여 발생하는 학습 자료 손실(특히, 순환 신경망이 장기 시퀀스자료를 입력자료로 활용하기 때문)을 방지하고자 하였다.본 연구에서는 이용된 관정 중, 한 개의 관정(Fig. 2(b)에서 C2)에서 학습자료에 대한 7일 단기 결측이 발생 및보간이 이루어졌다. 강수량 데이터에 결측치가 있는 경우 해당 지하수위 및 강수량 데이터는 모델 학습에서 제외하였다. 더불어 모든 데이터는 0–1 범위로 정규화되어,학습된 모델이 상대적으로 큰 값을 갖는 입력 데이터에치우치지 않도록 하였다.
전처리 과정을 거친 후, 총 89개의 지하수위 모니터링관정에서 획득한 데이터가 GRU 기반 사전 모델을 학습하는 데 사용되었다. 해당 관정의 위치는 Fig. 2(b)에 표시되었다. 그림에서 파란색 십자 기호로 나타난 지점은적용된 지하수위 데이터를 획득한 관정과 가장 가까운강수 모니터링 지점을 보여주며, 이는 모델의 입력 변수로 사용되었다. 모든 지하수위 및 강우량 모니터링 데이터에 일일 평균 시계열 데이터가 적용되었다. 본 연구에서 제안된 방법의 성능을 검증하기 위해 이용된 지하수위 모니터링 관정(C1 및 C2)의 위치는 Fig. 2(b)에 별 모양으로 표시되었다. 89개의 관정 데이터를 이용하여 학습된 사전모델이 강수와 지하수위 간의 일반적 관계성을가지며, 이를 기반으로 전이학습이 작동함을 확인하기 위해서는 다양한 강수-지하수위 반응 패턴이 예측될 수 있음이 확인되어야 한다. 가능한 다양한 패턴에 대한 검증이 필요하나, 본 연구에서는 제안된 방법의 적용 가능성을 제시하기 위한 목적으로 강수에 대한 지하수위 반응패턴이 매우 상이한 두 지점의 자료를 선택 및 검증자료로 활용하였다.
개발된 두 가지 모델의 예측 정확도는 C1 및 C2 지점(Fig. 2(b))에서 관찰된 실제 지하수위 변동 패턴을 기준으로 평가되었다. 강수량과 이에 반응하는 지하수위의 실제 변동 패턴은 Fig. 3과 같다. C1 관정 위치는 자갈과모래가 혼합된 토양층(지표면에서 4.0m 깊이까지)과 풍화암층(4.0m에서 22.2m 깊이까지)으로 구성되어 있다. 지하수위는 지표면에서 6.2m 깊이에 위치하고 있어 불포화대가 두꺼움에도 불구하고 불투수층(예: 점토층)의 방해없이 비교적 효과적으로 강수가 침투 및 함양되고 있다.또한 포화대가 자갈과 모래로 구성된 높은 투수성을 갖고 있기 때문에 포화대의 투수성이 비교적 높으며, 이로인해 지하수위 변동 패턴은 C2 지점에 비해 강수량 패턴에 더 빠르게 반응하는 것으로 나타난다. 이는 포화대에서의 빠른 유속과 높은 유체 흐름 속도에 기인한 결과이다.
C2 관정 위치의 구성 매질은 C1 관정과 조성 측면에서 유사하지만(모래가 혼합된 자갈과 풍화암층), 지하수위의 깊이가 지표면에서 38.11m로 매우 깊기 때문에 강수 사건과 침투된 강수가 함양되는 데 까지 시간 지연이발생할 수 있다. 이러한 측면은 Fig. 3(b)에서 강수 사건이후 지하수위의 느린 상승 및 하강 패턴으로 관찰된다. C1 관정과 C2 관정에 대해 각각 10년 및 9년의 시계열데이터가 이용 가능하였으며, C1 지점의 경우 예측 모델학습을 위해 360일의 데이터가 사용되었으며, C2 지점의경우 460일의 데이터가 모델 학습에 이용되었다(Fig. 3(a)및 3(b)에서 파란색 사각형으로 표시된 기간).
모델의 성능은 실제 지하수위와 예측된 지하수위 간의평균 제곱근 오차(Root Mean Squared Error, RMSE)와상관 계수(Correlation Coefficient, CC)를 사용하여 평가되었으며, RMSE는 모델 학습을 위한 목표 함수로 또한활용되었다. 개발된 모델의 최적의 값을 얻기 위해 다양한 네트워크 구조를 체계적으로 하이퍼파라미터(Hyper-parameter)를 변화시키며 반복적으로 평가했으며, 과적합을 방지하기 위해 각 학습 단계에서 조기 종료(Early Stopping)가 적용되었다. 최종 개발된 예측 모델의 최적하이퍼파라미터는 Table 1에 제시되었다. 본 연구에서는전이학습의 유무가 성능에 어떠한 영향을 미치는지를 평가하기 위하여 M1 및 M2 모델 모두 동일한 네트워크 구조를 활용하여 예측 모델의 복잡도가 동일한 상황을 가정 및 성능을 비교 검증하였다.
Table 1 . Hyperparameters used for developing the two groundwater level estimation models for C1 and C2 monitoring stations.
C1/C2 | Timesteps ( | Number of features in the hidden state | Number of recurrent layers | Activation function for fully connected neural network (FCNN) |
---|---|---|---|---|
M1 | 60 | 30 | 2 | tanh |
M2 | 60 | 30 | 2 | tanh |
모델 M1 및 M2의 지하수위 예측 결과는 각각 Figs. 4(a) 및 4(b)에 있다. 우기에 대하여 모델 M1을 통해 추정된지하수위 변동(빨간색 실선) 패턴은 실제와 유사하게 나타난다. 그러나 M1은 건기 동안의 실제 지하수위(검은색점)의 최저수위를 적절히 모사하지 못한다(Fig. 4(a)). 이는 지하수위 감소 패턴에 대한 정보를 제공하는 학습 데이터가 부족하기 때문이다. 학습에 이용된 2005년의 최저 지하수위가 2006년에서 2009년 동안 보여준 최저 지하수위 보다 높게 나타나고 있어, 테스트 기간 동안의 낮은 지하수위를 예측하는 데 어려움이 있는 것으로 보인다. 한편, source task에서 학습된 백본 모델에 전이학습을 적용한 M2 모델은 실제 지하수위와 높은 상관관계의예측결과를 보였으며, M1 모델이 모사하지 못한 지하수위 최저수위 또한 보다 정확하게 추정하고 있음을 확인할 수 있다.
제안된 M2 모델의 비교적 높은 성능은 Fig. 5에 나타난 실제 지하수위와 모델 예측 지하수위 간의 산점도를통해 추가적으로 확인할 수 있다. 그림에서 x축과 y축은각각 예측된 지하수위와 실제 지하수위를 나타내며, 점선 빨간색 선은 실제값과 예측값 간의 1:1 대응을 나타낸다. 모든 모델의 산점도를 비교하였을 때, M1 모델은실제값에 대하여 다소 과대추정(특히, 낮은 값에 대하여) 양상을 보였다. 한편, M2 모델에서 추정된 대부분의 값들은 1:1 대응선에 근접해 있어, 예측된 지하수위와 실제지하수위 간의 일치도가 높음을 알 수 있다. 결과에 대한 보다 정량적인 평가는 Table 2에 제시되었다. 표에서보는 바와 같이 M2 모델에 대한 결과가 비교적 높은 CC값(0.6389)와 낮은 RMSE 값(0.2261 m)을 보임을 통해전이학습 기술이 지하수위 예측 성능 향상에 효과적으로적용될 수 있음을 확인할 수 있다.
Table 2 . Correlation coefficient (CC) and root mean squared error (RMSE) between the actual and estimated groundwater levels for the two different models..
M1 | M2 | |
C1 | ||
CC | 0.6029 | 0.6389 |
RMSE (m) | 0.2433 | 0.2261 |
C2 | ||
CC | 0.6543 | 0.8969 |
RMSE (m) | 2.2336 | 0.8186 |
C2 관정의 데이터셋에 대하여 개발된 모델들의 지하수위 예측 결과는 Fig. 6와 같다 target task 데이터만을 기반으로 학습된 M1 모델의 성능은 C1에 대한 결과에 비해 크게 저하되었다. 특히, C2 관정에서의 연간 지하수위 변동폭이 상당히 크며(약 5m 이상, 이는 C1 지점의변동폭인 약 2m보다 큼), 건기 동안의 낮은 지하수위 값을 포함한 학습 데이터가 있음에도 불구하고 M1 모델로는 이러한 변동을 제대로 표현하기 어려운 것으로 나타났다. 이에 비해 M2 모델은 C2 관정에서의 지하수위 변동 패턴을 적절하게 예측하고 있다(Fig. 6(c)). 특히, 백본모델을 미세 조정하기 위해 적은 양(C1 360일 및 C2 460일)의 지하수위 변동 패턴만을 적용했음에도 불구하고, M2 모델이 실제 지하수위의 높은 수위에서의 부드러운변동 패턴을 잘 표현하고 있다.
두 모델의 실제 지하수위와 예측 지하수위 간의 산점도는 Fig. 7에 나타나 있으며, M2 모델의 우수성을 명확하게 보여준다. 모델들의 정량적 성능 검증 결과는 Table 2에 제시되어 있으며, 이 중, M2 모델은 가장 높은 CC 값(0.8969)과 가장 낮은 RMSE 값(0.8186m)을 보여주었다.한편, M1 모델의 CC 값은 0.6543로, 다소 과대 추정하는 결과를 보여주었다(Fig. 7(a)). 또한 해당 모델의 RMSE는 2.2336m 로, M2 모델보다 약 두 배 높은 값을 보였다. 종합적으로, 이 결과는 전이 학습을 활용한 제안된예측 방법이 데이터 기반 모델의 학습 데이터가 불충분할 때 효과적으로 적용될 수 있음을 나타낸다. 따라서 지하수 수량 감시 및 관리를 위해 새롭게 개발된 모니터링지점에 대해서도 보다 정확한 데이터 기반 지하수위 예측 모델을 개발할 수 있다는 가능성을 본 연구를 통해확인할 수 있었다.
기상 조건의 변화에 따른 지하수위 예측은 지속 가능한 지하수 자원 관리에 있어 매우 중요하다. ANN 기반의 딥러닝 알고리즘은 지하수위 예측 모델을 개발하는데 널리 활용되어 왔으나 딥러닝 알고리즘은 예측 모델을 개발하기 위해 충분한 학습 데이터를 필요로 하며, 이는 학습 데이터가 부족하거나 유효하지 않은 데이터가많이 포함된 경우에 중요한 제약이 될 수 있다. 전이 학습은 이러한 학습 데이터 부족 문제를 해결하는 효과적인 솔루션이 될 수 있다. 따라서 본 연구에서는 전이학습의 효과를 검증하기 위해 짧은 기간에 해당하는 자료만을 학습에 적용할 수 있다는 가정을 바탕으로 전이학습이 활용된 모델과 이용하지 않은 모델을 개발 및 이들의 성능을 비교 평가하였다.
실제 지하수위 및 강수량 모니터링 데이터는 전이학습과정의 사전 학습 네트워크를 개발하는 데 사용되었으며,이는 한국의 89개의 지하수위 및 강수량 모니터링 지점에서 수집 및 연구에 이용되었다. 서로 다른 지하수위 변동 패턴을 보이는 두 개의 지점에서의 데이터가 검증에이용되었다. 그 결과, 전이학습을 적용한 예측 모델이target task 관정에서의 소량의 학습 데이터를 사용하였음에도 우수한 예측 성능을 보이는 것을 확인하였다. 이는 전이학습 과정이 지하수위 패턴과 강수량 간의 관계에대한 사전 학습 모델의 정보를 효과적으로 전이하여 목표 문제를 해결할 수 있음을 보여주며, 본 연구에서 제안된 방법을 기반으로, 가용 시계열 데이터 기간에 제약없이 보다 정확한 지하수위 예측 모델을 효과적으로 개발할 수 있음을 보여준다. 그러나 본 연구에서 제안한 방법은 단일 유형의 데이터를 입력 변수로 사용하는 경우에 대해서만 검증이 이루어짐에 따라 지하수위 예측에더 많은 외부 요인(예: 지하수 펌핑)이 통합될 수 있도록제안된 방법이 확장될 필요가 있다. 또한 본 연구에 이용된 관정 외, 다른 지하수위 변동 패턴을 가지는 자료에 전이학습의 효과를 검토할 필요가 있으며, 변동 유형별 적용의 차이가 있는지에 대해서 연구할 필요가 있다.
이 논문은 2023학년도 경북대학교 연구년 교수 연구비에 의하여 연구되었음
Table 1 . Hyperparameters used for developing the two groundwater level estimation models for C1 and C2 monitoring stations.
C1/C2 | Timesteps ( | Number of features in the hidden state | Number of recurrent layers | Activation function for fully connected neural network (FCNN) |
---|---|---|---|---|
M1 | 60 | 30 | 2 | tanh |
M2 | 60 | 30 | 2 | tanh |
Table 2 . Correlation coefficient (CC) and root mean squared error (RMSE) between the actual and estimated groundwater levels for the two different models..
M1 | M2 | |
C1 | ||
CC | 0.6029 | 0.6389 |
RMSE (m) | 0.2433 | 0.2261 |
C2 | ||
CC | 0.6543 | 0.8969 |
RMSE (m) | 2.2336 | 0.8186 |
Byeong-Hak Park, Won-Tak Joun, Seoung-Wook Ha, Yongcheol Kim, Hanna Choi
Econ. Environ. Geol. 2022; 55(1): 97-109Junghae Choi
Econ. Environ. Geol. 2017; 50(6): 509-515The Oxidation of Chalcopyrite and Geochemical Behavior of Heavy Metals in the Manjang Cu Mine
Pyeong-Koo Lee, In-Gyeong Lee, Sang-Hoon Choi and Ji-soo Kim
Econ. Environ. Geol. 2004; 37(3): 291-301