Econ. Environ. Geol. 2024; 57(5): 487-497
Published online October 29, 2024
https://doi.org/10.9719/EEG.2024.57.5.487
© THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY
Correspondence to : *hjung@cnu.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
Pore-scale reactive transport modeling is a powerful tool used to analyze micro-scale processes where fluid flow and geochemical reactions occur. Despite its capability to examine complex hydrological and geochemical system behavior, the high computational demands for these simulations present a significant limitation. To overcome this challenge, this study evaluated artificial neural network (ANN)-based surrogate models to replace geochemical reaction calculations, which consume the majority of computational time in reactive transport simulations. The study considered two ANN models: a combined model (CM) that simultaneously accounts for mineral dissolution/precipitation and solute adsorption reactions, and an independent model (IM) that treats these reactions independently. The performance of these models was compared using metrics, including mean squared error (MSE), coefficient of determination (R2), and mass balance errors. Results indicate that IM demonstrates superior accuracy compared to CM. This finding suggests that instead of constructing a single complex model for the entire geochemical reaction network, pore-scale geochemical reactions can be effectively replaced by combining individual neural network models trained for specific reactions.
Keywords geochemical reactions, artificial neural network, surrogate model, reactive transport, pore scale
김예훈1 · 김호림2 · 정희원1,3,*
1충남대학교 지구환경·우주융합과학과
2한국지질자원연구원
3충남대학교 지질환경과학과
공극 규모 반응성 운송 모델링은 유체 유동과 지화학 반응의 결합이 일어나는 마이크로미터 수준의 프로세스 분석을 수행하는 연구 기법이다. 이는 지질매체 내에서 일어나는 복잡한 물질 거동을 정밀하게 고찰할 수 있게 하는 강력한 연구 기법이지만, 매우 높은 연산 자원이 필요하다는 한계가 존재한다. 이러한 한계를 극복하기 위하여, 본 연구에서는 반응성 운송 모델링에서 대부분의 연산 자원을 소모하는 지화학 반응을 대체하는 인공신경망 기반의 대리모형을 개발하였다. 공극 규모에서는 광물의 공간적 분포에 따라 독립적 지화학 반응 연산을 수행한다는 점에 착안하여 본 연구에서는 광물의 용해/침전과 용질의 흡착 반응을 동시에 고려하는 통합모형(CM)과 독립적으로 고려하는 독립모형(IM)의 두 가지 대리모형의 정확성과 효율을 비교하였다.평균 제곱 오차(MSE), 결정 계수(R2), 질량 균형 오차(mass balance error) 등의 지표를 통해 모형들을 비교한 결과, 통합모형은 공극 규모에서 발생하는 순차적 반응에서 성능이 저하된 반면, 독립모형은 같은 조건에서도 높은 정확도를 유지하며 복잡한 지화학 반응을 효과적으로 처리하였다. 이 결과는 지화학 반응 대리모형 구축에 있어, 복잡한 지화학 반응 네트워크를 포괄하는 단일모형을 매번 새롭게 구축할 필요 없이, 개별 지화학 반응을 학습한 신경망 모형의 합성을 통하여 공극 규모의 지화학 반응을 대체할 수 있을 것으로 기대된다.
주요어 지화학 반응, 인공신경망, 대리모형, 반응성 운송, 공극 규모
Two artificial neural networks were evaluated to replace geochemical calculations in pore scale reactive transport simulations.
ANN model with separated geochemical reactions outperforms integrated approach.
반응성 운송 모델링은 유체 유동, 용존물질 이동, 그리고 생지구화학적 반응 기작들 간의 상호작용을 통합적으로 이해하는 데 활용되는 중요한 계산 기법이다. 이 모델링 기법은 지질학적 시간 규모(MacQuarrie and Mayer, 2005) 및 킬로미터 규모의 지질학적 형성 과정 연구(Gabellone et al. 2016)부터, 공극 규모 내의 미세 이질성이 생지화학적 반응과 오염물질 분해 효율성에 미치는영향을 분석하는 연구(Gharasoo et al. 2012), 마이크로미터 수준에서 일어나는 유체 유동과 지화학 반응의 연계특성을 이해하는 등의 공극 규모의 연구(Molins et al. 2012), 그리고 해수 화학 변화에 따른 돌로마이트화 연구(Gabellone et al. 2016)와 같이 다양한 공간 및 시간 규모에 걸쳐 자연 환경의 동적 과정을 해석하고 예측하는데 광범위하게 활용된다(Steefel et al. 2005). 또한, 반응성 운송 모델링은 지구의 중요한 지역 및 지하 환경에서의 물과 에너지 문제를 해결하는 연구(Deng et al. 2021) 등에도 활용되고 있다. 그러나 반응성 운송 모델링은 동력학 및 열역학적 지화학 반응 계산의 복잡성으로 인해매우 높은 계산 비용이 요구된다는 점이 주요한 한계로남아있다(Steefel and MacQuarrie, 1996, Molins and Knabner 2019).
전통적인 반응성 운송 모델링은 각 공간 요소 및 시간단계에서 반복적인 지화학 반응 계산을 수행한다. 이러한 연산 특성, 특히 반응 속도가 느린 지화학 반응의 경우, 유사한 입력 조건에 대한 중복적인 연산이 수행되는등 불필요한 계산 비용이 발생한다. 또한 다성분계의 열역학적 평형 연산과 동력학적 연산의 복합적 수행으로인해 연산 안정성이 떨어지는 점 또한 반응성 운송 모형의 연산 효율을 저해하는 요소로 작용한다. 반응성 운송모델링의 연산 효율을 개선하기 위한 시도로 최근 대리모형을 이용하여 지화학 반응 연산을 대체하려는 시도들이 활발하게 이루어지고 있다. Jatnieks et al. (2016)은 BRNN(Bayesian Regularized Neural Networks), QRNN(Quantile Regression Neural Network) 등을 기반으로 한 대리모형을 비교하여 반응성 운송 모델링의 지구화학적시뮬레이션을 대체하고 계산 시간을 최대 140배까지 단축할 수 있음을 보였다. Zhou et al. (2018)은 적응형 크리깅 기반 대리모형을 활용하여 반응성 운송 모형에서수리적 및 생화학적 매개변수의 추정을 효율적으로 수행함으로써 전통적인 MCMC(Markov Chain Monte Carlo)방법에 비해 계산 비용을 크게 절감할 수 있음을 보여주었다. 또한, Chen et al. (2021)은 전방 신경망과 역방향 신경망을 결합한 TNNA(Tandem Neural Network Architecture)를 통해 반응성 운송 모델링의 계산 효율성과 정확도를향상시키는 연구도 진행하였고, Laloy and Jacques (2022)는 신경망 및 k-최근접 이웃 기반 대리모형을 활용하여시멘트 시스템에서 반응성 운송 모델링의 계산 비용을줄이는 방법을 제안하였다.
이러한 대부분의 선행 연구들은 연속체 규모(continuum scale)의 반응성 운송 모형에서 이루어져왔다. 각 격자셀마다 평균적 분포로 다성분 지화학 반응물질들의 거동을기술하는 연속체 규모의 모델링의 특성으로 인해, 연속체 규모 모델링에 적용하는 대리모형의 경우 대부분 시뮬레이션 공간 전체를 대표하는 특정 지화학 반응 네트워크를 대체하려는 시도로 나타난다(De Lucia and Kuhn 2021, Demirer et al., 2022). 이에 비해 마이크로미터 수준의 공극에서 나타나는 지화학 반응을 기술하는 반응성운송 모델링의 경우 광물들의 분포에 따라 지화학 반응을 독립적으로 다룬다는 특성이 있다. 예를 들어 방해석경계면에서는 용해-침전 반응이, 바이오필름이 분포하는공극에서는 산화-환원 반응이 우세하게 일어난다(Jung et al. 2023). 이과 같이 지화학 반응을 공간에 따라 독립적으로 처리하는 공극 규모 반응성 운송 모델링은 전체 반응 네트워크가 아닌 개별 지화학 반응을 치환하는 대리모형의 적용 가능성을 의미한다.
이에 본 연구에서는 지화학 반응 네트워크를 동시에 대체하는 통합모형(CM)과 개별 지화학 반응을 독립적으로학습시킨 후 모형을 연결하는 독립모형(IM)을 개발하여 두 대리모형들의 특성과 성능을 비교 평가하였다. 전체지화학 반응 네트워크는 동역학적으로 일어나는(kinetically controlled) 방해석의 용해-침전 반응과 열역학적으로 일어나는 U(VI)의 표면착물화 반응(surface complexation reaction)을 고려하였다. PHREEQC를 활용하여 다양한 환경 조건에서 일어나는 해당 지화학 반응들의 결과에 대한 연산을 수행하였고, 수행 결과는 인공신경망(Artificial Neural Network; ANN) 기반의 통합모형과 독립모형 학습에 활용하였다. 본 연구 결과는 물리 기반 모형의 정확성을 크게 손상시키지 않으면서 공극 규모 반응성 운송 모델링의 연산 속도를 향상시킬 수 있는 기반 기술로활용될 것으로 기대된다.
본 연구에서는 U(VI)의 흡착과 방해석의 용해/침전 반응에 따른 지하수의 수질 변화를 예측할 수 있는 대리모형을 개발하기 위해, 지구화학적 연산 모델로 광범위하게 활용되는 PHREEQC 프로그램을 사용하여 인공신경망 학습 데이터베이스를 구축하였다. PHREEQC(Parkhurst and Appelo 2013)는 미국 지질조사국(USGS)에서 개발한지구화학적 수치 모델링 소프트웨어로 수성 착물화, 표면 흡착, 이온 교환, 광물의 용해/침전, 미생물 반응 등과같은 다양한 지구화학적 반응들에 대한 열역학 및 동력학적 연산을 수행한다.
U(VI)의 흡착을 조절하는 주요 광물은 몬모릴로나이트(montmorillonite)를 선정하였다. 스멕타이트 군에 속하는몬모릴로나이트는 2:1 이중팔면체 구조의 층상규산염 광물로서, 높은 비표면적(~750 m2/g)과 우수한 양이온 교환능력(~1 eq/kg)을 가지고 있어, U(VI)의 흡착에 매우 효과적이다(Tournassat et al. 2018). 지하수의 화학적 조성에 따라 달라지는 U(VI)의 흡착 반응을 모사하기 위하여일반 이중층 모형(generalized two-layer model)에 기반한 표면착물화 모델링을 수행하였다(Table 1).
Table 1 U(VI) surface complexation reactions on montmorillonite and association constants used for Phreeqc modeling (Pabalan and Turner 1997)
방해석의 용해/침전 반응은 광물의 반응속도론 기술에가장 흔하게 사용되는 전이상태이론(Transition State Theory)에 기반한 식 (1)을 통해 계산하였다.
여기서
대리모형의 학습을 위해 다양한 지화학적 특성을 가지는 지하수 수질 성분과 벤토나이트 흡착 조건을 가정하여 PHREEQC 입력 자료를 생성하였다. 입력 자료에는pH, C(IV), Ca, Cl, Na, U(VI), Mcc, Surf_s, Surf_w의 총 9개의 지화학 인자들을 활용하였다. 여기서 Mcc는 방해석의 몰수(mol), Surf_s와 Surf_w는 각각 U(VI)의 흡착이일어나는 강한 흡착면과 약한 흡착면(mol)을 의미한다.임의로 설정한 용질 농도와 흡착면, 방해석 광물량의 최소값과 최대값 사이의 범위에서 무작위로 선정한 총20,000개의 지하수와 벤토나이트 입력 자료를 생성하여PHREEQC를 수행하였다(Table 2). PHREEQC 입력값으로 활용된 9개의 지화학 인자들의 출력값을 추출하여 인공신경망을 훈련시키기 위한 데이터베이스화 하였다.
Table 2 The range of input component values used for PHREEQC calculations
Parameters | Min. | Max. | Mean | Std | Unit |
---|---|---|---|---|---|
pH | 6 | 11 | 8.46 | 1.45 | mol/kg |
C(IV) | 5.00E-04 | 2.00E-03 | 1.25E-03 | 2.88E-04 | |
Ca | 1.00E-04 | 5.00E-04 | 3.00E-04 | 1.16E-04 | |
Cl | 3.00E-05 | 9.00E-05 | 5.98E-05 | 1.74E-05 | |
Na | 5.00E-04 | 1.80E-03 | 1.15E-03 | 3.76E-04 | |
U(VI) | 5.00E-07 | 1.50E-06 | 1.00E-06 | 2.91E-07 | |
Mcc | 1.00E-16 | 1.00E-03 | 5.03E-04 | 2.89E-04 | mol |
surf_s | 1.00E-16 | 1.00E-03 | 4.97E-04 | 2.88E-04 | |
surf_w | 1.50E-16 | 1.50E-03 | 7.45E-04 | 4.32E-04 |
프로세스 기반 모형인 PHREEQC의 입출력 값을 기반으로 지화학 모형을 대체할 수 있는 인공신경망 기반 대리모형들을 구축하였다(Table 3). 먼저 방해석의 용해-침전과 U(VI)의 표면착물화 반응을 동시에 고려하는 통합모형(CM1과 CM2)은 지하수의 화학성을 지시하는 6개의입력값(pH, C, Ca, Cl, Na, U)과 고체반응특성을 결정하는 3개의 입력값(Mcc, Surf_s, Surf_w)의 총 9개의 변수를 가진 입력층으로 구성되었다. 통합모형을 구성하는 두 개의 은닉층은 각각 100개의 뉴런으로 구성되었으며 연산결과로는 6개의 지하수 성분과 8개의 고체반응(용해-침전 및 흡착)결과를 출력한다. 독립모형은 용해-침전 반응과 표면착물화 반응을 독립적으로 처리하는 두 개의하위 인공신경망 IMcc와 IMU의 조합으로 구성하였다(Figure 1). 방해석의 용해-침전 반응 연산을 수행하는IMcc는 6개의 지하수 특성과 1개의 방해석량(Mcc)을 입력변수로 활용하고, 동일한 종류의 출력변수들은 1개의은닉층과 15개의 뉴런을 통해 계산하였다. IMU는 U(VI)의 흡착 반응에 대한 연산을 수행하고, 6개의 지하수 특성과 2개의 흡착반응변수(Surf_s, Surf_w)를 입력값으로한다. IMU는 각 은닉층 마다 50개씩 있는 은닉층의 뉴런과 입력변수의 조합을 통해 총 13개(6개 지하수 화학반응결과, 7개 흡착반응결과)의 출력값을 계산한다.
Table 3 The input and output variables of each ANN model
PHREEQC를 통해 생성된 총 20,000개의 입출력 데이터베이스 중 CM1, IMcc, IMU 모형은 각각 10,000개 자료를 활용하여 훈련하였다. 실제 공극 규모 반응성 운송모형에서 IMcc와 IMU의 경우 광물의 공간 분포에 따른독립적인 적용(IMT = IMcc + IMU)이 이루어지기 때문에대리모형 IMT에는 총 20,000개의 자료가 활용된 것으로볼 수 있다. 따라서 통합독립모형(IMT)과의 정밀한 비교를 위해 CM1과 동일한 구조를 가지면서 20,000개의 자료를 활용하여 훈련한 CM2를 제작하였다. 모든 모형에활용된 자료들 중 검증(validation)과 평가(test)에 각각 500개씩 활용된 자료를 제외한 나머지 자료는 모두 모형 학습에 활용하였다. 인공신경망의 성능을 향상시키기 위해6개의 입력변수(C(IV), Ca, U(VI), Mcc, Surf_s, Surf_w)와 11개의 출력변수(C(IV), Ca, U(VI), Mcc, Surf_sOUO2+, Surf_sOH2+, Surf_sOH, Surf_sO-, Surf_wOUO2+, Surf_wOH, Surf_wO-)는 먼저 로그변환을 거쳤다. 이후 모든 학습 자료는 각 변수들의 평균과 표준편차를 이용하여 표준점수(Z-score)로 변환하는 표준화 과정을 거쳤다. 신경망 학습과정에서 은닉층의 활성함수는 ReLU(Rectified Linear Unit)를 사용하였고, 손실함수로는 평균제곱오차(Mean Squared Error; MSE)를, 최적화에는 학습 과정에서 학습률을 조정하여 신경망 학습을 최적화하는 Adam optimizer를 사용하였고, 이때 초기 학습률에는 0.001을 사용하였다. 학습 주기(epoch)는 IMcc 모형에 50번 IMU 모형에200번 CM 모형에 300번을 사용하였고, 배치의 크기는CM 모형은 50, 정하고 IMcc와 IMU 모형은 100으로 설정하여 학습을 진행하였다. 각 파라미터들은 여러 조합을 무작위로 선택하여 학습을 진행한 후, 계산된 가장 큰MSE 값이 10-4보다 작은 경우를 선정한 결과이다.
학습이 완료된 인공신경망 모형은 평가용 입력 자료를이용하여 인공신경망 모형이 예측한 결과를 PHREEQC계산 결과와 비교하여 인공신경망 대리모형의 성능을 평가하였다. 모형의 성능 평가에는 신경망 모형 검증에 흔하게 사용되는 MSE와 결정 계수(R2) 이외에도 질량 균형 오차를 사용하였다. 질량 균형 오차(mass balance error)는 각 화학 성분의 총량이 반응 전과 후에 일관되게 유지되는지를 확인하는 것으로 식 (2)와 같이 계산한다.
여기서
공극 규모의 격자 셀 단위에서 일어나는 지화학 반응은 유체 격자 셀이 접하는 단종 광물의 종류에 따라 결정된다. 예를 들어, 방해석 표면에서는 용해-침전 반응이주로 나타나고, 몬모릴로나이트로 대표되는 벤토나이트표면에서는 우라늄의 흡착 반응이 주요한 지화학 반응으로 나타난다(Figure 1). 따라서 공극 규모의 반응성 운송모델링에서 지화학 반응을 대체하는 대리모형은 특정 반응 물질이 부재한 조건에서도 지화학 반응을 정확하게계산할 수 있어야 한다. 또한 용질 운송에 따라 반응 물질의 종류가 바뀜에 따라 나타나는 독립적 지화학 반응들에 대한 복합 연산 또한 가능해야한다.
Figure 1에서 설명한 조건에 따라 CM 모형과 IM모형을 비교하기 위해, Figure 2의 작업 흐름을 따라 두 모형의 구조를 일치시켰다. IM 모형은 IMcc의 결과를 다시IMU의 입력 자료로 사용하는 방식으로 설계되었기 때문에 CM 모형도 동일한 순서를 적용하였다. 첫 번째 CM모형의 입력 자료는 방해석의 용해/침전 반응만을 계산하기 위해 원본 자료에서 흡착표면의 값을 거의 0에 가까운 10-15의 값으로 변환한 자료를 사용하였다. 이후, 출력 값으로 얻은 값의 Mcc 값을 다시 10-15로 변환하고 흡착표면의 값은 다시 원본 자료의 흡착표면의 값으로 대체하여 다시 한 번 CM 모형의 입력 자료로 사용하였다.이렇게 얻은 결과를 IM 모형과 비교하였다.
10,000개의 자료를 활용하여 훈련된 인공신경망 대리모형들을 활용한 지화학 반응 예측 결과를 물리기반 모형인 PHREEQC 연산 결과와 비교한 결과, 모든 대리모형들이 우수한 예측성능을 보여주는 것을 확인하였다. 방해석 용해-침전 반응과 U의 표면착물화 반응을 동시에 고려하는 CM1은 모든 지화학 인자들에 대해서 1.26 × 10-4 이하의 MSE와 0.9965 이상의 R2값을 보이고, 특히 pH, C(IV), Ca에 대해서는 매우 높은 R2값을 보인다 (Figure 3).특히 Na, Cl는 모든 모형에 대해 낮은 MSE와 R2을 보이며 5% 이상의 질량 균형 오차가 발생하지 않았다. 지화학 반응의 핵심 변수 Mcc와 U(VI)는 다른 변수들에 비해 다소 낮은 예측 정확도를 보이는데, 특히 U 관련 화학종의 경우 U(VI) 10개, Surf_sUO2+ 2개로 5% 이상의질량균형오차를 보이는 예측값이 관측되었다.
20,000개의 자료를 학습한 CM2는 CM1에 비해 전반적으로 더 높은 지화학 반응 연산 정확도를 보인다 (Figure 4).예를 들어 CM1에서 가장 많은 11개의 질량균형오차를보였던 U(VI)은 CM2에서 2개로 줄었고, MSE와 R2 지표에서도 CM2는 CM1에 비해 전반적으로 향상된 예측성능을 보여준다 (MSE < 10-4, R2 > 0.997). 하지만 낮은농도를 특성으로 하는 U 관련 화학종의 예측값들은 여전히 다른 화학종의 예측값에 비해 낮은 정확도를 보인다.
IM 모형의 두 개의 하위독립모형 중 방해석의 용해-침전 반응만을 학습시킨 하위독립모형 IMcc는 가장 적은 수의 뉴런과 짧은 학습주기, 그리고 큰 배치 크기에도 불구하고 CM1과 CM2의 연산 정확성에 비해 더 뛰어난 성능을 보인다(Figure 5). IMcc 모형에서 정확성이 가장 낮은예측을 보이는 요소는 pH다. 하지만 MSE = 1.07 × 10-5와 R2 = 0.999995로 CM1과 CM2의 pH 예측에 비해 우수한 성능을 보이며, 5% 이상의 질량균형오차를 보이는 예측자료가 나타나지 않는다. 이러한 IMcc 모형의 뛰어난예측 성능은 본 연구에서 고려한 지화학 반응 중 U 흡착 반응 관련 예측이 방해성 반응에 비해 정확성이 떨어진다는 것을 의미한다.
하위독립모형 IMU는 통합모형에서 관측되었던 것과 같이 다른 화학종들에 비해 U(VI)관련 화학종에서 낮은 정확성을 보인다(Figure 6). 그 중에서 가장 낮은 정확도를보인 Surf_wUO2+의 MSE와 R2는 각각 1.79×10-16 과 0.9972의 값을 가진다. IMU는 통합모형에 비해 적은 수의 뉴런으로 통합모형(CM1, CM2)과 비슷한 예측력을 보인다.
U(VI)의 표면착물화 반응은 복수의 흡착표면(surf_s, surf_w)과 UO22+의 비선형적 상호작용을 통해 결정된다(Table 1). 이러한 U(VI)의 거동을 결정하는 다중 성분 지화학적 반응의 높은 비선형성이 U(VI) 화학종의 예측 정확성을 저감시키는 요소로 작용할 수 있음을 나타낸다.또한 U 화학종은 다른 화학종에 비해 낮은 농도를 가지기 때문에, 표준화된 공간에서 발생한 인공신경망의 작은 예측 오차도 실제 U 농도에서는 상대적으로 큰 오차로 나타나 질량 균형 오류에 영향을 미칠 수 있다.
앞서 논의한 공극 규모의 지화학 반응 특성을 고려하여, Figure 7에서는 방해석 용해 반응을 겪은 유체가 몬모릴로나이트의 표면으로 이동하여 우라늄 흡착 반응을순차적으로 겪는 상황(Figures 1 and 2)에 대한 CM2와IMT 대리모형들의 예측 정확성을 평가하였다. 이러한 접근법은 용질의 확산(diffusion) 및 분산(dispersion)에 의한혼합(mixing) 없이 이류(advection)만을 통해 용질운송이 일어나는 상황을 가정한 모델링으로 이해할 수 있다.
CM은 방해석의 용해/침전 반응과 우라늄 흡착 반응을동시에 처리하도록 설계되었다. 하지만 방해석과 몬모릴로나이트 표면작용기가 극미량으로 존재하는 경우에는해당 반응들이 수질에 미치는 영향은 무시할 수 있다. 실제로, 방해석과 두 작용기 모두 10-15 mol의 극미량으로존재하는 상황(CM)과 0 mol로 고려한 상황(IM)이 동일한 PHREEQC 연산 결과를 보인다. 이러한 지화학 반응 특성은 방해석과 표면작용기가 순차적으로 극미량(10-15 mol)으로 존재하는 상황을 가정한 CM과 반응물질이 부재(0 mol)한 IM의 비교 평가를 가능하게 한다.
CM2와 IMT 각각의 대리모형 연산 결과, 두 대리모형모두 우수한 훈련 성능을 보였지만(Figure 4), 공극 규모에서 일어나는 순차적 반응에 대한 CM2의 예측 성능이크게 저하되는 것을 확인할 수 있다(Figure 7). 개별 독립모형(IMcc와 IMU)에서 고려하지 않는 반응물(예, IMU의 경우 방해석 반응)은 IMT의 훈련 및 예측 결과에 영향을 미치지 않는다. 이러한 독립모형의 단순성은 통합모형에 비해 적은 뉴런수에도 불구하고 높은 정확도를가지게 한다. 이에 비해, 통합모형은 모든 반응 물질들의복합적 연계를 통해 다양한 범위의 반응물질 농도에 따른 결과를 예측할 수 있어, 범용적 활용이 가능하다는 장점이 있다. 하지만 특정 반응 물질의 농도가 낮은 경우CM은 예측 성능이 크게 저하되는 한계를 보인다. 예를들어, 작용기 양이 10-15 mol이고 다른 지화학 조건이 동일한 환경에서 CM2가 예측한 결과, U(VI)의 흡착과 직접적인 관련이 없는 Ca 농도에서도 최대 150% 까지의 오차가 발생한다. 더군다나, 방해석 용해를 계산하는 단계에서 발생한 이러한 오차를 포함하는 연산 결과가 다시 방해석 양을 10-15 mol로 가정하는 U(VI)의 흡착 연산에 활용됨에 따라 CM2의 최종연산결과의 정확성을 크게 악화시킨다. 이러한 결과는 통합모형이 특정 반응물질이 없거나 매우 낮은 농도로 존재하는 조건에서의 지화학 반응을 정확하게 예측하기 어려운 모델임을 시사한다. 반면 IMT 모형은 기존의 모델 훈련 결과(Figures 5 and 6)와 유사한 매우 높은 정확성을 유지하며, 공극 규모에서의 복합 반응에 대한 계산을 정확하게 수행한다.
본 연구에서는 반응성 운송 모델링의 효율성을 개선하기 위해 두 가지 인공신경망 기반 대리모형(통합모형 CM,독립모형 IM)을 개발하고 그 성능을 비교 분석하였다. 복합 지화학 반응을 통합적으로 처리하는 CM 모형은 연속체 규모의 다양한 지화학 반응을 연산하기 위해 주로 활용되는 접근법이다. 이러한 접근법은 공간 규모가 매우 크고 반응 물질의 농도 분포가 연속적인 조건에서 매우높은 예측 정확성을 가지는 특성이 있다. 하지만 본 연구에서는 특정 반응 물질의 양이 0에 수렴하는 공극 규모에서의 지화학 반응 연산에 있어서는 그 성능이 크게떨어지는 한계를 관측하였다. 이에 비해 지화학 반응을독립적으로 학습하는 IM 모형은 공극 규모의 용질 운송을 고려한 지화학 반응 예측에서 매우 뛰어난 성능을 보였다. 개별 독립모형의 순차적 적용을 통해 구축한 IMT모형의 매우 높은 예측 정확성은, 또 다른 공극 규모의지화학 반응을 고려해야할 경우, 기존 대리모형을 재학습하지 않고도 독립적인 하위모형을 구축하고 연결함으로써 대리모형을 확장할 수 있음을 시사한다. 하지만 격자셀 내에서 복합적 지화학 반응이 일어날 경우에는 IM모형의 적절한 조합을 통한 복합 지화학 반응 연산이 필요할 것으로 예상된다.
본 논문을 심사 해주신 두 분의 심사위원님들께 감사드린다. 이 논문은 과학기술정보통신부의 재원으로 한국연구재단(No. 2022R1C1C1004512)의 지원과, 2024학년도 충남대학교 4단계 BK21 대학원혁신사업, 그리고 한국지질자원연구원의 주요사업(24-3117)의 지원을 받아 수행되었다.
Econ. Environ. Geol. 2024; 57(5): 487-497
Published online October 29, 2024 https://doi.org/10.9719/EEG.2024.57.5.487
Copyright © THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY.
Yehoon Kim1, Ho-rim Kim2, Heewon Jung1,3,*
1Department of Earth, Environmetal & Space Sciences, Chungnam National University, Daejoen 34134, Republic of Korea
2Korea Institute of Geosciences and Mineral Resources, Daejoen 34132, Republic of Korea
3Department of Geological Sciences, Chungnam National University, Daejoen 34134, Republic of Korea
Correspondence to:*hjung@cnu.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
Pore-scale reactive transport modeling is a powerful tool used to analyze micro-scale processes where fluid flow and geochemical reactions occur. Despite its capability to examine complex hydrological and geochemical system behavior, the high computational demands for these simulations present a significant limitation. To overcome this challenge, this study evaluated artificial neural network (ANN)-based surrogate models to replace geochemical reaction calculations, which consume the majority of computational time in reactive transport simulations. The study considered two ANN models: a combined model (CM) that simultaneously accounts for mineral dissolution/precipitation and solute adsorption reactions, and an independent model (IM) that treats these reactions independently. The performance of these models was compared using metrics, including mean squared error (MSE), coefficient of determination (R2), and mass balance errors. Results indicate that IM demonstrates superior accuracy compared to CM. This finding suggests that instead of constructing a single complex model for the entire geochemical reaction network, pore-scale geochemical reactions can be effectively replaced by combining individual neural network models trained for specific reactions.
Keywords geochemical reactions, artificial neural network, surrogate model, reactive transport, pore scale
김예훈1 · 김호림2 · 정희원1,3,*
1충남대학교 지구환경·우주융합과학과
2한국지질자원연구원
3충남대학교 지질환경과학과
공극 규모 반응성 운송 모델링은 유체 유동과 지화학 반응의 결합이 일어나는 마이크로미터 수준의 프로세스 분석을 수행하는 연구 기법이다. 이는 지질매체 내에서 일어나는 복잡한 물질 거동을 정밀하게 고찰할 수 있게 하는 강력한 연구 기법이지만, 매우 높은 연산 자원이 필요하다는 한계가 존재한다. 이러한 한계를 극복하기 위하여, 본 연구에서는 반응성 운송 모델링에서 대부분의 연산 자원을 소모하는 지화학 반응을 대체하는 인공신경망 기반의 대리모형을 개발하였다. 공극 규모에서는 광물의 공간적 분포에 따라 독립적 지화학 반응 연산을 수행한다는 점에 착안하여 본 연구에서는 광물의 용해/침전과 용질의 흡착 반응을 동시에 고려하는 통합모형(CM)과 독립적으로 고려하는 독립모형(IM)의 두 가지 대리모형의 정확성과 효율을 비교하였다.평균 제곱 오차(MSE), 결정 계수(R2), 질량 균형 오차(mass balance error) 등의 지표를 통해 모형들을 비교한 결과, 통합모형은 공극 규모에서 발생하는 순차적 반응에서 성능이 저하된 반면, 독립모형은 같은 조건에서도 높은 정확도를 유지하며 복잡한 지화학 반응을 효과적으로 처리하였다. 이 결과는 지화학 반응 대리모형 구축에 있어, 복잡한 지화학 반응 네트워크를 포괄하는 단일모형을 매번 새롭게 구축할 필요 없이, 개별 지화학 반응을 학습한 신경망 모형의 합성을 통하여 공극 규모의 지화학 반응을 대체할 수 있을 것으로 기대된다.
주요어 지화학 반응, 인공신경망, 대리모형, 반응성 운송, 공극 규모
Two artificial neural networks were evaluated to replace geochemical calculations in pore scale reactive transport simulations.
ANN model with separated geochemical reactions outperforms integrated approach.
반응성 운송 모델링은 유체 유동, 용존물질 이동, 그리고 생지구화학적 반응 기작들 간의 상호작용을 통합적으로 이해하는 데 활용되는 중요한 계산 기법이다. 이 모델링 기법은 지질학적 시간 규모(MacQuarrie and Mayer, 2005) 및 킬로미터 규모의 지질학적 형성 과정 연구(Gabellone et al. 2016)부터, 공극 규모 내의 미세 이질성이 생지화학적 반응과 오염물질 분해 효율성에 미치는영향을 분석하는 연구(Gharasoo et al. 2012), 마이크로미터 수준에서 일어나는 유체 유동과 지화학 반응의 연계특성을 이해하는 등의 공극 규모의 연구(Molins et al. 2012), 그리고 해수 화학 변화에 따른 돌로마이트화 연구(Gabellone et al. 2016)와 같이 다양한 공간 및 시간 규모에 걸쳐 자연 환경의 동적 과정을 해석하고 예측하는데 광범위하게 활용된다(Steefel et al. 2005). 또한, 반응성 운송 모델링은 지구의 중요한 지역 및 지하 환경에서의 물과 에너지 문제를 해결하는 연구(Deng et al. 2021) 등에도 활용되고 있다. 그러나 반응성 운송 모델링은 동력학 및 열역학적 지화학 반응 계산의 복잡성으로 인해매우 높은 계산 비용이 요구된다는 점이 주요한 한계로남아있다(Steefel and MacQuarrie, 1996, Molins and Knabner 2019).
전통적인 반응성 운송 모델링은 각 공간 요소 및 시간단계에서 반복적인 지화학 반응 계산을 수행한다. 이러한 연산 특성, 특히 반응 속도가 느린 지화학 반응의 경우, 유사한 입력 조건에 대한 중복적인 연산이 수행되는등 불필요한 계산 비용이 발생한다. 또한 다성분계의 열역학적 평형 연산과 동력학적 연산의 복합적 수행으로인해 연산 안정성이 떨어지는 점 또한 반응성 운송 모형의 연산 효율을 저해하는 요소로 작용한다. 반응성 운송모델링의 연산 효율을 개선하기 위한 시도로 최근 대리모형을 이용하여 지화학 반응 연산을 대체하려는 시도들이 활발하게 이루어지고 있다. Jatnieks et al. (2016)은 BRNN(Bayesian Regularized Neural Networks), QRNN(Quantile Regression Neural Network) 등을 기반으로 한 대리모형을 비교하여 반응성 운송 모델링의 지구화학적시뮬레이션을 대체하고 계산 시간을 최대 140배까지 단축할 수 있음을 보였다. Zhou et al. (2018)은 적응형 크리깅 기반 대리모형을 활용하여 반응성 운송 모형에서수리적 및 생화학적 매개변수의 추정을 효율적으로 수행함으로써 전통적인 MCMC(Markov Chain Monte Carlo)방법에 비해 계산 비용을 크게 절감할 수 있음을 보여주었다. 또한, Chen et al. (2021)은 전방 신경망과 역방향 신경망을 결합한 TNNA(Tandem Neural Network Architecture)를 통해 반응성 운송 모델링의 계산 효율성과 정확도를향상시키는 연구도 진행하였고, Laloy and Jacques (2022)는 신경망 및 k-최근접 이웃 기반 대리모형을 활용하여시멘트 시스템에서 반응성 운송 모델링의 계산 비용을줄이는 방법을 제안하였다.
이러한 대부분의 선행 연구들은 연속체 규모(continuum scale)의 반응성 운송 모형에서 이루어져왔다. 각 격자셀마다 평균적 분포로 다성분 지화학 반응물질들의 거동을기술하는 연속체 규모의 모델링의 특성으로 인해, 연속체 규모 모델링에 적용하는 대리모형의 경우 대부분 시뮬레이션 공간 전체를 대표하는 특정 지화학 반응 네트워크를 대체하려는 시도로 나타난다(De Lucia and Kuhn 2021, Demirer et al., 2022). 이에 비해 마이크로미터 수준의 공극에서 나타나는 지화학 반응을 기술하는 반응성운송 모델링의 경우 광물들의 분포에 따라 지화학 반응을 독립적으로 다룬다는 특성이 있다. 예를 들어 방해석경계면에서는 용해-침전 반응이, 바이오필름이 분포하는공극에서는 산화-환원 반응이 우세하게 일어난다(Jung et al. 2023). 이과 같이 지화학 반응을 공간에 따라 독립적으로 처리하는 공극 규모 반응성 운송 모델링은 전체 반응 네트워크가 아닌 개별 지화학 반응을 치환하는 대리모형의 적용 가능성을 의미한다.
이에 본 연구에서는 지화학 반응 네트워크를 동시에 대체하는 통합모형(CM)과 개별 지화학 반응을 독립적으로학습시킨 후 모형을 연결하는 독립모형(IM)을 개발하여 두 대리모형들의 특성과 성능을 비교 평가하였다. 전체지화학 반응 네트워크는 동역학적으로 일어나는(kinetically controlled) 방해석의 용해-침전 반응과 열역학적으로 일어나는 U(VI)의 표면착물화 반응(surface complexation reaction)을 고려하였다. PHREEQC를 활용하여 다양한 환경 조건에서 일어나는 해당 지화학 반응들의 결과에 대한 연산을 수행하였고, 수행 결과는 인공신경망(Artificial Neural Network; ANN) 기반의 통합모형과 독립모형 학습에 활용하였다. 본 연구 결과는 물리 기반 모형의 정확성을 크게 손상시키지 않으면서 공극 규모 반응성 운송 모델링의 연산 속도를 향상시킬 수 있는 기반 기술로활용될 것으로 기대된다.
본 연구에서는 U(VI)의 흡착과 방해석의 용해/침전 반응에 따른 지하수의 수질 변화를 예측할 수 있는 대리모형을 개발하기 위해, 지구화학적 연산 모델로 광범위하게 활용되는 PHREEQC 프로그램을 사용하여 인공신경망 학습 데이터베이스를 구축하였다. PHREEQC(Parkhurst and Appelo 2013)는 미국 지질조사국(USGS)에서 개발한지구화학적 수치 모델링 소프트웨어로 수성 착물화, 표면 흡착, 이온 교환, 광물의 용해/침전, 미생물 반응 등과같은 다양한 지구화학적 반응들에 대한 열역학 및 동력학적 연산을 수행한다.
U(VI)의 흡착을 조절하는 주요 광물은 몬모릴로나이트(montmorillonite)를 선정하였다. 스멕타이트 군에 속하는몬모릴로나이트는 2:1 이중팔면체 구조의 층상규산염 광물로서, 높은 비표면적(~750 m2/g)과 우수한 양이온 교환능력(~1 eq/kg)을 가지고 있어, U(VI)의 흡착에 매우 효과적이다(Tournassat et al. 2018). 지하수의 화학적 조성에 따라 달라지는 U(VI)의 흡착 반응을 모사하기 위하여일반 이중층 모형(generalized two-layer model)에 기반한 표면착물화 모델링을 수행하였다(Table 1).
Table 1 . U(VI) surface complexation reactions on montmorillonite and association constants used for Phreeqc modeling (Pabalan and Turner 1997).
방해석의 용해/침전 반응은 광물의 반응속도론 기술에가장 흔하게 사용되는 전이상태이론(Transition State Theory)에 기반한 식 (1)을 통해 계산하였다.
여기서
대리모형의 학습을 위해 다양한 지화학적 특성을 가지는 지하수 수질 성분과 벤토나이트 흡착 조건을 가정하여 PHREEQC 입력 자료를 생성하였다. 입력 자료에는pH, C(IV), Ca, Cl, Na, U(VI), Mcc, Surf_s, Surf_w의 총 9개의 지화학 인자들을 활용하였다. 여기서 Mcc는 방해석의 몰수(mol), Surf_s와 Surf_w는 각각 U(VI)의 흡착이일어나는 강한 흡착면과 약한 흡착면(mol)을 의미한다.임의로 설정한 용질 농도와 흡착면, 방해석 광물량의 최소값과 최대값 사이의 범위에서 무작위로 선정한 총20,000개의 지하수와 벤토나이트 입력 자료를 생성하여PHREEQC를 수행하였다(Table 2). PHREEQC 입력값으로 활용된 9개의 지화학 인자들의 출력값을 추출하여 인공신경망을 훈련시키기 위한 데이터베이스화 하였다.
Table 2 . The range of input component values used for PHREEQC calculations.
Parameters | Min. | Max. | Mean | Std | Unit |
---|---|---|---|---|---|
pH | 6 | 11 | 8.46 | 1.45 | mol/kg |
C(IV) | 5.00E-04 | 2.00E-03 | 1.25E-03 | 2.88E-04 | |
Ca | 1.00E-04 | 5.00E-04 | 3.00E-04 | 1.16E-04 | |
Cl | 3.00E-05 | 9.00E-05 | 5.98E-05 | 1.74E-05 | |
Na | 5.00E-04 | 1.80E-03 | 1.15E-03 | 3.76E-04 | |
U(VI) | 5.00E-07 | 1.50E-06 | 1.00E-06 | 2.91E-07 | |
Mcc | 1.00E-16 | 1.00E-03 | 5.03E-04 | 2.89E-04 | mol |
surf_s | 1.00E-16 | 1.00E-03 | 4.97E-04 | 2.88E-04 | |
surf_w | 1.50E-16 | 1.50E-03 | 7.45E-04 | 4.32E-04 |
프로세스 기반 모형인 PHREEQC의 입출력 값을 기반으로 지화학 모형을 대체할 수 있는 인공신경망 기반 대리모형들을 구축하였다(Table 3). 먼저 방해석의 용해-침전과 U(VI)의 표면착물화 반응을 동시에 고려하는 통합모형(CM1과 CM2)은 지하수의 화학성을 지시하는 6개의입력값(pH, C, Ca, Cl, Na, U)과 고체반응특성을 결정하는 3개의 입력값(Mcc, Surf_s, Surf_w)의 총 9개의 변수를 가진 입력층으로 구성되었다. 통합모형을 구성하는 두 개의 은닉층은 각각 100개의 뉴런으로 구성되었으며 연산결과로는 6개의 지하수 성분과 8개의 고체반응(용해-침전 및 흡착)결과를 출력한다. 독립모형은 용해-침전 반응과 표면착물화 반응을 독립적으로 처리하는 두 개의하위 인공신경망 IMcc와 IMU의 조합으로 구성하였다(Figure 1). 방해석의 용해-침전 반응 연산을 수행하는IMcc는 6개의 지하수 특성과 1개의 방해석량(Mcc)을 입력변수로 활용하고, 동일한 종류의 출력변수들은 1개의은닉층과 15개의 뉴런을 통해 계산하였다. IMU는 U(VI)의 흡착 반응에 대한 연산을 수행하고, 6개의 지하수 특성과 2개의 흡착반응변수(Surf_s, Surf_w)를 입력값으로한다. IMU는 각 은닉층 마다 50개씩 있는 은닉층의 뉴런과 입력변수의 조합을 통해 총 13개(6개 지하수 화학반응결과, 7개 흡착반응결과)의 출력값을 계산한다.
Table 3 . The input and output variables of each ANN model.
PHREEQC를 통해 생성된 총 20,000개의 입출력 데이터베이스 중 CM1, IMcc, IMU 모형은 각각 10,000개 자료를 활용하여 훈련하였다. 실제 공극 규모 반응성 운송모형에서 IMcc와 IMU의 경우 광물의 공간 분포에 따른독립적인 적용(IMT = IMcc + IMU)이 이루어지기 때문에대리모형 IMT에는 총 20,000개의 자료가 활용된 것으로볼 수 있다. 따라서 통합독립모형(IMT)과의 정밀한 비교를 위해 CM1과 동일한 구조를 가지면서 20,000개의 자료를 활용하여 훈련한 CM2를 제작하였다. 모든 모형에활용된 자료들 중 검증(validation)과 평가(test)에 각각 500개씩 활용된 자료를 제외한 나머지 자료는 모두 모형 학습에 활용하였다. 인공신경망의 성능을 향상시키기 위해6개의 입력변수(C(IV), Ca, U(VI), Mcc, Surf_s, Surf_w)와 11개의 출력변수(C(IV), Ca, U(VI), Mcc, Surf_sOUO2+, Surf_sOH2+, Surf_sOH, Surf_sO-, Surf_wOUO2+, Surf_wOH, Surf_wO-)는 먼저 로그변환을 거쳤다. 이후 모든 학습 자료는 각 변수들의 평균과 표준편차를 이용하여 표준점수(Z-score)로 변환하는 표준화 과정을 거쳤다. 신경망 학습과정에서 은닉층의 활성함수는 ReLU(Rectified Linear Unit)를 사용하였고, 손실함수로는 평균제곱오차(Mean Squared Error; MSE)를, 최적화에는 학습 과정에서 학습률을 조정하여 신경망 학습을 최적화하는 Adam optimizer를 사용하였고, 이때 초기 학습률에는 0.001을 사용하였다. 학습 주기(epoch)는 IMcc 모형에 50번 IMU 모형에200번 CM 모형에 300번을 사용하였고, 배치의 크기는CM 모형은 50, 정하고 IMcc와 IMU 모형은 100으로 설정하여 학습을 진행하였다. 각 파라미터들은 여러 조합을 무작위로 선택하여 학습을 진행한 후, 계산된 가장 큰MSE 값이 10-4보다 작은 경우를 선정한 결과이다.
학습이 완료된 인공신경망 모형은 평가용 입력 자료를이용하여 인공신경망 모형이 예측한 결과를 PHREEQC계산 결과와 비교하여 인공신경망 대리모형의 성능을 평가하였다. 모형의 성능 평가에는 신경망 모형 검증에 흔하게 사용되는 MSE와 결정 계수(R2) 이외에도 질량 균형 오차를 사용하였다. 질량 균형 오차(mass balance error)는 각 화학 성분의 총량이 반응 전과 후에 일관되게 유지되는지를 확인하는 것으로 식 (2)와 같이 계산한다.
여기서
공극 규모의 격자 셀 단위에서 일어나는 지화학 반응은 유체 격자 셀이 접하는 단종 광물의 종류에 따라 결정된다. 예를 들어, 방해석 표면에서는 용해-침전 반응이주로 나타나고, 몬모릴로나이트로 대표되는 벤토나이트표면에서는 우라늄의 흡착 반응이 주요한 지화학 반응으로 나타난다(Figure 1). 따라서 공극 규모의 반응성 운송모델링에서 지화학 반응을 대체하는 대리모형은 특정 반응 물질이 부재한 조건에서도 지화학 반응을 정확하게계산할 수 있어야 한다. 또한 용질 운송에 따라 반응 물질의 종류가 바뀜에 따라 나타나는 독립적 지화학 반응들에 대한 복합 연산 또한 가능해야한다.
Figure 1에서 설명한 조건에 따라 CM 모형과 IM모형을 비교하기 위해, Figure 2의 작업 흐름을 따라 두 모형의 구조를 일치시켰다. IM 모형은 IMcc의 결과를 다시IMU의 입력 자료로 사용하는 방식으로 설계되었기 때문에 CM 모형도 동일한 순서를 적용하였다. 첫 번째 CM모형의 입력 자료는 방해석의 용해/침전 반응만을 계산하기 위해 원본 자료에서 흡착표면의 값을 거의 0에 가까운 10-15의 값으로 변환한 자료를 사용하였다. 이후, 출력 값으로 얻은 값의 Mcc 값을 다시 10-15로 변환하고 흡착표면의 값은 다시 원본 자료의 흡착표면의 값으로 대체하여 다시 한 번 CM 모형의 입력 자료로 사용하였다.이렇게 얻은 결과를 IM 모형과 비교하였다.
10,000개의 자료를 활용하여 훈련된 인공신경망 대리모형들을 활용한 지화학 반응 예측 결과를 물리기반 모형인 PHREEQC 연산 결과와 비교한 결과, 모든 대리모형들이 우수한 예측성능을 보여주는 것을 확인하였다. 방해석 용해-침전 반응과 U의 표면착물화 반응을 동시에 고려하는 CM1은 모든 지화학 인자들에 대해서 1.26 × 10-4 이하의 MSE와 0.9965 이상의 R2값을 보이고, 특히 pH, C(IV), Ca에 대해서는 매우 높은 R2값을 보인다 (Figure 3).특히 Na, Cl는 모든 모형에 대해 낮은 MSE와 R2을 보이며 5% 이상의 질량 균형 오차가 발생하지 않았다. 지화학 반응의 핵심 변수 Mcc와 U(VI)는 다른 변수들에 비해 다소 낮은 예측 정확도를 보이는데, 특히 U 관련 화학종의 경우 U(VI) 10개, Surf_sUO2+ 2개로 5% 이상의질량균형오차를 보이는 예측값이 관측되었다.
20,000개의 자료를 학습한 CM2는 CM1에 비해 전반적으로 더 높은 지화학 반응 연산 정확도를 보인다 (Figure 4).예를 들어 CM1에서 가장 많은 11개의 질량균형오차를보였던 U(VI)은 CM2에서 2개로 줄었고, MSE와 R2 지표에서도 CM2는 CM1에 비해 전반적으로 향상된 예측성능을 보여준다 (MSE < 10-4, R2 > 0.997). 하지만 낮은농도를 특성으로 하는 U 관련 화학종의 예측값들은 여전히 다른 화학종의 예측값에 비해 낮은 정확도를 보인다.
IM 모형의 두 개의 하위독립모형 중 방해석의 용해-침전 반응만을 학습시킨 하위독립모형 IMcc는 가장 적은 수의 뉴런과 짧은 학습주기, 그리고 큰 배치 크기에도 불구하고 CM1과 CM2의 연산 정확성에 비해 더 뛰어난 성능을 보인다(Figure 5). IMcc 모형에서 정확성이 가장 낮은예측을 보이는 요소는 pH다. 하지만 MSE = 1.07 × 10-5와 R2 = 0.999995로 CM1과 CM2의 pH 예측에 비해 우수한 성능을 보이며, 5% 이상의 질량균형오차를 보이는 예측자료가 나타나지 않는다. 이러한 IMcc 모형의 뛰어난예측 성능은 본 연구에서 고려한 지화학 반응 중 U 흡착 반응 관련 예측이 방해성 반응에 비해 정확성이 떨어진다는 것을 의미한다.
하위독립모형 IMU는 통합모형에서 관측되었던 것과 같이 다른 화학종들에 비해 U(VI)관련 화학종에서 낮은 정확성을 보인다(Figure 6). 그 중에서 가장 낮은 정확도를보인 Surf_wUO2+의 MSE와 R2는 각각 1.79×10-16 과 0.9972의 값을 가진다. IMU는 통합모형에 비해 적은 수의 뉴런으로 통합모형(CM1, CM2)과 비슷한 예측력을 보인다.
U(VI)의 표면착물화 반응은 복수의 흡착표면(surf_s, surf_w)과 UO22+의 비선형적 상호작용을 통해 결정된다(Table 1). 이러한 U(VI)의 거동을 결정하는 다중 성분 지화학적 반응의 높은 비선형성이 U(VI) 화학종의 예측 정확성을 저감시키는 요소로 작용할 수 있음을 나타낸다.또한 U 화학종은 다른 화학종에 비해 낮은 농도를 가지기 때문에, 표준화된 공간에서 발생한 인공신경망의 작은 예측 오차도 실제 U 농도에서는 상대적으로 큰 오차로 나타나 질량 균형 오류에 영향을 미칠 수 있다.
앞서 논의한 공극 규모의 지화학 반응 특성을 고려하여, Figure 7에서는 방해석 용해 반응을 겪은 유체가 몬모릴로나이트의 표면으로 이동하여 우라늄 흡착 반응을순차적으로 겪는 상황(Figures 1 and 2)에 대한 CM2와IMT 대리모형들의 예측 정확성을 평가하였다. 이러한 접근법은 용질의 확산(diffusion) 및 분산(dispersion)에 의한혼합(mixing) 없이 이류(advection)만을 통해 용질운송이 일어나는 상황을 가정한 모델링으로 이해할 수 있다.
CM은 방해석의 용해/침전 반응과 우라늄 흡착 반응을동시에 처리하도록 설계되었다. 하지만 방해석과 몬모릴로나이트 표면작용기가 극미량으로 존재하는 경우에는해당 반응들이 수질에 미치는 영향은 무시할 수 있다. 실제로, 방해석과 두 작용기 모두 10-15 mol의 극미량으로존재하는 상황(CM)과 0 mol로 고려한 상황(IM)이 동일한 PHREEQC 연산 결과를 보인다. 이러한 지화학 반응 특성은 방해석과 표면작용기가 순차적으로 극미량(10-15 mol)으로 존재하는 상황을 가정한 CM과 반응물질이 부재(0 mol)한 IM의 비교 평가를 가능하게 한다.
CM2와 IMT 각각의 대리모형 연산 결과, 두 대리모형모두 우수한 훈련 성능을 보였지만(Figure 4), 공극 규모에서 일어나는 순차적 반응에 대한 CM2의 예측 성능이크게 저하되는 것을 확인할 수 있다(Figure 7). 개별 독립모형(IMcc와 IMU)에서 고려하지 않는 반응물(예, IMU의 경우 방해석 반응)은 IMT의 훈련 및 예측 결과에 영향을 미치지 않는다. 이러한 독립모형의 단순성은 통합모형에 비해 적은 뉴런수에도 불구하고 높은 정확도를가지게 한다. 이에 비해, 통합모형은 모든 반응 물질들의복합적 연계를 통해 다양한 범위의 반응물질 농도에 따른 결과를 예측할 수 있어, 범용적 활용이 가능하다는 장점이 있다. 하지만 특정 반응 물질의 농도가 낮은 경우CM은 예측 성능이 크게 저하되는 한계를 보인다. 예를들어, 작용기 양이 10-15 mol이고 다른 지화학 조건이 동일한 환경에서 CM2가 예측한 결과, U(VI)의 흡착과 직접적인 관련이 없는 Ca 농도에서도 최대 150% 까지의 오차가 발생한다. 더군다나, 방해석 용해를 계산하는 단계에서 발생한 이러한 오차를 포함하는 연산 결과가 다시 방해석 양을 10-15 mol로 가정하는 U(VI)의 흡착 연산에 활용됨에 따라 CM2의 최종연산결과의 정확성을 크게 악화시킨다. 이러한 결과는 통합모형이 특정 반응물질이 없거나 매우 낮은 농도로 존재하는 조건에서의 지화학 반응을 정확하게 예측하기 어려운 모델임을 시사한다. 반면 IMT 모형은 기존의 모델 훈련 결과(Figures 5 and 6)와 유사한 매우 높은 정확성을 유지하며, 공극 규모에서의 복합 반응에 대한 계산을 정확하게 수행한다.
본 연구에서는 반응성 운송 모델링의 효율성을 개선하기 위해 두 가지 인공신경망 기반 대리모형(통합모형 CM,독립모형 IM)을 개발하고 그 성능을 비교 분석하였다. 복합 지화학 반응을 통합적으로 처리하는 CM 모형은 연속체 규모의 다양한 지화학 반응을 연산하기 위해 주로 활용되는 접근법이다. 이러한 접근법은 공간 규모가 매우 크고 반응 물질의 농도 분포가 연속적인 조건에서 매우높은 예측 정확성을 가지는 특성이 있다. 하지만 본 연구에서는 특정 반응 물질의 양이 0에 수렴하는 공극 규모에서의 지화학 반응 연산에 있어서는 그 성능이 크게떨어지는 한계를 관측하였다. 이에 비해 지화학 반응을독립적으로 학습하는 IM 모형은 공극 규모의 용질 운송을 고려한 지화학 반응 예측에서 매우 뛰어난 성능을 보였다. 개별 독립모형의 순차적 적용을 통해 구축한 IMT모형의 매우 높은 예측 정확성은, 또 다른 공극 규모의지화학 반응을 고려해야할 경우, 기존 대리모형을 재학습하지 않고도 독립적인 하위모형을 구축하고 연결함으로써 대리모형을 확장할 수 있음을 시사한다. 하지만 격자셀 내에서 복합적 지화학 반응이 일어날 경우에는 IM모형의 적절한 조합을 통한 복합 지화학 반응 연산이 필요할 것으로 예상된다.
본 논문을 심사 해주신 두 분의 심사위원님들께 감사드린다. 이 논문은 과학기술정보통신부의 재원으로 한국연구재단(No. 2022R1C1C1004512)의 지원과, 2024학년도 충남대학교 4단계 BK21 대학원혁신사업, 그리고 한국지질자원연구원의 주요사업(24-3117)의 지원을 받아 수행되었다.
Table 1 . U(VI) surface complexation reactions on montmorillonite and association constants used for Phreeqc modeling (Pabalan and Turner 1997).
Table 2 . The range of input component values used for PHREEQC calculations.
Parameters | Min. | Max. | Mean | Std | Unit |
---|---|---|---|---|---|
pH | 6 | 11 | 8.46 | 1.45 | mol/kg |
C(IV) | 5.00E-04 | 2.00E-03 | 1.25E-03 | 2.88E-04 | |
Ca | 1.00E-04 | 5.00E-04 | 3.00E-04 | 1.16E-04 | |
Cl | 3.00E-05 | 9.00E-05 | 5.98E-05 | 1.74E-05 | |
Na | 5.00E-04 | 1.80E-03 | 1.15E-03 | 3.76E-04 | |
U(VI) | 5.00E-07 | 1.50E-06 | 1.00E-06 | 2.91E-07 | |
Mcc | 1.00E-16 | 1.00E-03 | 5.03E-04 | 2.89E-04 | mol |
surf_s | 1.00E-16 | 1.00E-03 | 4.97E-04 | 2.88E-04 | |
surf_w | 1.50E-16 | 1.50E-03 | 7.45E-04 | 4.32E-04 |
Table 3 . The input and output variables of each ANN model.
Jina Jeong and Eungyu Park
Econ. Environ. Geol. 2020; 53(3): 245-258Joo-Hyung Ryu, Saro Lee and Joong-Sun Won
Econ. Environ. Geol. 2002; 35(1): 67-74Jin Yeob Kim and Hyuck Jin Park*
Econ. Environ. Geol. 2013; 46(4): 301-312