Econ. Environ. Geol. 2025; 58(1): 81-97
Published online February 28, 2025
https://doi.org/10.9719/EEG.2025.58.1.81
© THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY
Correspondence to : *hjpark@sejong.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
AI models, which are frequently employed in landslide susceptibility analysis, are typically black-box models that lack the capacity to comprehend the analysis process. This deficiency can result in a reduction in the reliability of prediction results due to the challenge of comprehending the analysis or prediction process. To address this limitation, eXplainable AI (XAI) techniques are being utilized as a tool to explain the prediction process of AI models. Among the XAI techniques, prior studies have been predominantly conducted using SHapley Additive exPlanations (SHAP). However, the prevalent studies employing SHAP utilize it simply to express the influence of landslide occurrence factors in numerical values, thereby failing to adequately analyze the spatial correlation between landslide occurrence locations and landslide influence factors. Consequently, this study aims to visualize SHAP values in a spatial form to analyze the influence of the spatial distribution of factors on landslide susceptibility. To this end, ensemble models Adaptive Boost (AdaBoost), Random Forest, and eXtreme Gradient Boosting (XGBoost) were employed to analyze landslide susceptibility, and a landslide susceptibility map was constructed based on the calculated susceptibility index. The analysis revealed that the Random Forest and XGBoost models exhibited similar correlation between landslide occurrence and landslide influence factors. Consequently, a comparison of the importance of these factors was conducted using the SHAP summary plot of the two models. The evaluation identified four factors—forest height, standard deviation of planform curvature, standard deviation of standard curvature, and altitude—as having a significant impact on landslide occurrence. Furthermore, a spatial pattern analysis was conducted on the three factors that were deemed to be of high importance for the XGBoost model. This analysis was found to effectively reflect the effects of various factors in the SHAP summary plot. This facilitated an insightful examination of the contributions of the primary factors to landslide occurrence, guided by their spatial distribution, and enabled a thorough analysis of their influence on landslide susceptibility.
Keywords landslide susceptibility, XAI, SHAP, spatial pattern analysis, ensemble model
최지희1 · 이정현1 · 박혁진1,* · 윤대웅2
1세종대학교 지구자원시스템공학과
2전남대학교 에너지자원공학과
산사태 취약성 분석에서 범용적으로 활용되고 있는 AI 모델은 일반적으로 분석 과정을 파악할 수 없는 블랙박스 모델로, 분석이나 예측 과정을 명확히 파악하기 어렵기 때문에 예측 결과의 신뢰성이 저하될 수 있다. 이러한 문제를 해결하기 위해 AI모델의 예측 과정을 설명하기 위한 도구로 XAI (eXplainable AI) 기법이 활용되고 있으며, 특히 XAI 기법 중 SHAP (SHapleyAdditive exPlanations)을 활용한 연구가 주로 수행되고 있다. 그러나 기존 연구에서는 SHAP value를 단순히 산사태 발생 인자들의 영향력을 숫자 값으로 표현하는 데에만 활용되었기 때문에, 산사태 발생 위치와 산사태 영향인자들의 공간적 상관 관계에 대한 분석이 미흡한 상황이다. 따라서 본 연구에서는 SHAP value를 공간 형태로 시각화하여, 인자의 공간적 분포가 산사태 취약성에 미친 영향을 분석하고자 하였다. 이를 위하여 앙상블 모델인 AdaBoost (Adaptive Boost), Random Forest, XGBoost (eXtremeGradient Boosting)를 적용하여 산사태 취약성 분석을 수행하였으며, 산출된 취약지수를 바탕으로 산사태 취약성도를 구축하였다. 분석 결과, Random Forest와 XGBoost 모델이 산사태 발생부와 산사태 영향인자의 상관성을 유사하게 분석한 것으로 판단되었으며, 이를 기반으로 두 모델의 SHAP summary plot을 활용하여 인자의 중요도를 비교하였다. 산사태 발생에 중요한 영향을 미친 인자로 평가된 4개 인자는 수목높이, 평면곡률 표준편차, 표준곡률 표준편차, 고도로 나타났다. 또한 본 연구에서는 SHAP summary plot에서 다양한 인자의 영향을 효과적으로 분석에 반영한 것으로 판단된 XGBoost 모델을 대상으로 중요도가 높은 세 인자(수목높이, 평면곡률 표준편차, 고도)에 대한 공간 패턴 분석을 수행하였다. 이를 통해 산사태 발생에 기여하는 주요인자의 공간적 분포에 따른 기여도를 직관적으로 확인하고, 해당 인자가 산사태 취약성에 미친 영향을 분석하였다.
주요어 산사태 취약성, XAI, SHAP, 공간 패턴 분석, 앙상블 모델
Econ. Environ. Geol. 2025; 58(1): 81-97
Published online February 28, 2025 https://doi.org/10.9719/EEG.2025.58.1.81
Copyright © THE KOREAN SOCIETY OF ECONOMIC AND ENVIRONMENTAL GEOLOGY.
Ji-Hee Choi1, Jung-Hyun Lee1, Hyuck-Jin Park1,*, Daeung Yoon2
1Dept. of Energy Resources and Geosystem Engineering, Sejong University, Seoul, Korea
2Dept. of Energy and Resources Engineering, Chonnam National University, Gwangju, Korea
Correspondence to:*hjpark@sejong.ac.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided original work is properly cited.
AI models, which are frequently employed in landslide susceptibility analysis, are typically black-box models that lack the capacity to comprehend the analysis process. This deficiency can result in a reduction in the reliability of prediction results due to the challenge of comprehending the analysis or prediction process. To address this limitation, eXplainable AI (XAI) techniques are being utilized as a tool to explain the prediction process of AI models. Among the XAI techniques, prior studies have been predominantly conducted using SHapley Additive exPlanations (SHAP). However, the prevalent studies employing SHAP utilize it simply to express the influence of landslide occurrence factors in numerical values, thereby failing to adequately analyze the spatial correlation between landslide occurrence locations and landslide influence factors. Consequently, this study aims to visualize SHAP values in a spatial form to analyze the influence of the spatial distribution of factors on landslide susceptibility. To this end, ensemble models Adaptive Boost (AdaBoost), Random Forest, and eXtreme Gradient Boosting (XGBoost) were employed to analyze landslide susceptibility, and a landslide susceptibility map was constructed based on the calculated susceptibility index. The analysis revealed that the Random Forest and XGBoost models exhibited similar correlation between landslide occurrence and landslide influence factors. Consequently, a comparison of the importance of these factors was conducted using the SHAP summary plot of the two models. The evaluation identified four factors—forest height, standard deviation of planform curvature, standard deviation of standard curvature, and altitude—as having a significant impact on landslide occurrence. Furthermore, a spatial pattern analysis was conducted on the three factors that were deemed to be of high importance for the XGBoost model. This analysis was found to effectively reflect the effects of various factors in the SHAP summary plot. This facilitated an insightful examination of the contributions of the primary factors to landslide occurrence, guided by their spatial distribution, and enabled a thorough analysis of their influence on landslide susceptibility.
Keywords landslide susceptibility, XAI, SHAP, spatial pattern analysis, ensemble model
최지희1 · 이정현1 · 박혁진1,* · 윤대웅2
1세종대학교 지구자원시스템공학과
2전남대학교 에너지자원공학과
산사태 취약성 분석에서 범용적으로 활용되고 있는 AI 모델은 일반적으로 분석 과정을 파악할 수 없는 블랙박스 모델로, 분석이나 예측 과정을 명확히 파악하기 어렵기 때문에 예측 결과의 신뢰성이 저하될 수 있다. 이러한 문제를 해결하기 위해 AI모델의 예측 과정을 설명하기 위한 도구로 XAI (eXplainable AI) 기법이 활용되고 있으며, 특히 XAI 기법 중 SHAP (SHapleyAdditive exPlanations)을 활용한 연구가 주로 수행되고 있다. 그러나 기존 연구에서는 SHAP value를 단순히 산사태 발생 인자들의 영향력을 숫자 값으로 표현하는 데에만 활용되었기 때문에, 산사태 발생 위치와 산사태 영향인자들의 공간적 상관 관계에 대한 분석이 미흡한 상황이다. 따라서 본 연구에서는 SHAP value를 공간 형태로 시각화하여, 인자의 공간적 분포가 산사태 취약성에 미친 영향을 분석하고자 하였다. 이를 위하여 앙상블 모델인 AdaBoost (Adaptive Boost), Random Forest, XGBoost (eXtremeGradient Boosting)를 적용하여 산사태 취약성 분석을 수행하였으며, 산출된 취약지수를 바탕으로 산사태 취약성도를 구축하였다. 분석 결과, Random Forest와 XGBoost 모델이 산사태 발생부와 산사태 영향인자의 상관성을 유사하게 분석한 것으로 판단되었으며, 이를 기반으로 두 모델의 SHAP summary plot을 활용하여 인자의 중요도를 비교하였다. 산사태 발생에 중요한 영향을 미친 인자로 평가된 4개 인자는 수목높이, 평면곡률 표준편차, 표준곡률 표준편차, 고도로 나타났다. 또한 본 연구에서는 SHAP summary plot에서 다양한 인자의 영향을 효과적으로 분석에 반영한 것으로 판단된 XGBoost 모델을 대상으로 중요도가 높은 세 인자(수목높이, 평면곡률 표준편차, 고도)에 대한 공간 패턴 분석을 수행하였다. 이를 통해 산사태 발생에 기여하는 주요인자의 공간적 분포에 따른 기여도를 직관적으로 확인하고, 해당 인자가 산사태 취약성에 미친 영향을 분석하였다.
주요어 산사태 취약성, XAI, SHAP, 공간 패턴 분석, 앙상블 모델
Kyoung-Hee Kang and Hyuck-Jin Park
Econ. Environ. Geol. 2019; 52(2): 199-212Kang Min Kim and Hyuck Jin Park
Econ. Environ. Geol. 2017; 50(3): 195-214No-Wook Park, Kwang-Hoon Chi, Chang-Jo F. Chung and Byung-Doo Kwon
Econ. Environ. Geol. 2005; 38(1): 45-55