
Basic volcanic rocks were subdivided using the image classification capability of artificial intelligence.
Using a polarized microscope, open nicole, cross nicole, and gypsum plate mounted images were used for classification.
Classification accuracy of over 80% was obtained for 4 reference samples through the convolutional neural network model.
The model combining open nicole and cross nicole images has high accuracy.
과거 암석의 분류는 암석학을 공부한 지질학자의 영역이었다. 전통적으로 육안과 편광현미경 관찰이 주를 이루었으며, X-선 조사 기술과 전자현미경의 발전 이래로X-선 회절 분석 및 Scanning Electron Microscopy (SEM) Backscattered electron (BSE) 이미지 관찰이 가능해졌다. 이에 따라 보다 객관적이고 세분화 된 암석 구분이 가능해졌으나, 시료 준비와 실험과정의 난이도가 높은 관계로 여전히 전통적인 방법에 많은 부분을 기대고 있다(Peacock 1931, Middlemost, 1994). 더욱이 위 방법들은 모두 암석학적, 광물학적 지식에 기반을 두기 때문에, 다량의 암석을 분류하기에 인적, 시간적 소모가 상당하고 비전문가의 접근성이 매우 떨어진다 (Le Bas and Albert, 1991). 최근 이를 보완하기 위해 국내에서 인공지능을 화성암 분류에 활용하려는 방안이 시도되고 있다 (Seo et al., 2022). 인공지능 영상처리기법은 공극이나 결정질 광물들의 이미지상에서 나타나는 특성을 추출하여 광물 식별 및 암석 분류 등에 활용한다 (Borazjani et al., 2016). 선행연구에서 개발된 모델은 화성암에서 광물 입자와 공극을 구분하고, 각각의 광물 별로 편광현미경 이미지상에서 보이는 특성을 추출하여 광물을 식별할 수 있다(Izadi et al., 2013, Budennyy et al., 2017, Borges and de Aguiar, 2019). 이런 최근의 시도들로부터 보다 다양한 광물과 암석종들이 구분 가능함을 알 수 있으며, 인공지능을 암석 분류에 활용할 경우 다량의 데이터를 빠르게 식별하고 구분하여 시간적 소모를 크게 줄일 수 있다. 더불어 정확도 높은 암석 분류 인공지능 모델이 개발된다면, 암석학적 지식이 부족한 비전문가들도 쉽게 암석 분류가 가능해질 것이다. 이에 본 연구는 기존 화성암을 대분류하는 모델에서 나아가 염기성 화산암을 세분하는 새로운 인공지능 모델을 개발하고자 한다. 더불어 개발된 모델의 정확도와 효용성을 평가하여 일반인의 지질학적접근성을 증진시키고 암석학 기초연구 빅데이터를 만드는 실험 프로세스의 기반 모델로 활용하고자 한다.
화산암은 다양한 기준을 통해 분류될 수 있으나, 가장일반적으로 화학조성을 분석하여 NaO2, K2O 그리고 SiO2의 함량에 따라 분류된다. 이 중 흔히 중-염기성으로 분류되는 화산암은 62% 이하의 SiO2 함량을 가지며, Na2O+K2O의 함량과 SiO2의 함량에 따라 alkalic basalt, subalkalic basalt, trachy basalt, andesite, trachy andesite, phonolite, trachyte로 나뉜다 (Middlemost 1980). 그러나 박편 이미지상에서 구분 가능한 기준은 특정 광물의 유무, microtexture 등의 가시적인 특징에 기인한다. 염기성화산암의 경우, 가장 대표적으로 olivine의 유무와plagioclase의 preferred orientation (trachytic texture)을 예로 들 수 있다. 이에 본 연구에서는 염기성 화산암 중olivine basalt, basaltic andesite, olivine tholeiite, trachytic olivine basalt를 박편 이미지상에서 구분하는 인공지능 모델을 개발하고자 하였다.
학습을 위해 준비한 박편 이미지는 각각의 기준 시료를 이용하여 제작된 박편을 Nikon Eclips E200 편광현미경 (Nikon, Japan)에 부착된 MQA 18000 DS-FI3 camera (Nikon, Japan)를 통해 촬영하였으며, NIS Elements BR (Nikon, Japan) 프로그램을 이용하였다. 전체 박편을 50등분 하여 이미지는 20배율로 개방 니콜 및 직교 니콜 상태를 모두 촬영하였으며, 이미지 해상도는 2560 × 1920으로 촬영되었다. 촬영 시 mechanical stage를 이용해 회전 없이 고정된 상태에서 촬영하였으며, 추가로 Gypsum plate를 끼운 상태에서 20개의 이미지를 추가로 촬영하였다. 최종적으로 개방 니콜 및 직교 니콜 이미지 각 300장, Gypsum plate를 끼운 직교 니콜 이미지 120장, 총720장의 이미지를 촬영하였다. 촬영된 기준시료들의 박편 사진 중 대표되는 사진을 각각 Fig. 1에 나타내었다. 인공지능 모델 학습을 위해 학습시킨 데이터는 2개의 단일종, 1) 개방 니콜 이미지로만 구성된 경우, 2) 직교 니콜 이미지로만 구성된 경우, 그리고 2개의 복합종, 3) 개방 니콜 및 직교 니콜 이미지로 구성된 경우, 4) 개방 니콜 및 직교 니콜 및 Gypsum plate가 끼워진 직교 니콜 이미지로 구성된 경우, 총 4 세트로 구분하여 학습을 진행하였다. 모든 모델은 training과 test 용 이미지를 7:3의비율로 나누어 학습시켰으며, 70%의 image만을 사용하여 training을 마친 모델을 최종 모델로 하여 30%의 이미지를 활용해 test를 진행하였다. 단일종 학습 인공지능모델은 각각 개방 및 직교 니콜 이미지 300개 중 210개의 이미지를 통해 학습하였고, 3)의 경우, 사용된 개방 및 직교 니콜의 이미지를 모두 활용하여 600개 중 420개의이미지를 통해 학습하였다. 4)의 경우 개방 및 직교 니콜의 이미지 600개 중 임의로 500개를 택하여 Gypsum plate이미지 100개와 함께 총 600개의 이미지 중 420개를 통해 학습하였다. Test에 활용된 이미지는 training에 사용되지 않은 이미지를 활용하였다. 각 모델에 대한 검증은 각각 훈련에 사용된 이미지 종류를 활용하였다. 단일종의 경우 PPL image는 PPL image 학습 모델에 대한 검증용으로, XPL iamge는 XPL image 학습 모델에 대한검증용으로 사용하였으며, 복합종의 경우 사용된 이미지의 종류 (PPL+XPL일 경우 PPL, XPL image를, GP를 포함하는 모델의 경우 GP image까지 포함하여)를 검증에 각각 이용하였다.
인공지능에 의한 암석 분류는 이미지 분석법 중에서도object detection이나 localization이 필요하지 않은 가장 낮은 단계인 classification에 속한다. 이를 위해 딥러닝을 진행할 수 있는 인공신경망 알고리즘은 종류가 다양하나, 이미지 분석을 위해 일반적으로 적은 연산량으로도 높은 계산성능을 보이는 합성곱 신경망 (Convolutional Neural Network ,CNN)을 활용하는 것이 일반적이다 (Hussain et al., 2018, Lei et al., 2019). 박편 이미지 분석을 위해 인공지능 모델은 최적화 과정을 필수적으로 거쳐야 하는데, 이때 CNN 모델에서는 여러 개의 convolution layer와pooling layer를 사용하여 하나의 이미지를 각각 원하는 값으로 변환하여 학습에 이용한다. 이 과정에서 높은accuracy를 갖는 결과를 도출하기 위해 인공지능 모델의 변수를 다양하게 수정할 수 있다. 그러나 이미지 분석에 관련된 기존의 인공지능 모델이 매우 다양하여 대규모의 이미지 데이터를 활용하는 경우, 기존 존재하는 모델의 매개변수를 업데이트하여 미세조정하는 방식을 택하는 것이 일반적이다 (Qassim et al., 2018). 이 경우 기존 모델에는 layer의 수와 신경망의 연결 정도, 변수값이 이미 내장되어 있고, 어떤 이미지를 분석하였는가에 따라 각각의 값을 큰 폭으로 조정해야 할 가능성도 있다. 이 때문에 본 연구에서는 암석 분류에 맞는 이미지 분석 모델을 생성하고자 새로운 모델을 생성하여 이미지 데이터를 학습시키고자 하였다.
본 모델은 Tensorflow, Keras 라이브러리를 기반으로 설계하여 난수를 고정하였다. 초기 학습 시 주입된 이미지의 픽셀값을 255로 나누어 rescale을 진행하였으며, (128, 128)사이즈의 mini-batch로, batch size는 500으로 설정하였다. CNN의 filter size는 32, 64, 128이며, (3, 3)의 stride값을 설정하였다. 활성화 함수는 ReLU 함수를 이용하고Pooling layer의 MaxPooling은 (2, 2) 사이즈로 설정하였다. 각 층에서 무작위로 부분적 가중치를 두어 학습할 수 있도록 Dropout 값은 0.25로 설정하였다. 위와 같은 층 3개에 256 filter size를 갖는 Flatten layer (ReLU active function, 0.5 dropout)를 결합하여 Softmax active function으로 데이터를 출력하였다.
출력된 loss 값과 accuracy 값은 최적화 함수와 손실 함수를 ADAM과 Mean Squared Error(MSE) 로 설정하여(1)과 (2)의 수식에 따라 계산되었다. 또한 각각의 image들의 색상 대표성을 알아보기 위해 대표되는 이미지를 별도의 feature extraction 없이 클러스터링 비지도 학습을 실시하였다. 설계된 인공지능 모델의 신뢰도 검증을 위해 촬영된 박편 이미지 720장을 학습 횟수 100회까지실시하여 학습을 진행한 뒤 10회 간격으로 시행된 결과를 검토하였다 (Table 1). Accuracy 및 loss 값 확인 결과, 90 이상의 epoch에서 80% 이상의 accuracy를 갖는 것으로 보아 기분류한 4가지 데이터 셋으로 진행해도 신뢰할 수 있는 결과를 보일 것으로 기대하였다.
Table 1 . Accuracy and loss value results obtained by learning at intervals of 10 times up to 100 times for preliminary data set
Value | Epoch | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 | |
Accuracy | 0.5533 | 0.6400 | 0.7067 | 0.7533 | 0.8200 | 0.7933 | 0.7533 | 0.7400 | 0.8000 | 0.8400 |
Loss | 0.0942 | 0.0820 | 0.0752 | 0.0534 | 0.0469 | 0.0526 | 0.0664 | 0.0722 | 0.0563 | 0.0453 |
개방 니콜과 직교 니콜에서 촬영된 각각의 이미지 300장을 epoch 10~100회 학습하여 test를 진행하였다. 최대100회의 딥러닝 시행 결과, 개방 니콜 이미지의 경우0.9222의 매우 높은 accuracy 값을 보인 반면, 직교 니콜 이미지의 경우 0.6556의 비교적 낮은 accuracy 값을 보인다 (Table 2). Loss값 또한 직교 니콜 이미지의 경우가 개방 니콜 이미지보다 매우 높게 나타났다. 더불어 직교 니콜의 경우, epoch가 증가함에 따라 지속적으로 test loss값이 감소한 반면, 교차 니콜의 경우 10회차 이후에는 뚜렷한 감소의 경향성이 보이지 않았다 (Fig. 2A, 2B). 이는 교차 니콜 이미지를 training 하는 과정에서 일어난overfitting으로, 보다 다양한 색상이 등장하며 여러 order가 유사한 간섭색을 보이는 교차 니콜 이미지만으로 인공지능 모델을 구성하기엔 무리가 있음을 의미한다. 각모델의 evaluated accuracy 값을 살펴보면, 직교 니콜의 경우 약 30회의 epoch에서 모델의 평가가 마무리되는 반면, 개방 니콜의 경우 40~50회에서도 지속적인 모델의 평가가 일어남이 확인된다 (Fig. 2C, 2D).
Table 2 . Accuracy and loss value results obtained by learning at intervals of 10 times up to 100 times for 4 data sets
Value | Epoch | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 | ||
Accuracy | PPL | 0.6000 | 0.6778 | 0.7667 | 0.7556 | 0.7778 | 0.8222 | 0.8333 | 0.8444 | 0.8556 | 0.9222 |
XPL | 0.5444 | 0.5778 | 0.6000 | 0.6222 | 0.5889 | 0.6111 | 0.6444 | 0.6667 | 0.6222 | 0.6556 | |
P+X | 0.6733 | 0.8800 | 0.7933 | 0.9067 | 0.8933 | 0.9067 | 0.8867 | 0.8333 | 0.8600 | 0.8333 | |
P+X+G | 0.6467 | 0.7733 | 0.8867 | 0.8000 | 0.8800 | 0.8733 | 0.8800 | 0.8867 | 0.8533 | 0.8933 | |
Loss | PPL | 0.0998 | 0.0699 | 0.0538 | 0.0542 | 0.0606 | 0.0419 | 0.0432 | 0.0365 | 0.0404 | 0.0213 |
XPL | 0.0893 | 0.0937 | 0.1018 | 0.1082 | 0.1148 | 0.0959 | 0.0900 | 0.0994 | 0.1041 | 0.0902 | |
P+X | 0.0753 | 0.0284 | 0.0532 | 0.0262 | 0.0249 | 0.0223 | 0.0347 | 0.0424 | 0.0355 | 0.0373 | |
P+X+G | 0.0726 | 0.0596 | 0.0316 | 0.0561 | 0.0352 | 0.0339 | 0.0292 | 0.0261 | 0.0357 | 0.0258 |
개방 니콜과 직교 니콜에서 촬영된 이미지 총 600장인경우와, 추가로 gypsum plate를 장착하고 촬영한 이미지를 더하여 총 600장인 경우로 나누어 epoch 10~100회 학습하여 test를 진행하였다. 최대 100회의 딥러닝 시행 결과, 개방 및 직교 니콜 이미지 복합종의 경우 0.8333, gypsum plate를 장착한 이미지를 포함한 복합종의 경우0.8933의 높은 accuracy 값을 보였다 (Table 2). Loss값 또한 각각 0.0373과 0.0258로 XPL 단일종에 비해 매우 낮게 나타났다. 더불어 두 복합종 모두 직교 및 개방 니콜단일종과 비교했을 때, epoch 약 20회 이후에는 낮은 test loss값을 나타내며 비교적 안정적인 모습을 보였다 (Fig. 3A, 3B). Evaluated accuracy 또한 epoch 20회 이후에는 안정적으로 1에 가까운 높은 값을 지시하였다 (Fig. 3C, 3D).
직교 니콜 이미지로 학습된 단일종 모델의 경우 전체적으로 정확도가 부족하며, 특히 olivine tholeiite 예측에서 매우 낮은 정확도를 보였다(Fig. 4A). Olivine tholeiite는 주로 basaltic andesite로 잘못 인식하는 경우가 많았는데, 복합종 모델이나 개방 니콜 이미지를 활용한 단일종 모델의 경우 olivine tholeiite의 예측 정확도가 상당히 높았다. 따라서 andesite와 tholeiite를 구분하기 위해서 개방 니콜 이미지를 인공지능 모델 학습에 반드시 포함시키는 것이 높은 정확도를 획득하기에 유리하다. Basaltic andesite의 경우, 개방 니콜 이미지 학습 단일종 모델과 개방 및 직교 니콜 이미지 학습 복합종 모델에서 상대적으로 높은 정확도를 보인다 (Fig. 4A). 이는 K-means clustered data histogram에서도 확인할 수 있듯이 안산암류 암석에 포함된 각섬석 등의 유색광물이 개방 니콜에서 다른 광물과 상당한 차이를 보이기 때문인 것으로 해석된다 (Fig. 4B). 따라서 흑운모, 각섬석과 같이 개방 니콜에서 특징을 보이는 광물종이 포함된 암석의 경우, 개방 니콜 이미지만을 이용하거나 개방 니콜과 직교 니콜이 포함된 이미지를 학습시킨 모델을 사용하는 것이 유리하다. Trachytic olivine basalt의 경우 모든 모델에서 유사한 예측 정확도를 보이는데, 이는 인공지능 모델이 다른 암석종 판별 프로세스와 달리 trachytic texture에서 나타나는 미구조적 특징으로 암석을 판별하려 시도했을 가능성이 높다 (Fig. 4A). 상대적으로 정확도가 높은편에 속하지는 않았으나, 어떤 모델을 이용하더라도 충분한 정확도를 보인다.
단일종 모델은 직교 니콜 이미지를 학습한 모델이 상대적으로 낮은 정확도를 보인다. 이는 중-염기성 화산암은 많은 유색광물과 사장석을 포함하며, 유사한 미구조를 보이기 때문인 것으로 보인다. 단사휘석, 사방휘석, 감람석과 같은 낮은 규산염 함량을 갖는 조암광물들은 교차 니콜에서 간섭색이 유사하여 구분하기 쉽지 않고, 오히려 광물의 형태와 모양, 전반적인 미구조를 세밀하게 파악할 수 있는 개방 니콜 쪽이 암석명을 판별하기에 유리했던 것으로 생각된다. 복합종 모델의 경우 두 경우 모두 상당히 높은 정확도를 획득했는데, gypsum plate를 장착하고 촬영한 이미지를 포함시킨 모델에서 두드러진 변화를 보이지는 않았다. 결국 인공지능 모델의 판별 방식도 개방 니콜과 직교 니콜만으로도 대부분의 광물과 암석을 파악할 수 있는 지질학적 지식기반 프로세스와 크게 다르지 않을 것으로 예상된다.
염기성 화산암의 편광현미경의 개방 및 직교 니콜 이미지를 활용하여 인공지능 모델을 훈련하였을 때, 정확도 80~90% 이상의 준수한 암석 분류 결과를 도출할 수 있었다. 직교 니콜 이미지만을 이용한 모델은 정확도가 낮았으며, 개방 니콜 이미지 단일종과 복합종은 높은 정확도를 보였다. 특히 복합종은 비교적 적은 학습 시행 횟수로도 상대적으로 정확한 분류를 해내는 모습을 보였다. 분류 암석종 중 basalt와 tholeiite를 구분하기 위해서는 직교 니콜 이미지를 적극 활용하는 것이 분류 정확도를 상승시키며, basaltic andesite와 같이 중-염기성 화산암과의 분류에서는 개방 니콜 이미지를 적극 활용하는 것이 분류 정확도를 상승시킨다. 또한 trachytic texture 등의 뚜렷한 미구조적 특징이 있는 암석의 경우, 개방 니콜 이미지를 활용하는 것이 적합하다. 결과적으로 지질학자가 암석을 구분하는 프로세스와 본 연구에서 개발된 인공지능 모델의 방식이 매우 유사함을 알 수 있다.
이 연구는 한국연구재단의 광화유체 진화의 미시적 해석: 마그마성-열수 광화작용의 새로운 이해 사업의 (NRF-2018R1D1A1B07051418)의 일환으로 수행되었음을 밝힙니다.
![]() |
![]() |