주요 트렌드 집중 탐구/AI(인공지능)

머신러닝의 GIS분야 활용을 위한 데이터 훈련

Geo smurfs 2023. 2. 13. 17:18

GIS와 머신러닝(기계 학습)의 교차점은 진화하고 있으며 ML의 새로운 사용 사례와 애플리케이션을 전면에 내세우고 있습니다. 민간 부문과 공공 부문을 포괄하는 이러한 애플리케이션은 위성, 드론, 카메라, LIDAR 센서 등에서 캡처한 대량의 데이터를 기반으로 하며, 이 모든 것이 함께 모여 세계에 대한 종합적인 시각을 제공합니다. 엄청난 양과 다양한 데이터로 인해 관리 및 사용이 복잡해집니다.

 

GIS용 ML 애플리케이션이 복잡해짐에 따라 이러한 새로운 애플리케이션을 위한 고품질 참값(high-quality ground truth) 또는 훈련 데이터를 생성하는 것이 어려워질 수 있습니다. 훈련 데이터 세트가 상당히 커야 하는 경우가 많다는 것은 널리 알려져 있지만 이러한 데이터 세트에 주제 전문가나 다양한 분야의 교육을 받은 직원이 라벨을 지정해야 하는 경우가 점점 더 많아지고 있다는 사실은 잘 알려져 있지 않습니다.

공간정보 영상에서 유사한 스펙트럼, 공간 및 텍스처 특성을 추출하여 다양한 사용 사례를 강화하는 기능 추출 또는 프로세스는 데이터 세트 생성의 기본입니다. 오늘날 깊은 연관성이 있는 훈련되고 관리되는 데이터 라벨러 및/또는 GIS 기술자를 활용하여 GIS 훈련 데이터를 생성할 수 있는 고유한 기회가 있습니다. 현장 내 응용 범위가 다양하기 때문에 각 사용 사례에 필요한 데이터 유형과 주제 전문 지식 또는 둘의 혼합에 대한 깊은 이해가 필요합니다.

 

  • 민간과 공공분야의 공간(정보) 지능

공간(정보) 지능은 지리정보와 지리적 공간의 요소 분포를 제공하며 이제 국가 안보에서 토지 사용 및 계획, 농업 및 다양한 상업 및 정부 기능에 이르기까지 모든 것을 위한 필수 도구가 되고 있다. 공간정보 응용 프로그램의 사용 사례는 토지 사용 계획, 상업 및 주거 보험, 농업, 국가 안보, 석유 및 가스 탐사, 소매를 포함하여 광범위한 공공 및 민간 부문 활동에 걸쳐 있습니다.  

-보험: GIS는 위험 관리에 필요하고 사용할 수 있는 정확한 위치 기반 통찰력(location-based insights)을 제공할 수 있습니다. 자산이 놓여있는 위치, 산업 지역, 자연 요소와 같은 위험으로부터의 근접성과 같은 위치 관련 정보는 보험 회사가 위험 프로필(risk profiles)을 개발하는 데 중요합니다. 이러한 정보에 대한 액세스는 보험사가 정보에 입각한 결정을 내리는 데 유용할 수 있습니다.

- 농업: 공간(정보) 지능은 밭과 농작물에 대한 조감도를 제공함으로써 농민의 노력을 보완할 수 있습니다. 이 데이터는 수역과 같은 천연 자원의 수확량, 작물 건강, 위협 또는 가용성의 확산을 이해하는 데 유용합니다. 이 모든 것을 통해 농부 또는 관련 기업은 수확량을 높이고 시간과 노력을 줄이기 위해 올바른 결정을 내릴 수 있습니다.

- 공공부문: 공공 부문에서는 공간(정보) 지능에 엄청난 혁신이 일어나고 있습니다. 종종 미국과 같은 국가의 국방부는 공간(정보) 데이터를 사용하여 보안 조치를 평가하고 지능형 군사 작전을 배치합니다. Maxar Technologies와 같은 회사는 러시아-우크라이나 분쟁의 지상 이미지를 실시간으로 제공하여 러시아의 진출에 대한 정보를 전 세계에 공유하고 있습니다.
마찬가지로 전 세계 국방부는 공간(정보) 데이터와 원격 감지를 사용하여 미확인 항공기, 스파이 드론, 전투기 등을 탐지하여 지상 또는 공중에서 적의 움직임을 모니터링합니다. 이 외에도 공간(정보)는 홍수 및 지진과 같은 가능한 자연 재해를 주시하기 위해 정부에서 사용하고 있습니다. 이것은 생명과 재산의 손실을 줄이기 위해 구조 임무를 신속하게 계획하고 전략화하는 데 중요합니다.
이러한 다양한 애플리케이션에 직면했을 때, 전문가 팀을 확장하고 프로젝트 전반에 걸쳐 온보딩 교육, 프로젝트 관리 및 품질 보증을 제공하는 워크플로는 데이터 및 ML 모델의 최종 배포를 염두에 두고 구축해야 합니다.

 

  • GIS 툴과 기술들

공간(정보) 지능에서 데이터는 위성, 드론 그리고 다른 항공 자원을 통해 수집된다. 이런 자원은 특정 지리 영역내 모든 정보를 캡처하고, 데이터 어노테이션은 최종 이용 사례에 따라 다양하다. iMerit에서는 워크플로 및 프로젝트 설계가 광범위한 공간(정보) 응용 프로그램에 맞게 조정됩니다.

-보험: 보험 회사의 경,우 iMerit는 이미지 분류 및 2D 다각형 주석을 사용하여 창문, 문, 차고, 수영장과 같은 건물의 특징을 캡처하여 보험료를 평가합니다.

-국방: 군대의 경우 데이터 캡처가 정교하고 여러 가지 방법과 기술 지원이 필요합니다. SONAR와 같은 기술은 데이터 수집에도 사용됩니다. LIDAR 방법은 지형도(topographic map)를 생성하는 데 사용할 수 있는 최상위 이미지를 생성하여 다양한 사용 사례에 대해 다양한 고도(elevations)를 보여주고 고도 모델(elevation models)을 분사합니다.

-인프라감시: 인프라 검사의 경우 드론은 RGB 비디오 및 LIDAR 센서와 함께 전송되어 다양한 취약 영역(different areas of weakness)이나 교체가 필요한 영역을 평가할 수 있는 높은 충실도(high-fidelity)의 스캔 또는 인프라 모델을 얻습니다.

 

예를 들어, 캘리포니아는 공간(정보) 지능의 도움으로 전력선용 노후 에너지 인프라에 대한 최신 정보를 보유하고 있는 것으로 알려져 있습니다. 텍사스는 눈보라의 영향을 받은 인프라가 드론 및 기타 공중 수단을 사용하여 식별되고 복원되는 예를 보여주고 있다.

 

  • 공간(정보) 지능을 위한 미래 데이터 솔루션

사용 가능하고 수집되는 데이터의 양이 크게 증가했습니다. 더 높은 해상도와 더 나은 품질의 데이터에 대한 요구도 마찬가지입니다. 비교적 새로운 SAR(Synthetic Aperture Data)과 같이 다양한 유형의 데이터가 등장하고 있습니다. 우리는 데이터를 수집하는 다양한 방법을 경험하기 시작했습니다. 정말 혁신적인 것은 세계의 다양한 양상에 대한 매우 정확한 3D 표현 또는 모델을 생성하는 데 기여할 수 있는 LIDAR입니다.
점점 더 많이 사용되고 있는 또 다른 흥미로운 관점이 있는데, 머신 러닝과 컴퓨터 비전을 이러한 데이터 유형에 적용하여 일반적으로 GIS 분석가가 수동으로 수행하는 이 분석의 일부를 자동화합니다.
GIS와 기계 학습은 계속 발전하여 고유한 사용 사례와 그에 따른 데이터 사용의 복잡성을 전면에 내세울 것입니다. 이러한 역동성은 인공 지능 및 기계 학습 주도 시스템에 공급할 고품질 데이터를 원활하게 제공하기 위해 데이터 주석 작성자의 교육 및 개발 기술이 필요합니다. 따라서 데이터 주석 제공업체가 정보에 입각한 결정을 내릴 수 있도록 비즈니스와 사회를 위해 간소화된 고품질 데이터를 제공하는 기술, 인재 및 기술을 결합하는 것이 중요합니다.

 

※ 일부 내용을 발췌하여 번역하고 재구성함

 

 

(Sources: Kyle Miller, 2023, Training Data for GIS Applications of Machine Learning, blog, Feb.06, 2023, cited from https://www.geospatialworld.net/blogs/training-data-for-gis-applications-of-machine-learning/) (accessed Feb. 13, 2023)