주요 컨텐츠로 이동

지리공간 분석을 통한 장비 이용 최대화

Databricks DLT, 공간 시간 SQL 함수, 그리고 H3를 활용하여 확장 가능한 스트리밍 지리공간 분석을 수행합니다.

Maximizing Equipment Utilization Through Geospatial Analytics

Published: April 22, 2025

에너지2분 소요

운영 사이트 전반에 배치된 고가 장비를 관리하는 것은 건설 회사들에게 공통적인 도전 과제입니다. 이에 대한 대응으로, 많은 원래 장비 제조업체들이 장비를 사물인터넷에 연결하고 있으며, 이는 프로젝트 수명주기 전반에 걸쳐 효율성을 높이는 디지털 솔루션에 대한 새로운 기회를 만들어냅니다. 2017년 McKinsey 보고서에 따르면, 기술 중심의 솔루션은 업계 간 생산성을 최대 60%까지 향상시킬 수 있습니다. 장비의 실시간 분포를 이해하는 것은 플릿 관리자가 다운타임을 줄이고 장비 이용률을 향상시키는 데 도움이 될 수 있습니다. GPS 추적 및 지리공간 분석을 활용함으로써, 회사들은 장비 배치, 유지 보수 스케줄링, 작업 사이트 전반의 자원 할당에 대한 데이터 기반의 결정을 내릴 수 있습니다.

지리공간 데이터를 활용하여 실시간 결과를 제공하는 것은 어렵고 복잡한 처리가 필요합니다. 일반적인 도전 과제 중 하나는 자산이 작업장 내에서 운영되고 있는지 판단하는 것입니다. Databricks는 수천 개의 사이트에서 다각형 내의 점 조회 결과를 스트리밍하기 위해 Delta Live Tables 에서 여러 지리공간 기능을 혼합하는 기능을 제공합니다. H3 지리공간 인덱싱 을 위한 제품 API와 현재 미리보기 중인 공간 시간 (ST) 함수를 사용하여, 특정 운영 사이트에 장비 위치를 매핑하는 다각형 내의 점 지리공간 “하이브리드” 조인 패턴을 큰 규모와 정확성으로 구현할 수 있습니다. 장비 또는 편성 관리자가 각 자산의 위치를 파악하면, 통계적 통찰력이나 보고서를 계산하여 효율적인 유지보수 스케줄링을 돕거나, 통행 시간과 다운타임을 줄이거나, 자원이 부족한 위치로 장비를 보낼 수 있습니다.

H3란 무엇인가요?

H3는 지구를 균일한 육각형 셀로 나누는 오픈 소스 지리공간 인덱싱 시스템으로, 각 셀마다 고유한 식별자가 있습니다. 그 정밀도와 높은 확장성으로 인해 지리공간 데이터 분석에 이상적입니다.

H3의 주요 기능:

  • 육각 그리드 시스템: 사각형 대신 육각형을 사용하여 공간 관계를 더 잘 보장하고 왜곡을 최소화하며 일관된 영역 커버리지를 보장합니다.
  • 계층적 구조: 16개의 해상도(0-15)를 지원하며, 각 레벨에서는 하나의 육각형을 대략 7개의 더 작은 육각형으로 세분화하여 다양한 정밀도를 가능하게 합니다.
  • 효율적인 공간 연산: 셀 ID를 사용하여 복잡한 기하학적 형태 대신 공간 조인, 최근접 이웃 검색, 그리고 다각형 내의 점 계산을 단순화합니다.

해상도에 따른 H3 차원
Figure x: H3 dimensions by resolution; Visual representation of different resolutions.

DLT 파이프라인 예제를 살펴보기 전에, 우리의 장비 위치와 운영 사이트 경계를 시각화해봅시다. 점들은 우리의 장비를 나타내고, 다각형은 작업장이며, 유지보수 사이트는 원입니다.

운영 사이트와 장비 자산
Figure 1: Operational sites (red) and equipment assets (green) drawn without H3.

Delta Live Tables 파이프라인 개요

이 DLT 파이프라인은 작업장, 유지 보수 사이트 또는 사이트 간 이동 중인 총 자산의 백분율을 시간별로 스트리밍 계산하여 생성합니다. 이를 통해 우리의 장비 플릿의 전체적인 이용률을 모니터링할 수 있습니다.

표 1: 마지막 시간별 장비 위치

우리의 첫 번째 스트리밍 테이블은 GPS 추적 데이터를 시간별 창으로 그룹화하고 각 장비의 마지막으로 알려진 위도와 경도 위치를 선택합니다.

표 2: H3 및 공간 시간 함수를 이용한 점-다각형 결합

이제 각 자산의 시간당 마지막 위치를 가지고 있으므로, 우리는 H3 지리공간 인덱싱을 사용하여 우리의 자산을 운영 사이트에 매핑하는 다각형 내의 점 조인 패턴을 구현할 수 있습니다. 또한, Databricks에서 제공하는 일련의 ST 함수도 사용하고 있습니다.

코드가 어떻게 작동하는지 설명하겠습니다.

H3 인덱싱: 지리공간 조인을 위한 데이터 준비

첫 번째 단계는 자산의 GPS 좌표와 운영 사이트를 나타내는 폴리곤 경계에 모두 H3 인덱스를 할당하는 것입니다.

  • 해상도 선택: 더 큰 셀을 가진 낮은 해상도는 계산 요구 사항을 줄일 수 있으며, 더 작은 셀을 가진 높은 해상도는 정밀도를 향상시킵니다. 우리의 예시에서는, 우리는 해상도 11을 선택했는데, 이는 대략 2,150 제곱미터이며, 우리의 분석에 필요한 세부 수준과 일치합니다.
  • GPS 포인트 인덱싱: 각 자산의 위치의 위도와 경도를 h3_longlatash3를 사용하여 H3 셀 ID로 변환합니다.
    자산 위치에 할당된 H3 셀
    Figure 2: H3 cells assigned to asset locations (dark red hexagon).
  • 사이트 경계 색인화: 각 사이트의 기하학을 h3_tessellateaswkb를 사용하여 H3 셀 세트로 테셀레이션합니다. 이 함수는 3가지 정보를 반환합니다:
    • "cellid" - H3 셀 아이디(entifier)
    • “core” - 셀을 다음과 같이 분류합니다:
      • Core = true: 셀은 사이트 경계 내에 완전히 포함되어 있습니다.
      • Core = false (Boundary): 셀이 사이트 경계와 부분적으로 겹칩니다.
    • “chip” - 다각형 사이트와 H3 셀의 교차 또는 중첩 영역을 나타내는 기하학적 표현.
      H3 셀로 테셀레이션된 운영 사이트
      Figure 3: Operational sites tesselated with H3 cells (Left). Tesselated core cells (red) vs boundary cells (blue).

      단일 사이트 코어
      Figure 4: A single site, “Core” H3 cells (red) and site boundary “chips” (blue).

조인 작업: 자산을 효율적으로 사이트에 매핑

다음 단계는 자산과 사이트 간에 H3 셀 ID를 기반으로 결합 작업을 수행하는 것입니다:

  • Left Join: H3 셀을 사용하여 자산 위치와 사이트를 매칭합니다.
    • 운영 사이트에 위치한 자산.
    • 유지보수 사이트에 있는 자산들.
    • 이동 중인 자산 (site_type = null).
  • 어디에서: “cellid”가 core cell (core = true)인 경우, 셀이 사이트 경계 내에 완전히 포함되어 있으며 추가 처리가 필요하지 않음을 알 수 있습니다.

H3 셀 ID에 조인하는 것은 모든 레코드에 대해 계산 집약적인 지리 공간 작업을 실행할 필요를 제거합니다.

경계 셀에 대한 정확한 기하학적 검사 - 하이브리드 접근법

경계 (core = false)로 분류된 셀은 h3 셀이 사이트 기하학 내에 완전히 포함되지 않기 때문에 정확한 기하학적 검사가 필요합니다. 우리는 st_contains를 사용하여 점-다각형 검사를 수행할 수 있습니다. 이는 실제로 사이트 경계 내에 있는 점만 결합 결과에 포함되도록 보장하며, 해상도의 세밀성으로 인해 발생하는 거짓 양성을 제거합니다.

핵심 셀
Figure 5: Any asset (green) that is in a core cell (red) does not require a geometric calculation for accurate results. Boundary cells (blue) require an st_contains check of the “chip” geometry (also blue) and the asset point (green).

해상도로 인한 거짓 양성
Figure 6: A false positive due to resolution and H3 index only join. This asset (green) would fall with the h3 cell (blue) and be reported as a match. The st_contains expression uses the “chip” geometry to provide an accurate boundary check; it correctly removes the green asset from the results.

표 3: 사이트별 자산 분포

마지막으로, 우리의 DLT 파이프라인에서 마지막 스트리밍 테이블에서는 다른 사이트 유형에 걸쳐 자산의 분포를 계산합니다. 우리는 각 창별 총 자산 수, 각 사이트 유형에서의 자산, 그리고 마지막으로 각 시간별 창에서 텔레메트리를 보고하는 총 자산의 백분율을 계산하기 위해 선택 표현식을 사용합니다.

Delta Live Tables와 H3 지리 공간 인덱싱, 공간 시간 함수, 그리고 다각형 내의 점 "하이브리드" 조인 패턴을 결합함으로써, 우리는 장비 위치를 운영 사이트에 효율적으로 매핑하고 플릿 분포 메트릭을 계산할 수 있습니다. 이 접근법은 공간 연산을 단순화하면서도 정확성을 유지하여, 건설과 같은 산업에서 대규모 실시간 지리공간 분석에 이상적입니다.

상태 유지 스트리밍과 “지리공간 에이전트” 를 통한 실시간 랜드마크 출입 모니터링에 대한 이 시리즈의 다가오는 블로그를 확인해 보세요. 이는 Mosaic AI 에이전트 프레임워크에 지리공간 지능을 통합하여 실시간 배송 추적을 가능하게 합니다.

Databricks에서 H3를 이용한 지리공간 분석의 기원에 대해 더 알아보려면, H3와 Photon을 이용한 어떤 규모에서든 가능한 공간 분석을 확인해보세요. 그리고 Databricks가 ST 함수를 지원하고 지리 및 지리학적 유형에 대한 발전을 위해 계속 주목해 주세요.

 

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요