Ir para o conteúdo principal

Maximizando a Utilização de Equipamentos Através da Análise Geoespacial

Aproveitando o DLT do Databricks, Funções SQL Espaciais Temporais e o H3 para análises geoespaciais escaláveis em streaming.

Maximizing Equipment Utilization Through Geospatial Analytics

Published: April 22, 2025

Energia8 min de leitura

Gerenciar equipamentos de alto valor implantados em locais operacionais é um desafio comum para empresas de construção. Em resposta, muitos fabricantes de equipamentos originais estão conectando equipamentos com a Internet das Coisas, criando novas oportunidades para soluções digitais que impulsionam a eficiência em todo o ciclo de vida do projeto. De acordo com um relatório de 2017 da McKinsey, soluções impulsionadas pela tecnologia poderiam melhorar a produtividade entre indústrias em até 60%. Compreender a distribuição em tempo real dos equipamentos pode ajudar os gerentes de frota a reduzir o tempo de inatividade e melhorar a utilização dos equipamentos. Ao aproveitar o rastreamento por GPS e a análise geoespacial, as empresas podem tomar decisões baseadas em dados sobre a implantação de equipamentos, programação de manutenção e alocação de recursos em locais de trabalho.

Fornecer resultados em tempo real aproveitando dados geoespaciais pode ser difícil e requer processamento complexo. Um desafio comum é determinar se um ativo está operando dentro de um canteiro de obras. Databricks oferece a capacidade de misturar várias capacidades geoespaciais juntas em Delta Live Tables para transmitir resultados de pesquisas de ponto em polígono em milhares de sites. Usando APIs de produto para indexação geoespacial H3 bem como funções Espaciais Temporais (ST), atualmente em pré-visualização, podemos implementar o padrão de junção "híbrida" geoespacial de ponto em polígono para mapear locais de equipamentos para sites operacionais específicos com grande escalabilidade e precisão. Uma vez que um gerente de equipamentos ou frota tem uma visão da localização de cada ativo, eles podem calcular insights estatísticos ou relatórios para ajudá-los a conduzir a programação eficiente de manutenção, reduzir o trânsito e o tempo de inatividade, ou despachar equipamentos para locais com poucos recursos.

O que é H3?

H3 é um sistema de indexação geoespacial de código aberto que divide a Terra em células hexagonais uniformes, cada uma com um identificador único. Sua precisão e alta escalabilidade o tornam ideal para análise de dados geoespaciais.

Principais características do H3:

  • Sistema de Grade Hexagonal: Usa hexágonos em vez de quadrados, garantindo melhores relações espaciais, distorção mínima e cobertura de área consistente.
  • Estrutura Hierárquica: Suporta 16 resoluções (0–15), onde cada nível subdivide um hexágono em aproximadamente sete menores, permitindo precisão variável.
  • Operações Espaciais Eficientes: Simplifica junções espaciais, buscas por vizinhos mais próximos e cálculos de ponto-em-polígono usando IDs de células em vez de geometrias complexas.

Dimensões H3 por resolução
Figure x: H3 dimensions by resolution; Visual representation of different resolutions.

Antes de examinarmos um exemplo de pipeline DLT, vamos visualizar nossas localizações de equipamentos e limites operacionais do site. Os pontos representam nossos equipamentos, os polígonos são locais de trabalho e os locais de manutenção são círculos.

Locais operacionais e ativos de equipamentos
Figure 1: Operational sites (red) and equipment assets (green) drawn without H3.

Visão Geral do Pipeline de Tabelas ao Vivo Delta

Este pipeline DLT cria um cálculo de streaming por hora que mostra a porcentagem do total de ativos implantados em um canteiro de obras, local de manutenção ou em trânsito entre os sites. Isso nos permitirá monitorar a utilização geral da nossa frota de equipamentos.

Tabela 1: Última Localização de Equipamento por Hora

Nossa primeira tabela de streaming agrupa dados de rastreamento GPS em janelas horárias e seleciona a última posição conhecida de latitude e longitude para cada peça de equipamento.

Tabela 2: Junção Ponto-em-Polígono com H3 e Funções Espaço Temporais

Agora que temos a última localização de cada ativo por hora, podemos implementar o padrão de junção ponto-em-polígono usando a indexação geoespacial H3 para mapear nossos ativos em locais operacionais. Além disso, estamos usando um conjunto de funções ST também fornecidas pela Databricks.

Aqui está como o código funciona.

Indexação H3: Preparando Dados para Junções Geoespaciais

O primeiro passo é atribuir índices H3 tanto para as coordenadas GPS dos ativos quanto para os limites do polígono que representam os locais operacionais.

  • Seleção de Resolução: Resoluções mais baixas com células maiores podem reduzir os requisitos de computação, enquanto resoluções mais altas com células menores melhoram a precisão. Em nosso exemplo, escolhemos a resolução 11, que é aproximadamente 2.150 metros quadrados e se alinha com o nível de detalhe necessário para nossa análise.
  • Indexando Pontos GPS: Converta a latitude e longitude de cada localização de ativo em um ID de célula H3 usando h3_longlatash3.
    Células H3 atribuídas a locais de ativos
    Figure 2: H3 cells assigned to asset locations (dark red hexagon).
  • Indexando Limites do Site: Tessellate a geometria de cada site no conjunto de células H3 que cobrem o polígono usando h3_tessellateaswkb. Esta função retorna uma matriz com 3 informações:
    • “cellid” - Identificador de célula H3
    • “core” - Categoriza células como:
      • Core = true: A célula está totalmente contida dentro do limite do site.
      • Core = false (Boundary): A célula está parcialmente sobreposta ao limite do site.
    • “chip” - Geometria representando a interseção ou área de sobreposição do site do polígono e da Célula H3.
      Locais operacionais tesselados com células H3
      Figure 3: Operational sites tesselated with H3 cells (Left). Tesselated core cells (red) vs boundary cells (blue).

      Um único site Core
      Figure 4: A single site, “Core” H3 cells (red) and site boundary “chips” (blue).

Operação de Junção: Mapeando Ativos para Sites de Forma Eficiente

O próximo passo é realizar uma operação de junção entre os ativos e os sites com base em seu ID de célula H3:

  • Junção à esquerda: Combine as localizações dos ativos com os sites usando células H3.
    • Ativos localizados em um local operacional.
    • Ativos em um site de manutenção.
    • Ativos em trânsito (site_type = null).
  • Onde: Se o “cellid” é uma célula core (core = true) sabemos que a célula está totalmente contida dentro do limite do site e não requer mais nenhum processamento.

A junção no ID da célula H3 elimina a necessidade de executar uma operação geoespacial intensiva de computação em cada registro.

Verificação Geométrica Precisa para Células de Limite - A Abordagem Híbrida

Células categorizadas como boundary (core = false) requerem uma verificação geométrica precisa porque a célula h3 não está completamente dentro da geometria do site. Podemos realizar a verificação de ponto-em-polígono usando st_contains. Isso garante que apenas pontos verdadeiramente dentro do limite do site estão incluídos nos resultados da junção, eliminando falsos positivos causados pela granularidade da resolução.

célula central
Figure 5: Any asset (green) that is in a core cell (red) does not require a geometric calculation for accurate results. Boundary cells (blue) require an st_contains check of the “chip” geometry (also blue) and the asset point (green).

Um falso positivo devido à resolução
Figure 6: A false positive due to resolution and H3 index only join. This asset (green) would fall with the h3 cell (blue) and be reported as a match. The st_contains expression uses the “chip” geometry to provide an accurate boundary check; it correctly removes the green asset from the results.

Tabela 3: Distribuição de Ativos entre os Locais

Finalmente, para a última tabela de streaming em nosso pipeline DLT, calculamos a distribuição de ativos em diferentes tipos de sites. Usamos uma expressão select para contar o número total de ativos por janela, os ativos em cada tipo de site e, finalmente, uma porcentagem dos ativos totais relatando telemetria em cada janela horária.

Ao combinar Delta Live Tables com indexação geoespacial H3, funções Espaciais Temporais e o padrão de junção "híbrido" ponto-em-polígono, podemos mapear eficientemente as localizações dos equipamentos para os sites operacionais e calcular as métricas de distribuição da frota. Esta abordagem simplifica as operações espaciais mantendo a precisão, tornando-a ideal para análises geoespaciais em tempo real em escala em indústrias como a construção.

Confira nossos próximos blogs nesta série cobrindo o monitoramento em tempo real de entradas e saídas de marcos com streaming stateful e "agente geoespacial", que integra inteligência geoespacial no Mosaic AI Agent framework para rastreamento de entregas em tempo real.

Para saber mais sobre as origens da Análise Geoespacial com H3 no Databricks, confira Análise Espacial em Qualquer Escala com H3 e Photon. E fique atento para avanços em torno do suporte do Databricks para funções ST, bem como tipos de geometria e geografia.

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada