주요 컨텐츠로 이동

솔루션 액셀러레이터: 데이터브릭스와 함께 운영 효율성을 위한 디지털 트윈 구축하기

파와릿 라오선타라
Thomas Bonfert
Bala Amavasai
이 포스트 공유하기

번역: HaUn Kim - Original Blog Post

자세한 내용을 확인하고 노트북을 다운로드하려면 디지털 트윈을 위한 솔루션 액셀러레이터를 확인해보세요.

디지털 트윈은 실제 물리적인 시스템이나 프로세스를 실시간 가상으로 구현한 것으로, 제조업에서 품질 관리, 공급망 관리, 예측 유지보수 및 고객 경험에 중요한 역할을 하고 있습니다.

제조업체들은 제품을 더 빠르게 출시하고 생산 프로세스를 최적화하며, 동시에 민첩한 공급망을 대규모로 구축하고 낮은 비용으로 운영함으로써 최고의 투자자본수익률(ROIC)을 보장해야 하는 시장 역학에 대응하고 있습니다. 이러한 과정에서 디지털 트윈은 프로세스 최적화 모델링, 위험 평가, 상태 모니터링, 최적화된 설계 등을 가능하게 함으로써 큰 역할을 수행합니다.디지털 트윈은 이러한 과정에서 프로세스 최적화 모델링, 위험 평가, 상태 모니터링, 최적화된 설계 등을 가능하게 함으로써 중요한 역할을 합니다.

디지털 트윈이란 무엇인가요?

디지털 트윈은 사물, 제품, 장비, 사람, 프로세스 또는 전체 제조 생태계를 가상으로 표현한 개념입니다. 디지털 트윈은 주로 IoT 또는 IIoT를 통해 사물에 부착되거나 내장된 센서에서 파생된 데이터를 사용하여 생성됩니다. 이 데이터는 실시간으로 사물에 일어나는 일에 대한 구조적이고 운영적인 관점을 제공하여 엔지니어가 시스템을 모니터링하고 시스템 역학을 모델링할 수 있도록 도와줍니다. 원본 시스템을 변경하기 전에 디지털 트윈을 활용하여 실제 변경 사항의 영향을 사전에 평가할 수도 있습니다.

이산형 또는 연속형 제조 프로세스의 경우, 디지털 트윈은 다양한 IoT 센서(IT 및 OT 모두)를 활용하여 프로세스 및 시스템 데이터를 수집하고 가상 모델을 형성한 후 시뮬레이션을 실행하여 성능 문제를 연구하고 새로운 인사이트를 도출하는 데 사용됩니다.

디지털 트윈은 제조업계에서 다음과 같은 몇 가지 일반적인 과제를 해결하는 데 도움이 됩니다:

  • 제품 설계의 복잡성 증가로 인한 비용 증가 및 개발 기간의 장기화
  • 불투명한 공급망
  • 생산 라인의 최적화 부족 - 성능 변화, 알 수 없는 결함, 운영 비용 예측이 모호함
  • 부실한 품질 관리 - 이론에 지나치게 의존하고 개별 부서에서만 관리
  • 부서 간 사후 대응 유지보수 비용으로 인해 과도한 다운타임 또는 프로세스 중단 발생
  • 실시간 피드백을 수집할 수 없어 고객 수요 예측이 매우 어려움

데이터브릭스가 디지털 트윈 제공을 지원하는 방법

과거에는 디지털 트윈을 위한 소프트웨어 제품군이 라이선스 비용이 매우 비싸고 기업의 다양한 애플리케이션 및 분석 환경과의 통합이 제한적이었습니다. 독점 프레임워크와 자본 집약적인 라이선스 모델은 애플리케이션 개발뿐만 아니라 조직의 다른 팀이나 개인에 대한 데이터 및 인사이트의 민주화를 어렵게 만들었습니다.

하지만 오늘날 사용량 기반 클라우드 서비스는 진입 장벽을 크게 낮추었습니다. 또한 개방형 표준과 인터페이스(예: Apache Kafka, REST API, Python/SQL)의 융합으로 인해 통합과 재사용이 크게 용이해졌습니다. 이러한 변화는 기업들에게 많은 혜택을 제공하고 있습니다.

Digital Twins: Past, Present, & Future
Digital Twins: Past, Present, & Future

그럼에도 불구하고, 디지털 트윈은 실제 데이터를 활용하여 지속적으로 인사이트를 생성할 수 있는 점에서 기존의 시뮬레이션 솔루션과 차별화됩니다. 디지털 트윈에 필요한 데이터는 다양한 소스 (예: 센서 데이터, 객체 사양, 생산 프로세스)에서 다양한 형식으로 대량으로 제공될 수 있습니다. 그러나 기업들은 여전히 데이터의 최신성, 비용 대비 성능, 복잡한 비즈니스 로직을 표현할 수 있는 유연성 사이에서 절충점을 찾는 데 어려움을 겪고 있습니다.

데이터브릭스 레이크하우스 플랫폼은 다음과 같은 기능을 통해 위의 문제를 직접 해결할 수 있습니다:

  • 스파크 구조화된 스트리밍을 통해 IoT 센서 데이터를 거의 실시간으로 처리합니다.
    • SQL, Python, Scala, Java를 지원하는 확장 가능하고 내결함성이 뛰어난 스트림 처리 엔진을 제공합니다.
    • 복잡한 이벤트 처리를 지원하며, 스테이트풀 작업도 포함됩니다. 이는 물리적 프로세스 모델링에 매우 중요한 기능입니다.
    • 임의의 REST API, SDK, 라이브러리를 지원하여 머신 러닝 추론 등 다양한 용도로 사용할 수 있습니다.
    • Project Lightspeed를 통해 성능을 두 배로 향상시키고, Python 기능을 확장하여 스트리밍 워크로드를 더욱 효율적으로 처리할 수 있습니다.
  • 통합 분석 및 머신 러닝 수명 주기 관리(ML Ops)를 지원합니다.
  • Unity Catalog를 통해 데이터 거버넌스, 공유 및 계보 관리 기능을 제공합니다.
  • 데이터 버전 관리와 안정적인 데이터 관리를 통해 신뢰할 수 있는 단일 소스로 분석 데이터를 제공합니다.

이러한 기능들을 통해 데이터브릭스 레이크하우스 플랫폼은 기업들이 디지털 트윈을 효과적으로 활용할 수 있도록 도움을 줍니다.

아키텍처

최신 엔드투엔드 디지털 트윈은 다음 네 가지 기능을 필요로 하는 경우가 많습니다.

  • 3D 모델, 온톨로지, 지식 그래프 등을 통한 트윈 시각화 및 탐색
  • 실제 데이터의 적시 처리
  • 스테이트풀 운영 및 확장 가능한 상태 관리
  • 사용자 지정 로직 및 라이브러리에 대한 유연한(프로그래밍 방식) 지원

High-level data architecture for digital twins
High-level data architecture for digital twins

Azure 디지털 트윈이나 AWS IoT 트윈메이커와 같은 서비스는 주로 디지털 트윈을 정의, 탐색 및 시각화하는 첫 번째 기능을 해결합니다. AzureAWS에서 제공하는 예제를 살펴보세요.

데이터브릭스는 나머지 세 가지 기능을 통합적으로 해결하여 데이터의 양과 속도를 적절히 처리하고 의미 있는 인사이트를 계산하여 다양한 다운스트림 애플리케이션에 전달할 수 있도록 지원합니다.

이 새로운 솔루션 액셀러레이터(노트북 포함)에서는 디지털 트윈을 위한 예측 유지보수 사용 사례를 보여드리고 있습니다. 데이터 사이언티스트들은 데이터 버전 관리, 실험 추적, 모델 관리를 위한 MLOps 모범 사례를 준수하면서 Databricks AutoML을 사용하여 결함 진단을 위한 모델을 효율적으로 훈련시킬 수 있습니다. 검증이 완료되면 복잡한 핸드오버나 재구현 프로세스 없이도 동일한 모델을 스트리밍 파이프라인에 즉시 배포할 수 있습니다. 마지막으로, 생성된 모든 예측 또는 인사이트는 모니터링 및 탐색을 위해 트윈 서비스에 지속적으로 전달할 수 있습니다.

예측 유지 관리 및 이상 징후 탐지와 같은 고급 사용 사례가 점점 더 인기를 얻고 있지만, 애드혹 데이터 탐색, 근본 원인 분석, 알림과 같은 보다 간단한 작업도 로우코드 사용자도 Databricks SQL의 사용자 정의 가능한 대시보드알림을 통해 쉽게 액세스할 수 있습니다.

Twin visualization and exploration with Azure Digital Twins
Twin visualization and exploration with Azure Digital Twins

 

Self-service root cause analysis with Databricks SQL
Self-service root cause analysis with Databricks SQL

디지털 트윈 솔루션 액셀러레이터 체험하기

어떻게 작동하는지 궁금하신가요? 제조 분야의 디지털 트윈을 위한 데이터브릭스 솔루션 액셀러레이터를 확인해 보세요. 제공된 단계별 지침에 따라 사용자는 데이터브릭스 및 Azure 디지털 트윈에서 제공하는 빌딩 블록을 조립하여 성능과 확장성이 뛰어난 엔드투엔드 디지털 트윈을 구현하는 방법을 배울 수 있습니다.

Databricks 무료로 시작하기

관련 포스트

모든 산업 포스트 보기