(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
제품 추천, 이탈 예측, 광고 속성 및 사기 탐지와 같은 사용 사례를 생각해보면, 공통 분모는 우리가 다양한 상호 작용을 통해 고객을 지속적으로 식별해야 한다는 것입니다. 온라인에서 브라우징하고, 매장에서 구매하고, 마케팅 이메일을 열고, 광고를 클릭하는 것이 동일한 사람임을 인식하지 못하면, 고객에 대한 불완전한 시각을 가지게 되어 그들의 필요성, 선호도 및 미래의 행동을 예측하는 능력을 제한하게 됩니다.
그 중요성에도 불구하고, 이러한 상호작용에서 고객을 정확하게 식별하는 것은 무척 어렵습니다. 사람들은 종종 명확한 식별 정보를 제공하지 않고 상호 작용하며, 그렇게 할 때 그 정보가 항상 일관되지는 않습니다. 예를 들어, 고객이 Jennifer라는 이름으로 신용카드를 사용하여 구매하고, 개인 이메일로 Jenny라는 이름으로 로열티 프로그램에 가입하고, 그녀의 업무 이메일에 연결된 온라인 광고를 클릭하면, 이러한 상호 작용은 모두 동일한 사람에게 속하고 있 음에도 불구하고 세 개의 별개의 고객으로 나타날 수 있습니다(그림 1).
이를 단일 고객에 대해 해결하는 것은 도전적이지만, 실제 복잡성은 수십만, 심지어 수백만의 고유한 고객들에게 이를 해결하는 데 있습니다. 이들 고객들은 소매업체들이 지속적으로 참여하고 있습니다. 또한, 고객의 세부 정보는 고정되어 있지 않습니다 - 새로운 행동, 식별자, 가구 관계가 나타나면서, 우리가 고객이 누구인지에 대한 이해도 계속 발전해야 합니다.
Identity resolution (IDR)은 이러한 모든 세부 정보를 결합하여 각 고객에 대한 통합된 시각을 도출하는 데 사용되는 기법을 설명하는 용어입니다. 효과적인 IDR은 개인화된 마케팅 등 고객 중심의 모든 프로세스를 가능하게하고 영향을 미칩니다.
많은 시나리오에서, 고객 신원은 개인 식별 정보(PII)라고 부르는 데이터를 통해 확립됩니다. 이름, 성, 우편 주소, 이메일 주소, 전화 번호, 계좌 번호 등은 고객과의 상호 작용을 통해 수집되는 PII의 일반적인 부분입니다.
PII의 중복 부분을 사용하여 개인의 몇 가지 다른 기록을 일치시키고 병합하려고 시도할 수 있지만, PII의 유형에 따라 허용되는 불확실성의 정도가 다릅니다. 예를 들어, 잘못 입력된 이메일 주소나 전화번호에 대한 정규화 기법을 사용하거나, 이름 변형에 대한 퍼지 매칭 기법을 사용할 수 있습니다. Jennifer vs Jenny vs Jen) (그림 2).
그러나 종종 PII가 겹치지 않는 상황이 발생합니다. 예를 들어, 고객이 한 레코드에 이름과 우편 주소를 제공하고, 다른 레코드에 이름과 이메일 주소를 제공하고, 세 번째 레코드에 전화 번호와 동일한 이메일 주소를 제공했을 수 있습니다. 연관성을 통해, 우리는 이들이 모두 같은 사람일 수 있다는 것을 추론할 수 있습니다. 이는 우리의 불확실성에 대한 허용도에 따라 다릅니다 (그림 3).
IDR 과정의 핵심은 정확한 매칭 규칙과 퍼지 매칭 기법을 결합하여, 다양한 데이터 요소에 맞게 통합된 고객 신원을 설정하는 데 있습니다. 결과적으로, 새로운 세부 정보가 수집되고 신원 그래프에 편입됨에 따라 고객이 누구인지에 대한 확률적 이해가 발전합니다.
고객 신원 그래프를 구축하고 유지 하는 도전은 Databricks의 Amperity Identity Resolution 엔진과의 통합을 통해 쉽게 해결할 수 있습니다. Amperity는 세계 최고의 일차적 IDR 솔루션으로 널리 인정받고 있으며, 45개 이상의 알고리즘을 활용하여 고객 레코드를 매칭하고 병합합니다. 박스 밖 통합을 통해 Databricks 고객들은 Amperity와 자신들의 데이터를 원활하게 공유하고, 고객 기록 모음이 통합된 신원으로 어떻게 해결되는지에 대한 자세한 통찰력을 얻을 수 있습니다. (그림 4).
이 통합을 설정하고 Amperity에서 IDR을 실행하는 과정은 매우 간단합니다:
이 단계에 대한 자세한 가이드는 Amperity Identity Resolution Quickstart Guide에서 찾을 수 있으며, 과정에 대한 비디오 안내는 여기에서 볼 수 있습니다:
통합의 최종 결과는 통합된 고객 요소와 각 고객에 대한 선호 신원 정보의 제안을 포함하는 관련 테이블 세트입니다 (그림 5).
데이터 엔지니어, 데이터 과학자, 애플리케이션 개발자들은 Databricks에서 결과 데이터를 활용하여 일반적인 기업 요구사항과 사용 사례를 해결하기 위한 다양한 솔루션을 구축할 수 있습니다:
만약 귀사가 고객 신원 확인 문제에 직면하고 있다면, 무료 30일 체험판에 가입하여 Amperity의 Identity Resolution을 시작할 수 있습니다. 이를 수행하기 전에, 고객 데이터 자산에 접근할 수 있고, Databricks 환경에서 Delta Sharing을 설정할 수 있는 능력을 확보하는 것이 좋습니다. 또한 Amperity가 제공하는 샘플 데이터를 사용하여 빠른 시작 가이드 의 단계를 따르는 것을 권장합니다. 이를 통해 전체 과정에 익숙해질 수 있습니다. 마지막으로, 항상 Databricks 와 Amperity 대표에게 연락하여 솔루션에 대한 자세한 정보와 그것이 어떻게 특정 필요에 맞게 활용될 수 있는지에 대해 더 자세히 알아볼 수 있습니다.