Quando pensamos em casos de uso como recomendações de produtos, previsões de churn, atribuição de publicidade e detecção de fraude, um denominador comum é que todos eles exigem que identifiquemos consistentemente nossos clientes em várias interações. Falhar em reconhecer que a mesma pessoa está navegando online, comprando na loja, abrindo um e-mail de marketing e clicando em um anúncio, nos deixa com uma visão incompleta do cliente, limitando nossa capacidade de reconhecer suas necessidades, preferências e prever seu comportamento futuro.
Apesar de sua importância, identificar com precisão o cliente em todas essas interações é incrivelmente difícil. As pessoas frequentemente interagem conosco sem fornecer detalhes explícitos de identificação e, quando o fazem, esses detalhes nem sempre são consistentes. Por exemplo, se um cliente faz uma compra usando um cartão de crédito no nome de Jennifer, se inscreve no programa de fidelidade como Jenny com um e-mail pessoal, e clica em um anúncio online vinculado ao seu e-mail de trabalho, essas interações podem parecer como três clientes separados, mesmo que todos pertençam à mesma pessoa (Figura 1).
Embora resolver isso para um único cliente seja desafiador, a verdadeira complexidade reside em abordá-lo para centenas de milhares, ou até milhões, de clientes únicos com os quais os varejistas se envolvem continuamente. Além disso, os detalhes do cliente não são estáticos - à medida que novos comportamentos, identificadores e relações familiares surgem, nossa compreensão de quem é o cliente deve continuar a evoluir também.
Resolução de identidade (IDR) é o termo que usamos para descrever as técnicas usadas para juntar todos esses detalhes para chegar a uma visão unificada de cada cliente. A IDR eficaz é crucial, pois possibilita e afeta todos os nossos processos centrados nos clientes, como o marketing personalizado, por exemplo.
Em muitos cenários, a identidade do cliente é estabelecida através de dados que chamamos de informações pessoalmente identificáveis (PII). Primeiros nomes, sobrenomes, endereços postais, endereços de e-mail, números de telefone, números de conta, etc. são todos pedaços comuns de PII coletados através de nossas interações com clientes.
Usando bits sobrepostos de PII, podemos tentar combinar e mesclar alguns registros diferentes para um indivíduo, no entanto, são permitidos diferentes graus de incerteza dependendo do tipo de PII. Por exemplo, podemos usar técnicas de normalização para endereços de e-mail ou números de telefone digitados incorretamente, e técnicas de correspondência aproximada para variações de nomes (por exemplo, Jennifer vs Jenny vs Jen) (Figura 2).
No entanto, muitas vezes existem situações em que não temos PII sobrepostos. Por exemplo, um cliente pode ter fornecido seu nome e endereço postal em um registro, seu nome e endereço de e-mail em outro, e um número de telefone e o mesmo endereço de e-mail em um terceiro registro. Por associação, podemos deduzir que todas essas são a mesma pessoa, dependendo da nossa tolerância para incerteza (Figura 3).
O cerne do processo de IDR reside em vincular registros combinando regras de correspondência exata e técnicas de correspondência difusa, adaptadas a diferentes elementos de dados, para estabelecer uma identidade de cliente unificada. O resultado é uma compreensão probabilística de quem são seus clientes que evolui à medida que novos detalhes são coletados e incorporados ao gráfico de identidade.
O desafio de construir e manter um gráfico de identidade do cliente é facilitado pela integração do Databricks com o motor de Resolução de Identidade da Amperity. Amplamente reconhecida como a principal solução de IDR de primeira parte do mundo, a Amperity utiliza mais de 45 algoritmos para combinar e mesclar registros de clientes. A integração pronta para uso permite que os clientes do Databricks compartilhem seus dados com a Amperity e obtenham insights detalhados sobre como uma coleção de registros de clientes se resolve em identidades unificadas. (Figura 4).
O processo de configuração desta integração e execução do IDR na Amperity é muito simples:
Um guia detalhado para essas etapas pode ser encontrado no Guia Rápido de Início da Resolução de Identidade da Amperity, e um vídeo explicativo do processo pode ser visto aqui:
O resultado final da integração é um conjunto de tabelas relacionadas que incluem elementos unificados do cliente e sugestões para informações de identidade preferidas para cada cliente (Figura 5).
Engenheiros de dados, cientistas de dados, desenvolvedores de aplicativos podem aproveitar os dados resultantes no Databricks para construir uma ampla gama de soluções para atender às necessidades e casos de uso comuns da empresa:
Se sua organização está lutando com a resolução de identidade do cliente, você pode começar com a Resolução de Identidade da Amperity fazendo inscrição para um teste gratuito de 30 dias. Antes de fazer isso, é recomendável garantir que você tenha acesso aos ativos de dados do cliente e a capacidade de configurar o compartilhamento Delta no seu ambiente Databricks. Também recomendamos que você siga as etapas no guia de início rápido usando os dados de amostra que a Amperity fornece para se familiarizar com o processo geral. Por último, você sempre pode entrar em contato com seus representantes da Databricks e da Amperity para obter mais detalhes sobre a solução e como ela pode ser aproveitada para suas necessidades específicas.
(This blog post has been translated using AI-powered tools) Original Post