Spark Streaming — Avançado
Tipo de Demonstração
Tutorial do Produto
Duração
Individualizado
Conteúdo relacionado
O que você vai aprender
A Plataforma Lakehouse da Databricks simplifica drasticamente o streaming de dados para fornecer análises em tempo real, aprendizado de máquina e aplicações em uma única plataforma. Nesta demonstração, apresentaremos como o Databricks Lakehouse fornece capacidades de streaming para ingerir e analisar dados de fluxo de cliques (normalmente de filas de mensagens como o Kafka).
A sessão é o processo de encontrar sessões de usuário limitadas pelo tempo a partir de um fluxo de eventos, agrupando todos os eventos que acontecem ao mesmo tempo (por exemplo, número de cliques, páginas mais visualizadas, etc.)
Compreender sessões é crucial para muitos casos de uso:
- Detecte o abandono de carrinho na sua loja online e acione automaticamente ações de marketing como acompanhamento para aumentar suas vendas
- Construa melhores modelos de atribuição para sua afiliação, com base nas ações do usuário durante cada sessão
- Entenda a jornada do usuário em seu site e ofereça uma melhor experiência para aumentar a retenção de usuários
Nesta demonstração, nós iremos:
- Ingerir dados do Kafka
- Salve os dados como tabelas Delta, garantindo qualidade e desempenho em grande escala
- Calcule as sessões de usuários com base na atividade
Para instalar a demonstração, obtenha uma área de trabalho Databricks gratuita e execute os dois comandos seguintes em um notebook Python.
%pip instale dbdemos
import dbdemos
dbdemos.install('streaming-sessionization')
Dbdemos é uma biblioteca Python que instala demonstrações completas do Databricks em seus espaços de trabalho. Dbemos carregará e iniciará notebooks, pipelines do Delta Live Tables, clusters, painéis do Databricks SQL, modelos de armazém... Veja como usar dbdemos
Dbdemos é distribuído como um projeto do GitHub.
Para mais detalhes, por favor, veja o GitHub arquivo README.md e siga a documentação.
Dbdemos é fornecido como está. Veja a Licença e Aviso para mais informações.
Databricks não oferece suporte oficial para dbdemos e os ativos associados.
Para qualquer problema, por favor, abra um ticket e a equipe de demonstração dará uma olhada com base no melhor esforço.