API do Pandas com Back End do Spark (Koalas)
Tipo de Demonstração
Tutorial do Produto
Duração
Individualizado
Conteúdo relacionado
O que você vai aprender
Apesar de ser uma das estruturas mais populares para análise de dados, pandas não é distribuído e não pode processar TB de dados. Databricks resolve esse problema permitindo que os usuários aproveitem a API pandas enquanto processam os dados com o motor distribuído Spark. Esta demonstração mostra como processar big data usando a API pandas (anteriormente conhecida como Koalas).
Para instalar a demonstração, obtenha um workspace Databricks gratuito e execute os dois comandos seguintes em um notebook Python
%pip instale dbdemos
import dbdemos
dbdemos.install('pandas-on-spark')
Dbdemos é uma biblioteca Python que instala demonstrações completas do Databricks em seus espaços de trabalho. Dbdemos irá carregar e iniciar notebooks, pipelines Delta Live Tables, clusters, painéis Databricks SQL, modelos de armazém ... Veja como usar dbdemos
Dbdemos é distribuído como um projeto do GitHub.
Para mais detalhes, por favor, veja o GitHub arquivo README.md e siga a documentação.
Dbdemos é fornecido como está. Veja a Licença e Aviso para mais informações.
Databricks não oferece suporte oficial para dbdemos e os ativos associados.
Para qualquer problema, por favor, abra um ticket e a equipe de demonstração dará uma olhada com base no melhor esforço.