Jupyter Notebook
O que é um Jupyter Notebook?
Um Jupyter Notebook é um aplicativo da web de código aberto usado principalmente por data scientists para criar e compartilhar documentos contendo códigos ao vivo, fórmulas e outros recursos multimídia.
Para que servem os Jupyter Notebooks?
Os Jupyter Notebooks são usados para tudo o que acontece na data science, incluindo análise exploratória de dados (EDA), limpeza e transformação de dados, visualização de dados, modelagem estatística, machine learning, deep learning e muito mais.
Quais são os benefícios de usar os Jupyter Notebooks?
Os Jupyter Notebooks são úteis para replicar o trabalho do mundo real feito por equipes de dados por meio de uma combinação de código, markdown, links e imagens. São fáceis de usar, basta executar as células uma a uma.
Além disso, os Jupyter Notebooks podem ser convertidos de forma flexível em formatos de saída padrão (HTML, Powerpoint, LaTeX, PDF, ReStructuredText, Markdown, Python) por meio de uma interface da web, permitindo que os data scientists compartilhem facilmente seu trabalho com outras pessoas.
Como funcionam os Jupyter Notebooks?
Um Jupyter Notebook consiste em duas partes: uma página da web de front-end e um kernel de back-end. Em páginas da web, os data scientists podem inserir código de programação ou texto em caixas retangulares chamadas “células”. O navegador passa esse código para o kernel, que executa e retorna os resultados.
Quais são as desvantagens de usar os Jupyter Notebooks?
- Difícil manutenção e de manter em sincronia ao trabalhar de forma colaborativa no código.
- Código difícil de implantar: os Jupyter Notebooks não têm integrações ou ferramentas incluídas para implantar modelos de machine learning.
- Difícil de dimensionar: os Jupyter Notebooks foram projetados para data science de nó único. Se os dados forem muito grandes para caber na memória do seu computador, usar Jupyter Notebooks torna-se significativamente mais difícil.
Os Jupyter Notebooks estão disponíveis no Databricks?
A Databricks fornece ferramentas de colaboração poderosas para data science. Nossos notebooks contam com visualizações e operacionalização de dados integradas com jobs, permitindo a colaboração em várias linguagens entre as equipes de engenharia, data science e machine learning. Inscreva-se para uma avaliação gratuita.
O Databricks é compatível com Jupyter Notebooks?
Sim. Os clusters da Databricks podem ser configurados para usar o kernel IPython para aproveitar as ferramentas de código aberto do ecossistema Jupyter, como ferramentas de exibição e saída. A Databricks também oferece compatibilidade com importação e exportação de arquivos .ipynb, facilitando a retomada de onde você parou no Jupyter Notebook na Databricks, e vice-versa. Por fim, há muito tempo, a Databricks oferece compatibilidade com bibliotecas Jupyter de código aberto no Databricks Machine Learning Runtime.
Como usar o kernel IPython no Databricks?
É fácil. Confira nossa documentação e comece sua avaliação gratuita do Databricks.