Passa al contenuto principale

Notebook Jupyter

Prova Databricks gratis

Che cos'è un notebook Jupyter?

Logo Jupyter

Un notebook Jupyter è un'applicazione web open-source che consente ai data scientist di creare e condividere documenti che contengono codice live, equazioni e altre risorse multimediali.

A che cosa servono i notebook Jupyter?

I notebook Jupyter vengono utilizzati per ogni tipo di attività di data science, come analisi esplorativa (EDA), pulizia e trasformazione dei dati, visualizzazione dei dati, modellazione statistica, machine learning e deep learning.

Quali vantaggi offre l'utilizzo dei notebook Jupyter?

I notebook Jupyter sono utili in particolare per "mostrare il lavoro" fatto dal team di gestione dei dati attraverso una combinazione di codice, annotazioni, link e immagini. Sono facili da usare e possono essere eseguiti cella per cella per capire meglio che cosa fa il codice.

I notebook Jupyter possono anche essere convertiti in diversi formati standard di uscita (HTML, Powerpoint, LaTeX, PDF, ReStructuredText, Markdown, Python) attraverso l'interfaccia web. Questa flessibilità agevola i data scientist che devono condividere il loro lavoro con altri.

Come funzionano i notebook Jupyter?

Un notebook Jupyter ha due componenti: una pagina web front-end e un kernel back-end. La pagina web front-end consente ai data scientist di inserire codice di programmazione o testo in "celle" rettangolari. Il browser passa quindi il codice al kernel back-end che lo esegue e restituisce i risultati.

Quali sono le controindicazioni dell'utilizzo di notebook Jupyter?

  • Difficoltà di manutenzione e sincronizzazione quando più persone lavorano sullo stesso codice.
  • Difficoltà di operazionalizzare il codice perché i notebook Jupyter non hanno alcuna integrazione o strumenti integrati per operazionalizzare i modelli di machine learning.
  • Difficile scalabilità — I notebook Jupyter sono progettati per data science con un singolo nodo. Se il volume di dati eccede la capacità di memoria del computer, utilizzare i notebook Jupyter diventa molto più difficile.

Sono disponibili notebook Jupyter su Databricks?

Stai cercando uno strumento evoluto per attività collaborative di data science? La risposta è Databricks! I nostri notebook consentono di collaborare con colleghi dei team di ingegneria, data science e machine learning in diversi linguaggi, con visualizzazioni integrate dei dati e operazionalizzazione con lavori. Registrati per una prova gratuita.

Databricks supporta i notebook Jupyter?

Sì. I cluster di Databricks possono essere configurati per utilizzare il kernel IPython allo scopo di sfruttare i vantaggi degli strumenti open-source dell'ecosistema Jupyter (strumenti di visualizzazione e di output, ad esempio). Databricks offre inoltre il supporto per l'importazione e l'esportazione di file .ipynb, pertanto è possibile proseguire su Databricks il lavoro esattamente dal punto in cui è stato interrotto nel notebook Jupyter, e viceversa. Infine, Databricks supporta da tempo le librerie open-source di Jupyter all'interno di Databricks Machine Learning Runtime.

Come usare il kernel IPython su Databricks

È facile. Leggi la documentazione, poi registrati per una prova gratuita di Databricks.

 

Risorse aggiuntive

Torna al Glossario