Notebook Jupyter
Che cos'è un notebook Jupyter?
Un notebook Jupyter è un'applicazione web open-source che consente ai data scientist di creare e condividere documenti che contengono codice live, equazioni e altre risorse multimediali.
A che cosa servono i notebook Jupyter?
I notebook Jupyter vengono utilizzati per ogni tipo di attività di data science, come analisi esplorativa (EDA), pulizia e trasformazione dei dati, visualizzazione dei dati, modellazione statistica, machine learning e deep learning.
Quali vantaggi offre l'utilizzo dei notebook Jupyter?
I notebook Jupyter sono utili in particolare per "mostrare il lavoro" fatto dal team di gestione dei dati attraverso una combinazione di codice, annotazioni, link e immagini. Sono facili da usare e possono essere eseguiti cella per cella per capire meglio che cosa fa il codice.
I notebook Jupyter possono anche essere convertiti in diversi formati standard di uscita (HTML, Powerpoint, LaTeX, PDF, ReStructuredText, Markdown, Python) attraverso l'interfaccia web. Questa flessibilità agevola i data scientist che devono condividere il loro lavoro con altri.
Come funzionano i notebook Jupyter?
Un notebook Jupyter ha due componenti: una pagina web front-end e un kernel back-end. La pagina web front-end consente ai data scientist di inserire codice di programmazione o testo in "celle" rettangolari. Il browser passa quindi il codice al kernel back-end che lo esegue e restituisce i risultati.
Quali sono le controindicazioni dell'utilizzo di notebook Jupyter?
- Difficoltà di manutenzione e sincronizzazione quando più persone lavorano sullo stesso codice.
- Difficoltà di operazionalizzare il codice perché i notebook Jupyter non hanno alcuna integrazione o strumenti integrati per operazionalizzare i modelli di machine learning.
- Difficile scalabilità — I notebook Jupyter sono progettati per data science con un singolo nodo. Se il volume di dati eccede la capacità di memoria del computer, utilizzare i notebook Jupyter diventa molto più difficile.
Sono disponibili notebook Jupyter su Databricks?
Stai cercando uno strumento evoluto per attività collaborative di data science? La risposta è Databricks! I nostri notebook consentono di collaborare con colleghi dei team di ingegneria, data science e machine learning in diversi linguaggi, con visualizzazioni integrate dei dati e operazionalizzazione con lavori. Registrati per una prova gratuita.
Databricks supporta i notebook Jupyter?
Sì. I cluster di Databricks possono essere configurati per utilizzare il kernel IPython allo scopo di sfruttare i vantaggi degli strumenti open-source dell'ecosistema Jupyter (strumenti di visualizzazione e di output, ad esempio). Databricks offre inoltre il supporto per l'importazione e l'esportazione di file .ipynb, pertanto è possibile proseguire su Databricks il lavoro esattamente dal punto in cui è stato interrotto nel notebook Jupyter, e viceversa. Infine, Databricks supporta da tempo le librerie open-source di Jupyter all'interno di Databricks Machine Learning Runtime.
Come usare il kernel IPython su Databricks
È facile. Leggi la documentazione, poi registrati per una prova gratuita di Databricks.