Jupyter-Notebook
Was ist ein Jupyter-Notebook?
Ein Jupyter-Notebook ist eine Open-Source-Webanwendung, mit der Data Scientists Dokumente erstellen und austauschen können, die Livecode, Gleichungen und weitere Multimediaressourcen enthalten.
Wofür werden Jupyter-Notebooks verwendet?
Jupyter-Notebooks werden für alle möglichen Data-Science-Aufgaben verwendet, z. B. für die explorative Datenanalyse (EDA), für Datenbereinigung und -transformation, Datenvisualisierung, statistische Modellierung, Machine Learning und Deep Learning.
Welche Vorteile bieten Jupyter-Notebooks?
Jupyter-Notebooks sind besonders nützlich, um durch eine Kombination aus Code, Markdown, Links und Bildern die Arbeitsergebnisse Ihres Datenteams zu präsentieren. Sie sind benutzerfreundlich und können Zelle für Zelle ausgeführt werden, um besser zu verstehen, was der Code tut.
Jupyter-Notebooks können auch über die Weboberfläche in verschiedene Standardausgabeformate (HTML, PowerPoint, LaTeX, PDF, ReStructuredText, Markdown, Python) konvertiert werden. Diese Flexibilität macht es für Data Scientists besonders leicht, ihre Arbeit mit anderen zu teilen.
Wie funktionieren Jupyter-Notebooks?
Ein Jupyter-Notebook umfasst zwei Komponenten: eine Front-End-Webseite und einen Back-End-Kernel. Auf der Front-End-Webseite können Data Scientists Programmiercode oder Text in rechteckige „Zellen“ eingeben. Der Browser übergibt den Code dann an den Back-End-Kernel, der ihn ausführt und die Ergebnisse zurückgibt.
Welche Nachteile bringen Jupyter-Notebooks mit sich?
- Sie sind schwierig zu pflegen und synchron zu halten, wenn mehrere Benutzer gemeinsam am selben Code arbeiten.
- Die Operationalisierung des Codes ist komplex, da es bei Verwendung von Jupyter-Notebooks weder eine interne Integration noch Tools für die Operationalisierung Ihrer Machine-Learning-Modelle gibt.
- Die Skalierung gestaltet sich ebenfalls nicht einfach. Jupyter-Notebooks sind für Data Science auf einem einzelnen Knoten konzipiert. Wenn Ihre Daten allerdings zu umfangreich sind und nicht mehr in den Speicher Ihres Computers passen, wird der Einsatz von Jupyter-Notebooks erheblich erschwert.
Sind Jupyter-Notebooks auf Databricks verfügbar?
Suchen Sie ein leistungsstarkes Tool für die Kollaboration im Bereich Data Science? Dann liegen Sie bei Databricks genau richtig! Unsere Notebooks ermöglichen Ihnen die Zusammenarbeit mit Kollegen aus den Bereichen Engineering, Data Science und Machine Learning in mehreren Sprachen, mit integrierten Datenvisualisierungen und der Operationalisierung mit Jobs. Melden Sie sich für eine kostenlose Testversion an.
Bietet Databricks Unterstützung für Jupyter-Notebooks?
Ja. Databricks-Cluster können so konfiguriert werden, dass sie den IPython-Kernel verwenden. So lassen sich die Vorteile der Open-Source-Tools im Jupyter-Ökosystem (z. B. Anzeige- und Ausgabewerkzeuge) nutzen. Außerdem bietet Databricks Unterstützung für den Import und Export von IPYNB-Dateien, sodass Sie jederzeit problemlos dort weitermachen können, wo Sie in Ihrem Jupyter-Notebook aufgehört haben – auf Databricks. Oder auch umgekehrt. Schließlich unterstützt Databricks seit langem die zentralen quelloffenen Jupyter-Bibliotheken innerhalb der Databricks Machine Learning Runtime.
So verwenden Sie den IPython-Kernel auf Databricks
Es ist ganz einfach. Sehen Sie sich die Dokumentation an und melden Sie sich dann für eine kostenlose Testversion von Databricks an.