Pandas API mit Spark Back End (Koalas)

Demotyp

Produktanleitung

Laufzeit

Selbststudium

Social Media

Was Sie lernen werden

Trotz seiner Beliebtheit als Framework für Datenanalysen, ist pandas nicht verteilt und kann keine TB Daten verarbeiten. Databricks löst dieses Problem, indem es Benutzern ermöglicht, die pandas API zu nutzen, während die Daten mit der Spark-Verteilungsmaschine verarbeitet werden. Diese Demo zeigt Ihnen, wie Sie Big Data mit der pandas API (früher bekannt als Koalas) verarbeiten können.

 

Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notebook aus

%pip installieren Sie dbdemos
import dbdemos
dbdemos.install('pandas-on-spark')

Dbdemos ist eine Python-Bibliothek, die komplette Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbdemos lädt und startet Notebooks, Delta Live Tables Pipelines, Cluster, Databricks SQL Dashboards, Warehouse-Modelle ... Siehe wie man dbdemos verwendet

 

Dbdemos wird als GitHub-Projekt bereitgestellt.

Für weitere Details, bitte sehen Sie sich die GitHub README.md Datei an und folgen Sie der Dokumentation.
Dbdemos wird so bereitgestellt, wie es ist. Siehe die 
Lizenz und Hinweis für weitere Informationen.
Databricks bietet keinen offiziellen Support für dbdemos und die zugehörigen Assets.
Bei Problemen, bitte ein Ticket öffnen und das Demo-Team wird sich nach bestem Bemühen darum kümmern.