Datensatz
Was ist ein Dataset?
Ein Dataset ist eine strukturierte Sammlung von Daten, die für die Analyse oder Verarbeitung organisiert und gemeinsam gespeichert werden. Die Daten in einem Dataset sind in der Regel in irgendeiner Weise aufeinander bezogen und stammen aus einer einzigen Quelle oder sind für ein einzelnes bestimmtes Projekt vorgesehen. Beispielsweise kann ein Dataset eine Auswahl von Geschäftsdaten enthalten (Verkaufszahlen, Kundenkontaktinformationen, Transaktionen usw.). Es kann dabei viele verschiedene Datentypen enthalten – von numerischen Werten über Texte und Bilder bis hin zu Audioaufnahmen. Auf die Daten in einem Dataset kann in der Regel einzeln oder in Kombination zugegriffen werden, sie können aber auch als Einheit verwaltet werden.
Datasets sind ein grundlegendes Tool für Data Analytics, Datenanalyse und maschinelles Lernen (ML). Sie stellen die Daten bereit, aus denen Analysts Erkenntnisse und Trends ableiten. Für ML sind sie unverzichtbar, denn die Auswahl des geeigneten Datasets für ein ML-Projekt ist einer der wichtigsten ersten Schritte für das erfolgreiche Trainieren und Implementieren eines ML-Modells.
Ähnliche Themen erkunden