데이터세트(DataSet)
데이터세트란?
데이터세트는 분석 또는 처리를 위해 함께 구성되고 저장된 데이터의 구조화된 모음입니다. 데이터세트의 데이터는 일반적으로 어떤 식으로든 관련되어 있으며 단일 소스에서 가져오거나 단일 프로젝트용으로 사용됩니다. 예를 들어, 데이터세트에는 비즈니스 데이터(매출 통계, 고객 연락처 정보, 거래 등) 모음이 포함될 수 있습니다. 데이터세트에는 숫자 값부터 텍스트, 이미지, 오디오 녹음에 이르기까지 다양한 유형의 데이터가 포함될 수 있습니다. 데이터세트의 데이터는 일반적으로 개별 또는 조합하여 액세스하거나 전체 엔터티로 관리할 수 있습니다.
데이터세트는 데이터 분석 및 머신 러닝(ML)의 기본 도구로, 애널리스트가 인사이트와 추세를 도출하는 데 필요한 데이터를 제공합니다. ML 프로젝트에 적합한 데이터세트를 선택하는 것은 ML 모델을 성공적으로 학습시키고 배포하는 가장 중요한 초기 단계 중 하나이기 때문에 ML에 필수적입니다.
자세히 보기