Jupyter Notebook(주피터 노트북)
Jupyter Notebook이란 무엇입니까?
Jupyter Notebook은 오픈 소스 웹 애플리케이션으로, 데이터 사이언티스트가 라이브 코드, 식, 기타 멀티미디어 리소스를 포함하여 문서를 생성 및 공유하는 데 사용할 수 있습니다.
주피터 노트북은 어떤 용도로 사용하나요?
주피터 노트북은 탐색적 데이터 분석(EDA), 데이터 정리 및 변환, 데이터 시각화, 통계적 모델링, 머신 러닝, 딥 러닝 등의 각종 데이터 사이언스 작업에 사용합니다.
주피터 노트북을 사용하는 장점은 무엇인가요?
주피터 노트북은 데이터 팀이 코드, 마크다운, 링크, 이미지를 결합하여 "작업을 보여주는 데" 특히 유용합니다. 이들은 쉽게 사용할 수 있으며, 셀별로 실행하여 코드의 기능을 더욱 잘 이애할 수 있습니다.
또한, 주피터 노트북을 통해 웹 인터페이스에서 다양한 표준 출력 형식(HTML, Powerpoint, LaTeX, PDF, ReStructuredText, Markdown, Python)으로 변환할 수 있습니다. 이런 유연성 덕분에 데이터 사이언티스트가 손쉽게 다른 사람과 자신의 작업을 공유할 수 있습니다.
Jupyter Notebook은 어떻게 작동하나요?
Jupyter Notebook은 프런트엔드 웹 페이지와 백엔드 커널, 이렇게 두 가지 구성 요소가 있습니다. 데이터 사이언티스트는 프런트 엔드 웹 페이지를 사용하여 사각형의 "셀"에 프로그래밍 코드나 텍스트를 입력합니다. 그러면 브라우저에서 이 코드를 백엔드 커널로 전달하고, 커널에서 코드를 실행해 결과를 반환합니다.
Jupyter Notebook의 단점은 무엇일까요?
- 코드를 대상으로 협업할 때는 관리와 동기화를 유지하기 어렵습니다.
- 머신 러닝 모델을 운영화할 수 있는 기본 통합이나 도구가 없다면 Jupyter Notebook을 사용해서 코드를 운영화하기 어렵습니다.
- 확장이 어려움 — Jupyter Notebook은 단일 노드 데이터 사이언스용으로 설계되었습니다. 컴퓨터 메모리에 비해 데이터가 너무 크면 Jupyter Notebook을 사용하기가 상당히 어려워집니다.
Databricks에서 Jupyter Notebook을 사용할 수 있나요?
효과적인 데이터 사이언스 협업 도구를 찾고 계신가요? Databricks를 두고 멀리서 찾지 마세요! Databricks의 노트북을 사용하면 기본 데이터 시각화 및 작업 운영화 기능을 활용하여 엔지니어링, 데이터 사이언스, 머신 러닝 팀에서 동료들과 여러 가지 언어로 협력할 수 있습니다. 무료 체험을 신청하세요.
Databricks에서 Jupyter Notebook에 지원을 제공하나요?
예. Databricks 클러스터는 Jupyter 에코시스템의 오픈 소스 툴링(예: 표시 및 출력 도구)을 활용도록 IPython 커널을 사용하도록 구성할 수 있습니다. 또한 Databricks는 .ipynb 파일을 가져오기 내보내는 기능도 지원합니다. Jupyter Notebook에서 하던 작업을 Databricks에서 바로 받아서 이어갈 수 있고 반대도 가능합니다. 마지막으로 Databricks는 오래전부터 Databricks Machine Learning Runtime 내에서 코어 오픈 소스 Jupyter라이브러리를 지원했습니다.
Databricks에서 IPython 커널을 사용하는 방법
방법은 간단합니다. 문서를 확인한 다음, Databricks 무료 체험을 신청하세요.