Databricks는 2025년에 R 사용자 경험을 향상시키기 위해 다음과 같은 기능을 제공합니다:
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
새해를 맞이하여, 우리는 Databricks에서 R 사용자를 위한 여러 새로운 리소스를 발표하게 되어 매우 기쁩니다: 포괄적인 개발자 가이드, brickster
의 CRAN에서의 릴리즈, SparkR
에서 sparklyr
로의 마이그레이션 가이드, 그리고 Posit와의 강력한 지속적인 파트너십 덕분에 생성적 AI에서 R 생태계에 대한 Databricks의 지원 확대.
R 사용자를 위해, 우리는 R 개발자를 위한 Databricks 가이드를 만들었습니다. 이 가이드는 Databricks에서 평소에 사용하는 R 워크플로우를 수행하고 플랫폼의 기능을 활용하여 그것들을 확장하는 방법에 대한 지침을 제공합니다. 관리자를 위한 안전하고 비용 효율적인 인프라를 관리하는 최고의 방법을 제공하며, 이는 R 사용자의 필요와 선호에 맞게 맞춤화되어 있습니다.
이 가이드는 Databricks 데이터 인텔리전스 플랫폼의 기본 개념과 아키텍처부터 시작하여 체계적으로 구성되어 있으며, 이러한 개념을 실제로 구현하는 실습 튜토리얼이 이어집니다. Databricks 코드 에디터나 RStudio, Positron, VS Code와 같은 IDE를 사용하여 개발 환경을 설정하는 방법에 대한 자세한 지침을 제공하며, 개발자 도구와 패키지 관리에 대한 섹션도 포함되어 있습니다. 다음으로, Apache Spark™와 Databricks 워크플로우를 사용하여 R 코드를 확장하는 방법을 탐색합니다. 이 가이드는 Databricks에서 Shiny 앱을 운영하는 등의 고급 주제로 마무리됩니다.
brickster 는 R 개발자가 만든 R 패키지입니다 - 이제 CRAN에서 사용할 수 있습니다!
brickster
는 Databricks 워크플로우, 파일 시스템 작업 및 클러스터 관리와 같은 R 사용자에게 가장 관심이 많은 Databricks REST API를 래핑합니다. 또한 RStudio와의 통합 및 다양한 유틸리티 함수 세트를 포함하여 Databricks를 여러분에게 가져다 줍니다. 잘 문서화되어 있으며, 작업 자동화 와 클러스터 관리에 대한 비네트와 각 함수에 대한 예제가 있습니다.
brickster
가 Databricks를 RStudio에 어떻게 가져올 수 있는지 두 가지 예를 고려해 봅시다. 첫째, open_workspace()
함수를 사용하면 RStudio Connections Pane에서 직접 Databricks Workspace를 탐색할 수 있습니다:
두 번째로, 가장 몰입적인 개발자 경험을 위해 db_repl()
함수를 확인해 보세요. 이는 선택한 언어로 Databricks에서 원격으로 모든 명령을 실행하는 로컬 REPL (읽기-평가-출력 루프)를 생성합니다.
초보자이든 전문가이든, IDE에서 Databricks를 사용한다면, brickster
를 한 번 시도해 보세요 - 그것은 가치가 있습니다.
SparkR
과 sparklyr
은 모두 Apache Spark™와 함께 작동하도록 설계된 R 패키지이지만, 디자인, 문법, 그리고 R 생태계와의 통합 면에서 크게 차이가 있습니다. 이 복잡성은 Spark에 익숙하지 않은 R 사용자들에게 혼란스러울 수 있으므로, Apache Spark™ 4.x부터는 SparkR
이 사용 중단되고, sparklyr
이 유일하게 권장되는 패키지가 될 것입니다. 사용자가 한 코드에서 다른 코드로 이동하는 것을 돕기 위해, 우리는 각 패키지 간의 차이를 보여주는 다른 가이드를 컴파일했습니다, 많은 특정 함수 매핑을 포함하여.
GitHub에서 가이드를 찾을 수 있습니다. 여기를 클릭하세요.
brickster
를 포함하여, R 생태계는 Databricks와 함께 작업하는 데 대한 지원을 늘리고 있습니다.
패키지 | Databricks 지원 |
---|---|
odbc | 새로운 odbc::databricks() 함수는 SQL 웨어하우스에 연결을 간소화합니다(자세한 내용은 여기 를 참조하세요). |
Sparklyr | Databricks Connect V2와 함께 작동하며, Spark 4.0에서 SparkR이 더 이상 지원되지 않게 되면서, sparklyr 는 R에서 Spark를 사용하는 주요 패키지가 될 것입니다. |
mall | R에서 Databricks SQL AI 함수 를 호출할 수 있게 해줍니다. 사용 예시는 여기에서 확인할 수 있습니다. |
pins | UC 볼륨 백업 pins! pins 패키지와의 원활한 통합. |
오비탈 | Spark DataFrames에서 tidymodels 예측 실행 |
chattr | Databricks Foundation Models API에 대한 지원이 추가되었 습니다(자세한 내용은 여기 를 참조하세요). |
ellmer | Databricks에 호스팅된 기본 모델이나 AI 게이트웨이를 통해 이용 가능한 모델과의 채팅을 위한 간단한 인터페이스. |
pal | 반복적이고 자동화하기 어려운 작업을 빠르게 완료할 수 있도록 도와주는 인체공학적인 LLM 보조 도구 라이브러리를 제공합니다. ellmer 에서 지원하는 모든 모델은 pal 에서 지원됩니다.(GitHub) |
새로운 해를 맞이하면서, Databricks에서의 R 사용자를 위한 미래는 어느 때보다 밝아 보입니다. 포괄적인 R 개발자 가이드의 출시, 강력한 brickster
패키지의 도입, 그리고 Databricks를 지원하는 R 도구의 생태계가 계속 확장되고 있어, 플랫폼에서 데이터 및 AI 작업을 탐색하고, 구축하고, 확장하는 데 있어서 이보다 더 좋은 시기는 없었습니다. 특히, Databricks에서의 R 생태계를 계속 지원해 주신 Posit 에게 감사의 말씀을 전하고 싶습니다 - 앞으로 몇 달 동안 이 파트너십에서 더 많은 훌륭한 성과를 기대해 보세요. 앞으로 생산적이고 혁신적인 한 해를 기대합니다!