주요 컨텐츠로 이동

데이터브릭스에서는 전 세계 모든 사람이 데이터와 AI를 쉽게 활용할 수 있도록 돕고자 합니다. 이를 위해, SQL을 몰라도, 코드를 작성하지 않아도, 비즈니스 사용자가 신뢰할 수 있는 인사이트를 신속하고 정확하게 얻을 수 있도록 하는 AI/BI와 같은 솔루션을 개발하고 있습니다.

현재 대시보드는 대부분의 사람들의 일상에서 필수적인 도구로 자리 잡았습니다. 반면에, AI/BI Genie는 비교적 새로운 경험이기 때문에 아직 많은 이들에게 익숙하지 않을 수 있습니다. Genie를 통해 사용자는 BI 도구를 배우지 않아도, 혹은 전문가의 도움을 받지 않아도, 대시보드에서 다루지 않는 질문에 대한 답을 스스로 찾아낼 수 있습니다. 이러한 배경에서, Genie가 어떻게 활용되는지, 그리고 기대할 수 있는 것이 무엇인지 알아보는 것이 유익할 것 같아 이 글을 준비했습니다.

새로운 직원 오리엔테이션 

일부 사람들은 Genie를 만드는 과정을 새로운 데이터 분석가를 고용하는 것에 비유하기도 합니다. 이 새로운 직원은 똑똑하고 배울 열의가 넘치지만, 다소 기계적이며, 회사 내부의 용어, 지표, 정의, 가정에 대한 경험이 전혀 없습니다. 즉, 새로운 Genie는 공개된 지식에는 익숙하지만, 회사 내부나 팀 내부의 지식에는 무지한 상태입니다.

따라서 첫 번째 단계는 이 새로운 직원에게 필요한 오리엔테이션을 제공하는 것입니다! 이 블로그 포스트에서는 여러분이 팀의 질문을 처리해 온 경험 많은 분석가로서, 도움이 필요해 이 Genie를 설정하려는 상황을 가정하겠습니다.

Genie 설정 페이지는 이 새로운 직원이 질문에 답변하기 시작하려면 알아야 할 사항을 안내하는 역할을 합니다:

여기서는 Genie를 사용하기 위한 절대적인 기본 사항을 제공하는 것이 목표입니다:

  • 제목과 설명: 답변해야 하는 질문의 범위와 영역은 무엇인가요? 이는 Genie 공간을 탐색하고 검색하는 모든 사람이 볼 수 있으므로 명확하고 간결하게 작성하는 것이 중요합니다.
  • 디폴트 웨어하우스: 이 Genie는 SQL 쿼리를 실행하는 데 어떤 컴퓨팅을 사용하나요?
  • 테이블: 이 Genie가 질문에 답하는 데 사용할 수 있는 범위에는 어떤 테이블이 있나요? Genie는 각 테이블과 각 열에 있는 모든 주석을 읽고 이를 사용하여 답을 알려줍니다.
  • 샘플 질문들: 선택 사항으로 이 지니와 대화하는 사람들이 무엇을 물어봐야 할지 잘 모를 때 제시하고 싶은 몇 가지 예시 질문을 지정할 수 있습니다.

적절한 값을 선택하고 '저장'을 누르면 새로운 Genie가 작동할 준비가 완료됩니다!

...글쎄요, 정확히는 그렇지 않습니다. 새로운 직원을 교육할 때는, 팀의 가장 어려운 질문에 답하도록 하기 전에 먼저 그들의 지식을 점검하고 싶을 것입니다.

새로운 직원이 새로운 직장에서 최상의 출발을 할 수 있도록 하려면, 그들에게 기본적인 정보를 제공하여 지식을 빠르게 습득하게 해야 합니다. 기본적인 데이터 거버넌스 모범 사례를 잘 적용했다면, 이들이 훌륭한 출발을 할 수 있도록 도울 수 있습니다. 바로 이 부분에서 Unity Catalog가 유용하게 작용합니다. 테이블과 열에 유용한 주석을 달고, Genie에게 제공할 테이블 간의 기본/외래 키 관계를 설정하는 데 시간을 투자하세요. 이러한 기본 정보가 Genie가 첫날부터 많은 기본 지식을 갖출 수 있도록 해 줄 것입니다!

다음 단계는 팀이 일상 업무에서 궁금해할 만한 몇 가지 질문을 Genie에게 물어보는 것입니다.

이 첫 번째 예제에서 Genie는 쉽게 문제를 맞힙니다.

카탈로그 탐색기(위)에서 테이블 메타데이터를 보면 열 주석이 Genie가 답을 맞히기에 충분한 정보를 제공하는 것을 볼 수 있습니다. 좋았어요!

이 두 번째 예에서는 평균 가격에 대한 열 이름에서 유추한 가장 명백한 정의가 잘못된 것으로 판명되어 Genie가 잘못 추측했습니다.

생성된 SQL을 보면 Genie가 가격에 대해 잘못된 열을 선택했음을 알 수 있습니다. Genie는 UnitPrice가 아닌 ListPrice 열을 선택했어야 합니다.

카탈로그 탐색기에서 원하는 열에 유용한 설명을 추가하면 이 문제를 해결할 수 있습니다:

이 업데이트를 통해 Genie는 이제 올바른 답변을 제공합니다.

위에서 사용자가 이전과 똑같은 질문을 Genie에게 한 것을 볼 수 있습니다.

위에서는 이제 Genie가 쿼리에서 올바른 열 ListPrice를 사용하고 있음을 알 수 있습니다.

다음은 Genie가 중요한 맥락이 부족하다는 것을 알고 있어서 아예 추측조차 시도하지 않는 또 다른 예입니다. 여기서 중요한 맥락이란 특정 팀의 지표가 어떻게 정의되는지에 대한 정보입니다. 이 맥락이 없으면 Genie는 올바른 답을 도출할 방법이 없습니다.

이제 Genie에게 이 지표를 가르쳐 주세요! 지니에게 직접 지표를 제공하고 어떤 일이 일어나는지 확인해 봅시다.

UI에서 고객 이탈의 정의를 Genie에게 직접 알려주고 프롬프트를 실행하기만 하면 됩니다.

위에서는 Genie가 프롬프트를 이해하고 데이터를 올바르게 쿼리할 수 있음을 볼 수 있습니다.

이제 Genie가 이 새 메트릭을 올바르게 계산하는 방법을 학습했음을 확인했으므로 “Add as instruction”을 클릭하여 앞으로 Genie와 대화하는 모든 사람을 위해 이를 기억하도록 지시할 수 있습니다.

이렇게 하면 명령어가 instructions 섹션에 저장되며, 이 섹션에는 Genie가 작업을 수행할 때 염두에 두어야 할 모든 사항이 저장됩니다. 이 명령은 “예제 SQL 쿼리”에서 찾을 수 있지만 수동으로 모든 명령어를 업데이트할 수도 있습니다.

Genie space를 본격적으로 사용하기 전에, 사용자가 질문할 것으로 예상되거나 이미 알고 있는 비즈니스 의미와 관련된 지침을 최대한 많이 추가하는 것이 좋습니다. 이 지침은 대화하면서 저장하거나, 직접 Genie space의 'Instructions' 섹션에 추가할 수 있습니다. Genie를 더 많이 훈련시킬수록 더 똑똑해집니다!

Genie가 팀이 질문할 것으로 예상되는 사항에 대해 유용하고 정확한 답변을 제공한다는 확신이 들면, 이제 팀이 이 새로운 '직원'과 대화할 수 있도록 할 차례입니다.

"Share" 버튼을 눌러, 누구에게 Genie와 대화할 수 있는 권한을 부여할지 설정하세요. 이 Genie가 누구의 질문에 답해야 하는지에 따라, 개별 사용자, 팀 전체를 대표하는 그룹, 또는 회사 전체를 선택할 수 있습니다.

팀원들에게 Genie에 대해 기대할 수 있는 사항도 알려주는 것이 좋습니다. 아마도 그들은 이전에 이렇게 '로봇 같은' 동료와 일해본 적이 없을 것입니다. 팀원들이 SQL을 모를 가능성이 크기 때문에, Genie가 실제로 올바른 답을 주고 있는지, 아니면 그럴듯하지만 틀린 답을 내놓고 있는지 판단하기 어려울 수 있습니다. Genie가 정확히 답할 수 있을 것으로 예상되는 질문이 무엇인지 팀원들에게 알려주고, 중요한 질문에 대해 Genie의 답변이 확실하지 않다고 느낀다면, 이를 사용하기 전에 반드시 당신에게 확인하도록 안내할 수 있습니다.

작업 시작하기

이제 팀에 새롭게 합류한 Genie와 함께 일하게 되었으니, 팀원들이 Genie와 어떻게 상호작용하는지 살펴보겠습니다.

Genie를 테스트할 때와 마찬가지로, 팀의 누구든지 질문을 시작하고 답변을 받을 수 있습니다.

사용자는 Genie의 응답을 본 후 좋아요/싫어요 버튼을 클릭하여 피드백을 제공할 수 있습니다. 이러한 투표는 모니터링 섹션에 표시되며, 여기에서 사용자가 묻는 질문을 확인하고 Genie를 개선하기 위해 가르쳐야 할 새로운 사항을 파악할 수 있습니다.

여기에서는 지금까지 팀에서 질문한 모든 내용과 팀원들이 남긴 "좋아요/싫어요" 피드백을 확인할 수 있습니다.

특히 주목할 만한 부분은 이전에 예상하지 못했던 질문들입니다. Genie가 이 질문에 제대로 답할지 아직 확신이 서지 않을 때가 있을 것입니다. 각 질문에 대해 Genie가 어떻게 답했는지 확인하고, 올바른 답변이 아니었다면, 직접 대화 세션에 들어가 Genie에게 올바른 답을 가르쳐 줄 기회로 삼을 수 있습니다.

또한, "싫어요" 피드백이 달린 상호작용을 필터링할 수 있는데, 이 경우 종종 두 가지 상황이 발생합니다. 첫째, Genie가 잘못된 답을 했을 수 있으며, 이 경우 Genie에게 모르는 것을 가르쳐 줄 필요가 있습니다. 둘째, Genie가 올바른 답을 했다고 생각되지만, Genie와 대화한 팀원이 다른 가정을 가지고 있어, 그로 인해 Genie의 답변이 틀렸거나 유용하지 않다고 판단할 수 있습니다. 이러한 가정의 차이를 해결하는 것이 도움이 될 것입니다.

Genie에 대해 더 알아보기

보시다시피, Genie의 주요 목표는 팀 내 누구나 기술적으로 더 능숙한 팀원의 도움 없이도 원하는 인사이트를 얻을 수 있도록 하는 것입니다. 이 예시들이 도움이 되었기를 바라며, 여러분이 Genie를 직접 사용해 보기를 권장합니다. Genie에 대한 더 깊이 있는 정보는 Databricks 문서에서 확인할 수 있으며, 특히 요약된 모범 사례들을 참고하시기 바랍니다. 또한, 사용 중 피드백이 있다면 꼭 알려주세요. 여러분의 Genie 사용 경험을 배우는 것을 기대하고 있습니다!

 

(번역: Youngkyong Ko)  Original Post

Databricks 무료로 시작하기

관련 포스트

AI/BI 소개: 실제 환경의 데이터를 위한 지능형 분석

오늘, 데이터의 의미를 심층적으로 이해하고 누구나 스스로 데이터를 분석할 수 있도록 처음부터 구축된 새로운 유형의 비즈니스 인텔리전스 제품인 Databricks AI/BI 를 발표하게 되어...

구체화된 뷰(Materialized View)로 더욱 빨라진 Lakeview 대시보드

February 27, 2024 작성자: 차오 차이, 폴 랩파스 in
(번역: Youngkyong Ko) Original Post 이 글에서는 Lakeview 대시보드와 함께 Databricks SQL의 구체화된 뷰( Materialized View )를 사용하여 비즈니스에 새로운 데이터와 인사이트를 제공하는...

초신성, 블랙홀 그리고 스트리밍 데이터

August 17, 2024 작성자: Frank Munz in
개요 이 블로그 포스트는 Data + AI Summit 2024의 " From Supernovas to LLMs " 세션의 후속 내용으로, 누구나 공개적으로 이용 가능한 NASA...
모든 플랫폼 블로그 포스트 보기