dbdemos.ai의 데모에서부터 신용데이터 플랫폼 구축을 시작할 수 있습니다.
World Bank의 금융 포용성 보고서에 따르면, 무려 17억 명에 달하는 성인이 금융 소외 계층으로 분류되었습니다. 많은 금융소외계층은 기존 금융기관에서 대출을 받기 어렵기 때문에 높은 이자율로 대출을 제공하는 비공식 대부업체를 찾게 됩니다. 이 그룹에는 일반적으로 젊은 세대, 개발도상국의 저소득층, 농촌 거주자가 포함되며, 이들 중 상당수는 모바일 환경에서 금융 서비스를 이용하고 있습니다.
금융 소외 문제 관련하여, 전통적인 은행 서비스가 취약한 영역의 금융 소비자 요구를 충족하기 위해 모바일 뱅킹이 등장했습니다. 전 세계 스마트폰 사용자 수는 지난 5년간 매년 최소 5%씩 꾸준히 증가해 왔으며, 이는 대출 분야에서 새롭고 유망한 기회를 제시하고 있습니다. 금융 기관은 머신러닝 및 기타 고급 분석을 활용하여 고객의 신용도를 평가하고 플랫폼을 통해 점진적으로 신용 이력을 구축함으로써 금융 포용의 범위를 넓히고 이전에는 얻을 수 없었던 신용 기회에 대한 문을 열어 이 기회를 활용할 수 있습니다.
금융 포용의 정신과 전통적인 사고의 확장 차원에서, 이 블로그는 은행, 핀테크 기업, 비은행 금융기관이 이러한 새로운 시장, 즉 더 나은 금융 서비스에 대한 기대와 열망이 있고 쉽게 결실을 얻을 수 있는 시장에 어떻게 진입할 수 있는지에 대한 가이드와 재사용가능한 공개 Lakehouse 데모를 제공합니다.
딜로이트가 금융 포용성에 관한 보고서에서 언급했듯이, '잘하는 것과 좋은 일을 하는 것이 모순되지 않는다'는 점은 업계의 많은 데이터 팀에게 공감을 불러일으키고 있습니다. 이 개념을 더 잘 이해하기 위해 몇 가지 용어를 정의해 보겠습니다.
신용 결정은 대출 또는 신용 상환 능력과 관련된 개인의 신용도를 평가하는 프로세스입니다. 이는 대출 산업에서 필수적인 부분이며 데이터 수집, 데이터 처리, 데이터 분석과 손실 추정 등 다양한 단계가 포함됩니다. 전통적으로 신용 결정은 금융소외계층이 가장 많이 이용하는 대출 유형인 단기 대출의 경우에도 오랜 시간이 걸리는 과정이었습니다. 게다가 이 과정은 과거 신용 기록이 있거나 장기 대출을 받은 개인에게 크게 편향되어 있었습니다. 선구매 후상환(BNPL) 상품, 주택 구매를 위한 디지털 금융 시장, 신용을 제공하는 비은행 금융기관의 등장으로 신용 결정을 위한 무대가 완전히 바뀌었습니다.
AI 기반의 신용 의사 결정이 계속 발전함에 따라 은행 및 결제 업계에서는 데이터브릭스 레이크하우스 설계에 대한 고객 수요가 급증하고 있습니다. 이 설계는 신용 의사 결정 프로세스에 대한 총체적이고 효율적인 솔루션을 제공하는 신용 데이터 플랫폼을 제공합니다. 이 플랫폼은 데이터 통합, 감사, AI 기반 의사 결정, 설명 가능성을 지원하여 데이터 분석을 위한 신뢰할 수 있는 단일 소스를 제공할 수 있습니다. 신용 데이터 플랫폼에는 방대한 양의 데이터를 분석하고 대출자의 신용도를 보다 정확하게 예측할 수 있는 머신러닝 모델이 포함되어 있어 신용 의사 결정 프로세스의 속도와 정확성을 개선합니다. 신용 데이터 플랫폼은 금융 서비스를 제공하려는 핀테크, 은행 또는 비은행 금융기관이 정보에 기반한 신용 의사 결정을 내리고 채무 불이행 위험을 줄이며 고객에게 더 나은 금리와 조건을 제공하는 데 도움이 될 수 있습니다. 기술 솔루션에 대해 자세히 알아보기 전에 오늘날 금융 기관이 시장에 서비스를 제공하기 위해 고군분투하고 있는 분야를 살펴보겠습니다.
Part I - 왜 변화가 필요한가?
신용 데이터 플랫폼을 구축하는 것은 아래와 같은 이유에서 은행과 다른 금융기관들에 중요한 도전과제가 될 수 있습니다.
많은 금융소외계층은 기존 금융기관에서 대출을 받기 어렵기 때문에 높은 이자율로 대출을 제공하는 비공식 대부업체를 찾게 됩니다. 금융소외계층 고객은 신용도를 평가하는 데 사용할 수 있는 전통적인 신용 이력이나 재무 기록이 없을 수 있기 때문에 신용 의사 결정을 내리는 것이 어려울 수 있습니다. 게다가 신용 의사 결정 데이터는 서로 다른 소스와 호환되지 않는 형식으로 저장되는 경우가 많기 때문에, 데이터 사용자가 데이터를 완전히 통합하여 가치 있는 인사이트를 추출하기가 어렵습니다. 그 결과 데이터 엔지니어와 과학자만 데이터를 사용할 수 있고, 마케팅 및 재무팀, 콜센터 상담원, 은행 창구 직원과 같은 최종 사용자는 데이터를 사용할 수 없는 경우가 많습니다.
은행과 기타 금융 기관은 신용 데이터 플랫폼을 구축할 때 중요한 어려움에 직면합니다. 무엇보다, 플랫폼이 안전하고 규제 요건을 준수하며 민감한 고객 데이터를 보호하는지 확인해야 합니다. 이러한 목표를 달성하려면 데이터 개인정보 보호, 액세스 제어, 품질, 규정 준수 등 보안 및 거버넌스와 관련된 다양한 과제를 해결해야 합니다. 그러나 데이터 거버넌스 및 엔터프라이즈 보안 제어는 데이터 에코시스템의 복잡성, 진화하는 위협, 내부자 위험, 리소스 제약으로 인해 어려울 수 있습니다. 데이터를 효과적으로 관리하고 보안을 유지하려면 조직은 이러한 문제를 근본적으로 해결해야 하며, 이는 뒤로 미룰 수 없는 일입니다.
설명 가능성과 공정성은 소비자를 차별로부터 보호하고 공평한 결과를 보장할 수 있도록, 편견 없고 이해하기 쉬운 결정을 내리는데 기반이 되므로, 신용 결정에 있어 필수적입니다. 공정성과 설명가능성이 부족하면 신용 시스템에 대한 신뢰가 약화되고 소비자가 신용 신청을 꺼릴 수 있습니다. 그러나 신용 결정의 공정성을 평가하고 결과를 설명하는 것은 여러 가지 요인으로 인해 어려울 수 있습니다. 여기에는 신용 점수 모델의 복잡성, 잠재적인 데이터 편향성, 사람의 편견 가능성 등이 포함됩니다.
이 블로그에서는 데이터브릭스 레이크하우스를 통해 올바른 데이터 기반 플랫폼을 구축하여, 앞서 언급한 과제를 해결하고 기업이 더 나은 신용 모델을 만들 수 있는 방법을 설명 합니다. 이를 통해 금융 소외 고객 서비스, 신용 위험 및 노출 평가, 선구매 후지급과 같은 새로운 상품 도입 등 비즈니스 목표를 달성할 수 있습니다.
좋은 신용 모델을 만들려면 은행 고객의 소비 습관, 잠재적인 이전 연체 기록, 수입원 등 가능한 한 다양한 각도에서 고객을 묘사하는 광범위한 데이터가 필요합니다. 그림 왼쪽에는 신용 조사 기관 데이터, 고객 정보, 실시간 거래 데이터, 파트너 데이터(기존 은행 정보를 보강하는 데 사용하는 통신사 데이터) 등 최신 신용 의사 결정 플랫폼을 만드는 데 필요한 다양한 금융 데이터 소스가 표시되어 있습니다. 모든 데이터 소스의 파일 형식, 수집 속도, 볼륨, 소스 플랫폼이 완전히 다르다는 것을 쉽게 알 수 있습니다.
이런 다양한 데이터를 다루기 위해 모든 데이터 소스를 단일 데이터 원본(single source of truth) 위치에서 수집하는 기능인 데이터 통합부터 시작합니다.
적절한 데이터 기반이 설정되면 데이터 의사 결정으로 이동하여 "데이터 인사이트"라고 부르는 숨겨진 패턴과 상관관계를 찾을 수 있습니다:
오늘날 데이터는 데이터 과학자나 데이터 엔지니어와 같은 데이터 팀만 액세스하고 사용할 수 있는 경우가 많습니다. 그러나 데이터 팀은 여신 결정과 같은 사용 사례의 최종 사용자가 아닙니다. 최종 사용자는 신청서를 평가하는 여신 상담원, 고객과 소통하는 콜센터 상담원, 은행 이용이 어려운 고객을 업셀링하기 위한 홍보 자료를 준비하는 마케팅 팀 등 입니다. 그러나 이러한 현업 담당자들은 데이터나 대시보드 또는 기계 학습 예측에 액세스할 수 없는 경우가 많습니다. 예전에는 데이터 팀에서 요청된 데이터를 CSV 또는 PDF 파일로 내보내서 비즈니스 사용자에게 이메일로 보냈습니다. 이 방식은 안전하지도, 확장 가능하지도, 간단하지도 않습니다.
유니티 카탈로그와 데이터브릭스 데이터 웨어하우징 솔루션인 데이터브릭스 SQL은 BI 시각화와 데이터 공유 기능인 델타 쉐어링(Delta Sharing)을 통해 금융 서비스 조직이 데이터와 인사이트를 '민주화'하고 데이터 사용자 뿐 아니라 조직 내 모든 사람이 데이터에 액세스할 수 있도록 지원합니다. 복제 없이 모든 데이터를 안전하게 실시간으로 공유하는 개방형 프로토콜인 델타 쉐어링은 중앙 집중식 거버넌스와 크로스 플랫폼 수신자에 공유하는 등의 기능을 제공합니다.
금융 서비스를 위한 데이터브릭스 레이크하우스의 근간은 데이터와 사용자 통합, 실행 가능한 의사 결정, 데이터 민주화를 결합하는 것입니다. 이는 보안과 거버넌스를 희생하지 않으면서 데이터 액세스를 궁극적으로 민주화하는 것입니다.
신용 의사 결정을 위한 레이크하우스 데모 투어를 시작하면서, 우리는 모든 금융 기관이 달성할 수 있는 영향력을 보여드리고자 합니다. 데이터를 통합하고 분석에 사용할 수 있게 함으로써 새로운 고객을 유치하는 비즈니스 성과를 창출하여 금융기관과 잠재 고객 모두에게 이익이 될 것입니다.
고객 생애 가치 모델(CLV)을 적용한 대시보드 기능을 통해 신용 상품 이용이 저조한 고객(underbanked 고객)을 식별하고 서비스를 제공함으로써 얻을 수 있는 재무적 이점을 쉽게 보고할 수 있습니다. 이 대시보드는 원시 데이터, 머신러닝 예측, 설명 가능성 정보를 결합하여 각 금융 소외 고객의 채무 불이행 확률뿐만 아니라 각 고객 고유의 상위 3가지 이유도 파악할 수 있어 신용도를 평가하는 신용 상담원과 고객과 소통하는 마케팅 팀이 매우 유용하게 활용할 수 있습니다. 마지막으로, 아래에서 보고된 바와 같이 신용 점수 모델의 공정성을 평가하고 어떤 고객 그룹에게도 불이익이 돌아가지 않도록 하는 방법도 제공합니다.
Part II - Lakehouse 아키텍처를 이용하여 더 많은 고객에게 서비스를 제공하는 방법
이 섹션에서는 신용 의사 결정 데모의 기술적 구현과 아키텍처에 대해 자세히 알아보고, 금융 조직이 데이터를 사용하여 비즈니스 목표를 달성하는 데 레이크하우스가 어떻게 도움이 되는지 살펴봅니다.
위 그림은 신용 의사 결정 솔루션의 실제 아키텍처를 보여주며 데이터 통합, 거버넌스, 데이터 민주화 등 앞서 언급한 목표를 달성하는 방법을 보여줍니다.
이러한 end-to-end 데이터 계보는 데이터의 규정 준수, 감사, 통합 가시성 및 검색 가능성을 이해하는 데 매우 중요합니다.
전체 데이터 계보가 매우 중요해지는 일반적인 시나리오로 다음 세가지가 있습니다:
지난 20년 동안 고객이 가장 열광한 발명품들은 더 향상된 자동화를 가져왔습니다. iPhone은 수동 하드웨어 업그레이드에 의존하는 대신 멀티터치를 감지하는 소프트웨어를 도입했습니다. PayPal은 P2P 네트워크를 활용하여 결제에 혁명 을 일으켰습니다. 그리고 GPT-3는 업무 외 일상 생활에 스며든 정교한 텍스트 생성을 자동화하여 세상을 변화시켰습니다. 궁극적으로 신용 의사 결정도 동일한 수준의 혁신과 자동화의 혜택을 받고 있습니다. 이제 모든 기업(은행과 다른 금융기관)은 불완전한 데이터에 의존해 수동으로 대출을 승인하는 대신 대체 데이터 소스를 자동으로 수집하고, PII를 관리하여 가치 실현 시간을 개선하고, ML과 AI를 사용하여 신용 결정을 자동화함으로써 새로운 개인에게 신용을 제공할 수 있습니다. 데이터브릭스 레이크하우스의 신용 의사 결정 프레임워크는 데이터브릭스에서 제공하는 소프트웨어를 통해 이 자동화 프레임워크의 단순성을 정확히 코드화하도록 설계되었습니다.
비즈니스를 위한 신용 데이터 플랫폼을 시작하고 구축하려면 dbdemos.ai 의 데모를 방문하고 더 자세한 정보를 얻을 수 있습니다.