금융회사의 대체데이터 활용

2022. 3. 31

CLIPBOARD
image_pdf

 

 

글. 박정호(명지대학교 특임교수)

 

데이터, 디지털 혁명의 핵심 자산

과거 아날로그 혁명에서 핵심 자산이 자본, 설비, 인력, 원료 등이었다면 디지털 혁명의 핵심 자산은 데이터라고 한다. 데이터가 ‘자산’으로 떠오르는 이유는 모든 것이 사회 각 분야의 디저털 전환으로 빠르게 진행되면서 과거에 비해 데이터를 획득하고 가공하기가 수월해졌기 때문이다. 실제로 글로벌 통계 포털 ‘스테이티스타(Statista)’에 따르면, 전 세계 데이터 규모는 2010년 2제타바이트(ZB)에서 2024년 149ZB로 급증할 전망이다. 이 과정에서 수집되는 데이터의 종류도 다양해졌다. 기존의 단순 수치화된 정형 데이터뿐만 아니라 인터넷상의 뉴스나 소셜 네트워크 서비스(SNS)와 관련돼 생성된 문자 데이터, 이미지 및 영상 데이터, 각종 센서(Sensor) 데이터 등 다양한 비정형데이터에 대한 분석이 가능해진 상황이다.

금융투자협회의 ‘2021 글로벌 자산관리 트렌드 보고서’에 따르면 대체데이터 분석이 새로운 화두로 부상하고 있다. 이제 재무제표와 같은 기업 정보는 누구에게나 공개되기 때문에 차별화된 정보로서 가치를 잃고 있다. 전 세계적으로 약 2,700억 달러 규모의 자산을 운용하는 글로벌 헤지펀드 100개사 중 9%는 투자 성과 개선을 위해 대체데이터 분석을 도입했고, 예측 기술 등 다양한 기술의 활용으로 금융회사가 대체데이터에서 유의미한 정보를 추출하는 것이 더욱 용이해졌다.

 

대체데이터와 금융의 만남

이렇게 금융업은 작금의 환경 변화에 가장 먼저 주목하고 대응을 하고 있다. 금융업은 과거부터 투자 적합성, 대출 적합성 등을 판단하기 위해 데이터를 활용해 왔으며, 이 과정에서 일찍부터 데이터의 중요성을 인식해 왔다. 최근에 들어서는 투자 대상 분석 시 기존에 고려 대상이 아니었던 비정형데이터인 대체데이터를 텍스트마이닝, 음성·이미지 인식 등을 토해 분석해 잠재적 투자 기회나 아이디어를 포착하는데 활용하고 있다.

여기서 말하는 대체데이터(Alternative Data)란 재무제표, 경제지표 등 기존의 전통 데이터가 아닌 소셜 미디어, 신용카드 구매 내역, 위성사진, 위치정보, IoT데이터, 음성파일 등 모든 비재무적 데이터들을 지칭한다. 현재 약 300여 개의 대체데이터 사업자들이 글로벌 금융회사들에게 데이터서비스를 제공하고 있으며, 주요 플레이어들은 투자 확대, 전문인력 채용 등 자체 역량 강화에도 주력하고 있는 추세이다.

 

 

새로운 길을 제시하는 대체데이터

그렇다면 기존 금융회사들이 대체데이터에 주목하게 된 배경은 무엇일까? 그것은 전통적인 금융거래 정보만을 활용하는 것이 이미 한계에 봉착했기 때문이다. 예를 들어 최근 2년간 신용카드 사용 내역이 없고 3년간 대출 실적이 없는 씬파일러(Thin-Filer)는 현행법 하에서 일괄적으로 중간 등급을 부여받는다. 그러나 이들의 실질적인 대출 위험은 결코 동일하지 않다. 이들 중에는 돈을 빌려주면 제때 돈을 갚기 어려운 사람과 향후 급격히 신용등급이 개선될 사람들이 혼재되어 있는 상황이다.

하지만 대체데이터를 활용하면 이런 문제를 보완할 수 있다. 최근 신용 이력이 없는 사람이라도 공과금을 꾸준히 제때 납부한 사람이라면 대출금 상환도 성실히 할 가능성이 크다고 볼 수 있을 것이다. 이에 피코(FICO)사는 전혀 금융거래 실적이 없는 사람들을 대상으로 한 신용평가 방법을 고민해왔다. 피코사는 이전에 신용 기록이 전혀 없는 사람들이 향후 어떠한 신용 등급으로 변화했는지를 설명하는데 가장 유용한 변수가 통신료, 전기료, 수도료, 임대료 등 어떠한 지불 기록 정보가 유용한지를 판단해 이를 신용도 평가에 활용하고 있다.

 

 

이러한 관점에 주목해 글로벌 핀테크 회사들은 다양한 형태로 고객의 신용등급을 구분하기 위한 시도들을 지속해오고 있다. 먼저 크리디테크(Kreditech)사는 고객이 대출 신청을 할 때 대출 약관을 꼼꼼히 읽는지 여부를 통해 신용등급을 추가적으로 평가한다. 크리디테크사는 통상적으로 대출에 대한 신중함 내지 연체 관리를 엄격히 하는 고객들의 경우 마우스를 내려가며, 대출 약관을 하나하나 신중히 읽어보는 특성을 확인한다. 그리고 이를 사업에 적용해 자사에 대출 신청을 하는 과정에서 고객들이 약관에 대한 내용을 세심히 읽어보는지 여부를 확인하고 대출 시 이를 반영하는 것이다.

렌도(Lenddo)사는 대출 신청자의 페이스북 친구들을 대출 심사에 활용하는 것으로 유명하다. 기존 고객들의 성향을 바탕으로 한 분석 결과, 페이스북 친구 설정이 되어 있는 고객들 간에 신용 등급이 점차 유사해지는 성향을 확인한다. 이에 렌도사는 대출 희망자의 동의를 얻어 해당 고객의 페이스북 친구 계정을 바탕으로 페이스북 친구들의 신용 등급에 따라 대출 희망자의 신용 등급을 조정하는 방식을 고안했다. 이 역시 대출 부실 여부가 주변 지인 및 동료들의 성향을 따라가는 측면이 있음을 고려한 대출 심사 방식이다.

온덱(OnDeck)은 소상공인들의 대출 심사 과정에서 해당 소상공인의 평판을 활용한다. 온덱은 기존의 금융거래 실적뿐만 아니라 SNS 및 기타 맛집 정보 상의 댓글 및 회사 추천 사이트 등에 남겨진 평판 정보를 통해서 대출 희망 기업의 신용등급을 조정하는 방식이다. 최근 우리나라의 한 핀테크 회사도 대리운전회사와 연동해 소상공인 대출 시 해당 식당에서 대리운전 이용객 수가 증가 추세에 있는지 감소 추세에 있는지 등을 확인해 대출 심사에 활용하고 있다.

 

 

전통 금융권에도 스며든 데이터 방식

이러한 핀테크 기업들의 선도적인 시도들을 최근에는 전통 금융회사들도 적용하기 시작했다. 전통적인 금융회사들을 통해 대출 서비스를 이용하는 고객군은 고신용, 저금리 이용자가 주를 이룬다. 이에 반해 저신용, 고금리 이용자의 경우에는 부실채권의 우려 등으로 인해 전통적인 금융권에서는 대출 서비스를 받기 어려운 것이 통상적이며, 기존 금융권에서도 이들을 위한 대출 서비스를 구현하는 것이 오히려 수익적인 면에서 커다란 이익이 없다고 인식하고 있다.

하지만 중금리 이용자는 다르다. 중금리 이용자의 경우 대학을 막 졸업하고 생애 첫 금융 거래를 시작하는 사람이라던가 오랫동안 전업주부로 생활하다 다시 사회 생활을 시작하는 경력 단절 여성들, 이제 막 창업을 시작한 스타트업 CEO 등이 여기에 해당한다. 이들은 향후 고신용, 저금리 이용자로 얼마든지 진화·발전할 수 있는 대상이기 때문에 지속적인 관계 설정이 중요한 고객군이 포함되어 있다.

뿐만 아니라 중금리 이용자의 시장 규모 또한 큰 상황이다. 신용평가회사 기준으로 중금리 이용자에 해당하는 5~7등급 금융소비자들의 경우 전체 고객의 30%를 차지하고 있으며 1,400만 명에 달한다. 과거에는 중금리 이용자의 경우 제2금융권이나 사금융을 활용해 대출 서비스를 이용해 왔지만, 향후에는 핀테크 기업들이 중금리 이용자를 다양한 데이터로 선별해 추가적인 대출 서비스를 제공할 것으로 점쳐지고 있으며, 현재 국제적으로도 다양한 중금리 이용자의 신용등급을 세분화해서 평가할 수 있는 방법이 시도되고 있는 상황이다.

 

대출 외 다양하게 활용되는 대체데이터

대체데이터를 금융업에 적용한 사례는 단순히 대출에만 국한되지 않는다. 오히려 대체데이터의 활용은 투자 분야에서 훨씬 다양하게 활용되고 있다. ‘오비탈 인사이트(Orbital insight)’라는 회사는 인공위성 사진과 레이더, 컴퓨터 시각화 등을 통해 원유 재고량을 알아내고 유가를 예측하는 기초 정보를 제공하는 것으로 유명하다. 2013년 설립됐으며 초기에는 위성 사진과 익명화된 휴대전화 좌표 등을 수집, 분석해 유의미한 자료를 만들어냈다. 그러다 자신들이 보유한 기술력이 원유 가격 예측에 유용하다는 사실을 인식하기 시작했다. 이에 인공위성 사진을 이용해 원유 탱크에 드리워진 그림자로 탱크의 크기를 측정하고, 원유가 얼마만큼 저장돼 있는지를 가늠할 수 있게 됐다. 이 회사는 200개 이상의 인공위성을 활용해 전 세계에 있는 석유 저장 탱크를 컴퓨터 시각화로 매핑할 수 있다. 그림자로 탱크의 크기를 측정하고, 탱크의 테두리에 드리워진 그림자를 통해 통이 얼마나 비어 있는지 측정 가능하다. 또 구름이 낀 날은 인공위성의 레이더 빔을 통해 탱크에 얼마나 많은 원유가 들었는지를 측정할 수도 있다. 물질을 통과하는 진동의 차이로 양을 측정하는 방식이다. 이들은 매년 3억제곱킬로미터 가량의 위성사진 이미지를 매년 분석해 전 세계 석유량을 추정한다고 설명했다. 뿐만 아니라 오일 탱크에서 나오는 레이더 진동을 이용해 저장 규모를 정밀하게 측정할 수 있다고 한다.

유가에 가장 큰 영향을 미치는 재료 중의 하나가 재고량이라는 점에서 이 수치는 유가를 예측하는 데 필수 불가결한 데이터 중 하나다. 특히 최근처럼 우크라이나·러시아 사태로 인해 유가 시장이 뒤흔들 때는 더욱 중요해지는 자료가 된다. 현재 이 회사에는 구글벤처스뿐만 아니라 골드만삭스, 세쿼이아 캐피털, 셰브런 등이 투자하고 있다.

이글알파(Eagle Alpha)사는 소셜 미디어 데이터를 통해 블리자드사의 신작 게임 ‘오버워치’가 판매량 신기록을 기록할 것임을 정확히 예측해 업계를 놀라게 한 바 있다. 이들이 사용한 데이터는 트위터, 페이스북, 유튜브, 블로그, 리뷰 사이트, 뉴스 사이트 등을 통해 소비자가 콘텐츠를 보거나 반응하는 방식을 수집한 데이터다.

오버워치는 발매 첫 주 트위터에서 120만 회 이상 언급되는 등 경쟁 타이틀에 비해 언급 빈도가 훨씬 높았다. 뿐만 아니라 긍정적인 감정을 나타내는 소비자 언급이 주를 이뤄 시장에서도 강세를 보일 것이라 예측할 수 있었다. 결과는 오버워치의 판매량은 더 일찍 발매되었던 경쟁작들을 압도했다. 오버워치가 발매된 지 3주 만에 천만 명의 가입자를 확보한 데 비해 경쟁 타이틀인 ‘The Division’은 3달 여 만에 950만 명을 확보하는 데 그쳤다. 당연히 이들이 예측한 정보는 한 발 빠른 투자 결정이 요구되는 헤지펀드 회사들에게는 가장 유용한 분석 결과로 활용된다.

 

 

또한 개인 고객 금융 데이터 분석 서비스를 제공하는 ‘에퀴팩스(Equifax)’는 미국 전체 가구의 총 유동자산 추정치를 기반으로 고객 가구별 총 자산 추정치를 기업사에 제공하고 이를 바탕으로 고객의 지갑점유율(지출항목별 구성 비중, 한 개인의 전체 지출 중에서 특정 제품에 대한 지출이 차지하는 비중), 자산 배분 분석에도 활용할 수 있도록 했다. 영국 투자신탁운용사 ‘슈로더(Schroder)’는 2014년 설립된 Data Insights Unit 소속 데이터 전문가가 대체데이터와 빅데이터를 분석해 도출한 차별화된 인사이트를 자사 펀드매니저와 고객에 제공하기도 했다.

가장 최근 사례로 피스컬노트와 에이셀의 M&A가 있다. 지난 1월 미국 법률 및 정책 분야의 AI기업 ‘피스컬노트(FiscalNote)’가 대체데이터 시장에서 빠르게 성장하고 있는 ‘에이셀테크놀로지(Aicel)’를 인수한 것. 에이셀은 다양한 비즈니스 의사결정에 필요한 데이터 솔루션을 제공하는 회사로 가치 있는 원천 데이터를 발굴해 수집하고, 데이터 공급자와 수요자를 연결하는 대체데이터 플랫폼 서비스를 운영하고 있다. 전 세계 6개국을 대상으로 서비스를 제공하며, 글로벌 자산운용사와 헤지펀드가 주요 고객이다. 국내 기업 및 공공기관과도 협업 관계에 있으며 지난해 매출이 2배 이상 성장했다.

 

신용카드 추적과 지리적 위치정보

대체데이터로 각광받는 것은 지리 정보다. 파이낸셜타임즈는 투자자들이 소비자의 지리 정보에서 현재 위치와 소비 성향까지 파악할 수 있기 때문에 이를 활용하면 전체 소비 동향을 파악할 수 있다고 설명했다. 신용카드 추적(tracking)도 대체데이터 수집의 중요한 소스다. 이 데이터는 소비자가 무엇을 구매하는지 알 수 있는 정보여서 신용카드 회사에는 중요한 ‘금맥’이라고 할 수 있다. 물론 카드 정보는 판매의 부분적인 방향만 제공하지만 다른 데이터와 결합하면 중요한 통찰을 얻을 수 있다. 이 때문에 현재 비자카드, 마스터카드를 비롯해 국내 대표적인 신용카드 회사들도 고객들의 카드 사용 내역과 지리정보를 링크시켜 부동산 시세 예측, 상권분석 등의 시사점을 도출하기 위한 다양한 시도 중이다.

 

대체데이터의 급증세, 산적한 위험 해결 우선

이상에서 열거한 사례들에서도 확인할 수 있듯이, 지금 현재 대체데이터 시장은 급증 추세에 있다. 로펌 로웬슈타인 샌들러의 투자관리그룹 조사에 따르면, 2016년 2.3억달러 수준이던 글로벌 운용사들의 대체데이터 관련 지출액은 2020년 17억달러로 확대 추세에 있다. 이들의 조사 결과에 따르면, 헤지펀드 종사자 82%가 이미 일부 용량의 대체데이터를 사용하고 있으며, 응답자의 75%가 투자 예측을 위해 사용하고 있다고 한다. 대체데이터를 사용하는 응답자의 98%가 투자 결정을 내리기 위해 이를 근본적인 분석과 함께 활용하는 것으로 나타났다. 또한 응답자의 81%가 대체 데이터에 대한 예산을 늘릴 계획이며, 그 중 대다수는 예산을 1125% 가까이 늘릴 계획이라고 응답했다. 이러한 설문 조사 결과는 대체데이터의 활용도가 많은 사람들이 신뢰를 보이고 있음을 반증한다 할 것이다.

대체데이터를 활용하면 전통적 금융데이터의 한계를 뛰어넘는 인사이트를 얻을 수 있는 것은 분명해 보인다. 하지만 대체데이터를 활용시 주의해야 할 점도 있다. 기존에 널리 활용되지 않는 데이터를 앞서 활용할 경우, 기존의 데이터에 비해 신뢰성과 활용가능성이 충분히 논의 및 검증되지 않았다는 의미이기도 하다.

검증되지 않은 데이터를 발굴하고 수집, 정제하기 위해 낭비되는 비용은 비즈니스에 치명적일 수 있다. 해외에서는 대체데이터 전문 분석가의 수가 점점 증가하고 있으나, 기존 데이터 분석가와 신규인력을 동시에 고용하면서 오는 인력풀의 변화 또한 리스크가 된다. 사업 목적과의 일치 여부, 잠재가치를 고려해 대체데이터를 활용할 것인지, 얼마나 비용을 들일 것인지, 어떤 데이터를 활용할지 신중히 숙고하는 과정은 필수다.

그럼에도 불구하고 대체데이터는 유관 기술들인 빅데이터·AI·클라우드 등 디지털 신기술의 도입과 함께 금융산업의 구조·플레이어 등이 근본적으로 변화하고 있다. 기존 금융 회사의 대내외 디지털화 촉진, 핀테크 스타트업의 창업 활성화, 디지털 신기술 기반의 빅테크 및 플랫폼 사업자의 금융 분야 진출 등도 함께 전개되고 있는 상황이다. 향후 어떠한 금융회사들이 대체데이터를 활용해 새로운 혁신을 만들어 낼지 기대된다.

 

* 저작권법에 의하여 해당 콘텐츠는 코스콤에 저작권이 있습니다.
* 따라서, 해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금합니다.