데이터 클린룸 ABC
마케팅을 하는 분이라면 최근 몇 달 새 ‘데이터 클린룸’이라는 단어를 한 번쯤은 들어보셨을 것입니다. 업계 내 많은 사람들이 기대를 갖고, 그러나 모호하게 ‘데이터 클린룸’에 대해 말하고 있습니다.
요새 많은 사람들이 언급하는 이 깨끗한 방(clean room)이라는 것이 도대체 무엇일까요? 어떤 사람들은 데이터 클린룸을 ‘데이터계의 스위스’라고 부릅니다. 맞는 말입니다. 퍼스트 파티 유저 데이터를 여러 주체가 협력하여 활용할 수 있는 중립적이고 안전한 지대이기 때문입니다.
이런 환경에서 기업들은 비즈니스에 꼭 필요한 데이터를 구하되, 소비자의 개인정보를 침해하지 않고 법을 준수할 수 있습니다. 한 유저의 데이터가 데이터 클린룸에 들어가면, 여러 다른 유저 데이터와 혼합되어 ‘코호트’라고 불리는 동질 집단 형태로 집계되며, 이렇게 집약된 데이터에 근거하여 유의미한 인사이트가 추출됩니다.
자, 이제 모호한 개념을 명확히 밝히고, 개인정보보호 중심 시대에 퍼스트 파티 데이터 활용을 극대화하는 여행을 시작합니다. 이 여행은 데이터 클린룸 특집 블로그 시리즈로 총 세 편으로 구성되어 있습니다.
여행을 마칠 무렵이면 데이터 클린룸이 무엇인지, 어떻게 작동하는지, 마케팅에 왜 필요한지, 앞으로 캠페인 성과 측정 기술에 어떻게 엄청난 영향을 줄지 모두 알게 될 것입니다.
그 전에, 우선 데이터 클린룸이 탄생하게 된 배경과 현재까지의 상황을 살펴보겠습니다.
디지털 생태계의 발전
데이터 클린룸은 지난 해에 새롭게 부상했지만, 사실 몇 해 전부터 존재하고 있었던 인프라 개념입니다.
구글은 ‘데이터 클린룸’이라는 용어를 처음 창안하지는 않았지만, 이 개념을 최초로 상업화하여 2017년 애즈 데이터 허브(Ads Data Hub)를 출시했습니다. 이 솔루션의 목적은 구글의 퍼스트 파티 데이터(CRM, CDP, 이벤트 로그 등으로 수집되는 데이터)를 구글의 생태계에 존재하는 유저 레벨 데이터로 보강하는, 안전하고 통제되는 환경을 조성하는 것이었습니다. 이렇게 업그레이드된 퍼스트 파티 데이터는 구글 캠페인 최적화에 활용될 수 있죠.
그 후 한 달만에 페이스북이 고객과 데이터를 공유할 용도로 자사의 데이터 클린룸을 발표합니다. 우연의 일치일까요? 그럴리가요.
그러나 본격적인 유저 개인정보 보호 시대를 알린 신호탄은 2018년에 울렸습니다. 이 해에 유럽 연합의 개인정보보호법 GDPR(General Data Protection Regulation)과 애플의 온라인 광고 쿠키 차단 정책인 ITP(Intelligent Tracking Prevention) 2.0이 개인정보 오남용을 감시하는 보안관으로 출연했습니다.
이러한 흐름에 따라 2019년, 아마존은 ‘아마존 마케팅 클라우드’라는 이름의 데이터 클린룸 플랫폼을 출시합니다. 2020년 초에는 캘리포니아 소비자 개인정보보호법, CCPA가 발효되었고, 같은 해 4월에는 애플이 iOS 14에서 광고 성과 측정을 위해 앱 기업이 유저의 앱 사용 활동을 수집할 경우, 유저의 동의를 반드시 받도록 하는 이른바 ATT(AppTrackingTransparency) 메커니즘을 선포하여 모바일 앱 생태계가 크게 들썩였습니다.
개인정보보호법이 속속들이 나오고 데이터 보안 기준이 점점 강화되자, 광고주와 기업이 소비자 데이터를 수집하고 공유하는 방식에 변화가 일었습니다.
2021년 10월, 페이스북은 유저 레벨 데이터를 더 이상 광고주에게 전송하지 않으며 모바일 측정 파트너(MMP)에게만 보낼 것이라고 발표했으며 다른 애드 네트워크들도 곧 이러한 흐름에 동참할 것으로 예상됩니다.
시장 내 지각변동을 일으킨 애플의 ATT 프레임워크와 페이스북의 유저 레벨 데이터 관리 정책을 지나 2023년 구글의 서드파티 쿠키 사용 제한을 앞두고 공유되는 데이터의 규모와 범위는 점점 줄어들고 있으며, 캠페인 성과 측정과 최적화가 더욱 어려워지는 상황입니다.
이러한 상황에서 기업들은 개인정보보호법을 준수하는 형태로 유의미한 마케팅 데이터 인사이트를 얻기 위해 새로운 방법을 모색하고 있습니다.
2019년, 데이터 교류 협력 체제 구축 트렌드가 시작되었습니다. 디즈니는 미국의 대형 유통 체인점 타겟(Target)과 협업을 선언했으며, 세계적인 생활용품 기업 유니레버(Unilever)는 페이스북과 구글, 트위터와 힘을 합쳐 다중 채널 측정 모드를 만들었습니다. 영국 최대 민간방송사, ITV(Independent Television)은 데이터 협력 플랫폼 인포섬(Infosum)과 2020년 파트너십을 맺었고, 2021년 미국의 신용평가 기관 트랜스유니온(TransUnion)이 티비 광고 데이터 전문 플랫폼 블록그래프(BlockGraph)와 데이터 협업 체제를 구축했습니다.
이렇게 다자간 대규모 데이터 협력을 가능케하고 앞으로도 더욱 활발한 협력을 추진시키는 원동력은 무엇일까요? 그게 바로 데이터 클린룸입니다.
데이터 클린룸이 도대체 뭔가요?
데이터 클린룸은 개인정보보호법을 준수하면서 데이터 셋을 조합하여 마케팅에 활용할 수 있도록 하는 공간입니다. 개인식별정보나 어트리뷰션이 제한된 유저 수준의 데이터는 결코 노출되지 않습니다. 즉, 클린룸에서 특정 유저를 고유 식별자로 가려내기란 불가능합니다.
개인식별정보와 유저 레벨 데이터는 가공되어 다양한 지표를 측정하는 목적으로 사용됩니다. 여러 정보원으로부터 수집된 데이터를 조합하고 상호 참조하여 익명화된 유저 그룹 데이터를 만들어 냅니다.
보통 데이터 클린룸에서 나오는 결과물은 데이터를 집약한 형태입니다. 예를 들어, ‘X’ 라는 행동을 한 유저’들’은 ‘Y’라는 성과를 낸다는 식입니다. 하지만 관련된 주체들의 동의를 모두 받으면, 유저 레벨 데이터도 얻을 수 있습니다.
데이터 클린룸에서는 데이터 접근권한, 가용성, 사용 여부가 모든 참여자의 합의에 의해 결정되며 데이터 거버넌스는 신뢰할 수 있는 주체가 시행합니다. 이러한 운영 원칙을 바탕으로 세워졌기 때문에 데이터 클린룸은 안심하고 믿을 수 있는 플랫폼입니다.
데이터 클린룸에서는 타자의 데이터를 볼 수 없으며 개인정보나 유저 레벨 데이터는 동의 없이는 기업 간 공유될 수 없다는 것이 클린룸의 운영 철칙입니다.
한 기업이 유통기업 ‘타겟(Target)’의 데이터를 원한다고 해보죠. 두 기업은 각자의 유저 레벨 데이터를 클린룸에 놓아야 서로가 공통 고객에 대해 어떤 정보를 갖고 있는지 볼 수 있습니다. 예를 들어, 공통 고객에 대한 광고 도달 여부, 광고 노출 빈도, 타겟 오디언스 중첩 부분, 크로스 플랫폼 광고 기획 및 구현 현황, 구매, 인구통계학적 특징 등에 대한 정보를 알 수 있습니다.
데이터 클린룸은 캠페인 성과를 측정하는 수단으로 활용될 수도 있습니다. 기업은 자사 제품 광고에 대한 소비자의 반응을 추측하기보다는 아마존이나 구글의 퍼스트 파티 데이터를 개인정보보호법을 준수하면서 들여다 볼 수 있습니다.
광고주는 특정 오디언스 세그먼트와 유사 오디언스와 같은 개인 식별자가 없는 집약된 데이터를 추출하여, 퍼블리셔, DSP, 혹은 애드 네트워크에게 캠페인에 대한 정보를 알려주기 위해 공유할 수 있습니다. 또, 광고주는 광고를 구매할 때 애드 네트워크별 광고 성과 데이터를 참조할 수도 있습니다.
데이터 클린룸은 어떻게 운영되나요?
데이터 클린룸은 다음과 같이 4단계로 운영됩니다.
1 – 데이터 주입
최초에 CRM, 웹사이트/앱, 어트리뷰션 시스템 등으로 수집된 퍼스트 파티 데이터, 혹은 협력 주체(기업, 파트너사, 애드 네트워크, 퍼블리셔 등)로부터 받은 세컨드 파티 데이터가 클린룸으로 주입됩니다.
2 – 데이터 연동 및 보강
그 다음, 데이터 셋들이 유저 레벨에서 매칭되고 서드 파티 데이터 등을 이용하여 서로서로 보완해 갑니다.
3 – 데이터 분석
이 단계에서는 다음과 같은 방식으로 분석합니다.
- 교차점, 중첩 부분 확인
- 측정 및 어트리뷰션
- 유사 성향 점수(propensity scoring)
4 – 마케팅에 적용
데이터 클린룸에서 집약형태로 추출된 데이터는 마케팅에서 다음과 같은 용도로 쓰입니다.
- 광고에 더 연관성 있는 오디언스 설계
- A/B 테스트로 고객 경험 최적화
- 크로스 플랫폼 마케팅 기획 및 성과 측정
- 광고 도달 범위 및 광고 노출 빈도 측정
- 캠페인 심층 분석
이제 데이터 클린룸 운영방식을 살펴보았습니다. 그런데 데이터는 실제로 어떻게 매칭될까요?
광고주 측과 퍼블리셔 측에서 제공하는 이메일, 주소, 이름, 모바일 ID 같은 식별자는 모두 유사합니다. 그래서 양측의 데이터를 잘 매칭할 수 있습니다.
이런 식별자가 존재하지 않으면, 머신 러닝이나 확률적 매칭 모델링 클라우드 같은 첨단 기술을 사용하여 매칭 정확도를 높입니다.
데이터 클린룸은 왜 마케팅에 필요할까요?
일단, 개인정보보호와 데이터 보안 때문입니다. 개인정보보호법이 강화되고 대기업이 개인정보보호라는 명목으로 담장을 치고 데이터를 독점하자, 광고주와 퍼블리셔들이 데이터를 수집, 저장, 분석, 공유하기가 더욱 복잡해졌습니다. 둘째, 둘 이상의 데이터 소유자가 데이터를 위탁할만한 영업용 신탁 시스템이 부족하기 때문입니다. 퍼스트 파티 데이터를 클린룸 밖으로 유출하는 행위는 법적으로나 영업적으로 위험하기 때문에 클린룸 안에서는 안심하고 데이터를 위탁하고 활용할 수 있습니다. 마지막으로, 여러 파편화된 데이터 셋 사이에 연계성을 찾아 연결하는 일은 데이터 사이언티스트에게도 중노동입니다. 비용과 시간이 무척 많이 듭니다.
그래서 데이터 클린룸이 나섰습니다!
데이터 보안 문제라면, 데이터 클린룸에서 걱정 없습니다. 누구든지 자신의 데이터를 완전히 통제할 수 있으며 각자의 데이터는 암호화 처리됩니다. 데이터 클린룸에서는 데이터 거버넌스와 데이터 권한 관리가 엄격히 실행되며, 각 참여자는 자신의 데이터에 대한 접근 권한과 용도를 스스로 정의합니다. 유저 개인 정보 유출 문제를 해결하는 또 다른 장치가 있습니다. 특정 광고 조회(impression)나 광고 클릭, 혹은 특정 행동을 특정 유저와 연결시킬 수 없도록 하는 차분 프라이버시입니다. 그 뿐만이 아닙니다. 데이터 클린룸에서는 개인정보 보호를 우선으로 하는 컴퓨팅과 쿼리를 통해 데이터 셋을 잘 엮어 유의미한 정보를 집약된 형태로 제공합니다.
데이터 클린룸 종류
지금까지 데이터 클린룸이 탄생하게 된 사업적, 기술적, 법적 배경을 살펴보았습니다. 이제 실제 존재하고 가동중인 데이터 클린룸의 종류를 분류해 보겠습니다.
담장 친 정원(Walled Gardens) – 거대 테크 플랫폼
이 유형은 기술 제공 주체가 하드웨어와 응용 프로그램, 혹은 콘텐츠를 강력히 통제하는 폐쇄형 환경입니다.
담장 친 정원이라는 개념은 구글, 아마존, 페이스북이 자사의 퍼스트 파티 데이터를 안전한 방식으로 상업화하고 경쟁사로 흘러갈 광고 예산을 가져오기 위해 도입되었습니다.
담장 친 정원을 선택해서 좋은 점은 이벤트 레벨 데이터로 퍼스트 파티 데이터 셋을 보강할 수 있다는 점입니다. 단점은 데이터 활용을 할 수 있는 구조가 유연하지 않으며, 크로스 플랫폼 데이터 측정(예: 멀티 터치 어트리뷰션)을 할 수 없고, 기업 간 데이터 협업이 어려우며 쿼리가 제한됩니다.
멀티 플랫폼, 혹은 중립적인 플랫폼
이 유형의 데이터 클린룸은 세 가지 하위 그룹으로 나뉩니다. 각 그룹마다 고유한 장단점이 있습니다.
기존 유사 솔루션에서 다각화된 유형
마케팅 애플리케이션이나 클라우드 데이터 스토리지같은 데이터 클린룸과 관련된 산업에서 운영하는 레거시 방식입니다. 다각화된 업체들이 데이터 협업 메커니즘을 제공하여 법을 준수하며 데이터 신호를 수집하도록 합니다.
이런 유형에서는 소위 담장 친 정원이라고 불리는 대기업의 데이터에 접근할 수 없지만 구조적으로 유연하고 데이터 관리 정책을 커스텀할 수 있으며, 데이터 종류와 분석 수준을 비교적 자유롭게 통제할 수 있습니다.
순수 데이터 클린룸 전문업체
신생 소규모 데이터 클린룸 제공업체들이 있습니다. 유연성은 있지만 퍼스트 데이터의 상세도가 제한적이고 종종 제 3자 인프라에 의존해서 데이터를 받습니다. 그리고 데이터를 더 유용한 정보로 가공하기 위해 타 시스템과 연동하는 방안이 많지 않습니다.
MMP(Mobile Measurement Partner)
SRN(Self-Reporting Network)이 걸어놓은 제약이 있긴 하지만, 모바일 측정 파트너(MMP)는 유저 레벨 데이터와 크로스 채널 데이터, 실시간 전환 데이터 및 모바일 앱 사업에 최적화된 애널리틱스를 제공합니다. 또, 다른 시스템과 연동을 유연하게 할 수 있으며, 수준 높은 집약형 데이터를 리포팅합니다.
귀사에 적합한 데이터 클린룸 제공업체를 고르려면, 귀사의 주요 채널(모바일, 앱, 웹), 회사 규모, 마케팅 니즈, 데이터 구조, 내부 자원을 고려해야 합니다.
마케팅의 미래
퍼스트 파티 데이터 수집은 이미 고도의 전략이 필요한 임무가 되었고, 앞으로도 퍼스트 파티 데이터 확보가 더욱 어렵고 중요해질 것입니다. 이러한 업계 흐름에 따라, 개인정보를 보호하는 방식의 데이터 협력체에 대한 관심이 높아져 중립적인 데이터 클린룸이 꽃피우는 시대가 열렸습니다. 정보 기술 연구 자문 기업 가트너(Gartner)는 마케팅 매체 비용을 10억 달러 이상 운영하는 기업의 80%가 2023년까지 데이터 클린룸을 도입할 것으로 예측했습니다. 데이터에 굶주린 디지털 생태계 전반에 반가운 소식입니다. (늘어난 수요로 인해) 선택지가 다양해질수록 기업은 자사의 필요에 맞게 최적화된 데이터 클린룸을 선택할 수 있기 때문입니다. 그리고 기업들이 데이터 클린룸 같이 잘 관리되는 데이터 운동장에서 협력을 더 많이 할수록 마케팅 캠페인을 측정하고, 성과 원인을 분석하고, 최적화하기가 수월해집니다.
핵심 정리
- 데이터 클린룸은 두 개 이상의 데이터 셋을 투명한 방식으로 매칭시키는 보안이 철저하고 안전한 환경입니다. 법적, 기술적 문제를 해결하고 다자간 데이터 협력을 할 수 있습니다.
- 데이터 클린룸은 안심하고 믿을 수 있는 플랫폼 입니다. 데이터 접근권한, 가용성, 사용 여부가 모든 참여자의 합의에 의해 결정되며 데이터 거버넌스는 신뢰할 수 있는 주체가 시행합니다.
- 데이터 클린룸의 종류는 구글, 아마존, 페이스북 같은 거대 테크 기업이 제공하는 담장 친 정원, 구조적으로나 데이터 거버넌스 측면에서 유연하고 연동하기 쉬운 다양한 멀티 플랫폼 혹은 중립 플레이어로 나뉩니다.
- 데이터 클린룸 솔루션의 하위 카테고리는 각각 장단점이 있으며, 다양한 비즈니스 및 데이터 필요사항을 충족시키도록 설계되었습니다.
- 캠페인 성과 측정을 하기 위해 사용할 퍼스트 파티 데이터를 점점 구하기 어려워지자, 데이터 클린룸 솔루션이 단비처럼 쏟아졌습니다. 기업들이 데이터 클린룸을 통해 협력을 더 많이 할수록 마케팅 캠페인을 모니터링하고, 성과 원인을 분석하고, 최적화하기가 수월해집니다.