
미디어 업계에서 3월부터 5월까지는 본격적인 활동 시기다. 개별 플랫폼과 기술에 국한되지 않는 다양한 선행 판매 행사(upfront events)가 미디어 전반에 걸쳐 펼쳐지는 가운데, 확장되는 콘텐츠 시장은 광고 구매자와 판매자에게 풍부한 기회와 방대한 정보를 동시에 제공한다. 특히 측정 기준으로서 빅데이터에 대한 논의가 증가하는 상황에서 더욱 그러하다.
광고주들에게 연말은 숫자가 가장 중요한 시기다. 디지털 참여도가 높아지면서 TV 시청이 분산되는 가운데, 이 숫자들은 더욱 중요해지고 있다. 얼마나 중요할까? 앰퍼 분석(Ampere Analysis ) 연구에 따르면 2021년 콘텐츠 총 지출액은 약 2,200억 달러로, 스트리밍 강자 넷플릭스가 주도했다. 광고주들은 지난해 미국인들이 약 1,500만 년 분량의 동영상을 스트리밍했다는 사실을 인지하며, 2021년 전 세계 디지털 광고 지출이 29% 이상 급증해 4,910억 달러를 넘어선 가운데 적극적으로 대응하고 있다.
게다가 소비자들은 스트리밍 산업의 흐름을 바꾸려는 계획이 전혀 없다. 스트리밍 구독자의 93%가 향후 1년간 이용량을 늘릴 계획이라고 답했기 때문이다. 그러나 이는 전통적인 TV 콘텐츠가 사라진다는 의미는 아니다. 오히려 정반대다. 성인 1인당 하루 평균 라이브 TV 시청 시간이 커넥티드 TV(CTV) 콘텐츠 시청 시간보다 두 배 이상 길기 때문이다.
콘텐츠의 급증은 소비자에게 선택의 폭을 넓혀주지만, 수많은 플랫폼과 기기, 서비스는 광고주에게 측정 문제를 야기할 수 있다. 또한 선택의 폭이 폭발적으로 늘어난다고 해서 콘텐츠를 접할 시간이 더 생기거나 인구가 증가하는 것은 아니다. 그러나 스마트 TV(ACR)와 케이블 박스(RPD)에서 수집되는 빅데이터는 이와 다른 결과를 시사한다. 케이블 박스와 스마트 TV 데이터는 스트리밍 활동에 대한 통찰력도 거의 제공하지 못합니다: 케이블 박스는 정의상 전통적인 TV 데이터를 제공하며, ACR은 시청자가 넷플릭스 같은 네이티브 앱을 사용할 때 종종 작동이 중단됩니다.
빅데이터는 측정 목적으로 사용될 의도가 전혀 없었을 뿐만 아니라 실제 사람들을 반영하지도 않습니다. RPD와 ACR의 가치는 측정 기준을 제공한다는 점에서 분명하지만, 빅데이터는 실제 사람이 아닌 기기를 반영합니다. 데이터 자체만으로는 누가 시청하고 누가 시청하지 않는지 알 수 없는데, 이는 광고주에게 필수적인 정보입니다. 그리고 사람이라는 변수를 제외하면 숫자는 결코 맞아떨어지지 않습니다.
ACR 데이터를 예로 들면, 이는 스마트 TV 화면의 영상을 식별합니다. 이 데이터는 시청률 측정에서 매우 유용할 수 있지만, 그 자체로는 화면에 무엇이 표시되는지 식별하는 것 이상의 기능을 하지 못합니다. RPD 데이터도 유사하지만, TV가 켜져 있는지조차 확인하는 기능이 부족합니다. 그래서 전체 셋톱박스 노출의 4분의 1이 TV가 켜져 있지 않은 상태에서 발생합니다.
빅데이터는 누가 기기나 화면을 사용하는지 알 수 없을 뿐만 아니라 본질적으로 편향되어 있으며, 그 편향성은 데이터 유형에 따라 달라집니다. 빅데이터가 미국 인구를 진정으로 대표하려면 모든 TV 가구가 정확히 동일한 TV 세트를 보유하고 동일한 데이터 스트림을 통해 프로그램을 시청해야 합니다. 그렇기에 모든 빅데이터 세트는 미국 인구의 다양성을 반영하는 인구 기반 패널을 통해 수준을 맞추고(보정해야) 합니다.
중요한 점은, 세계광고주연맹(WFA), 미국광고주협회(ANA) 및 30여 개국 이상의 유사 기관들이 일제히 스크린 미디어의 미래 시청률 측정 시스템은 질적 패널과 빅데이터의 결합이어야 한다고 밝혔다는 것이다.
패널 데이터가 없으면 측정 방식은 다양성을 포착하지 못합니다. 모든 TV 가구가 동일한 기기에서 동일한 콘텐츠를 시청하지 않을 뿐더러, TV 가구가 속한 국가의 구조만큼이나 가구 구성도 다양하다는 사실을 우리는 잘 알고 있습니다. 바로 이 점에서 빅데이터 기반 측정 방식은 크게 빗나가고 있습니다.
예를 들어, 히스패닉계는 미국 인구의 20% 미만을 차지하지만, 빅데이터는 이 집단과 다른 많은 집단을 현저히 과소계산합니다. 그러나 측정 기준이 RPD(실시간 시청률)에만 의존할 경우, 닐슨 분석에 따르면 히스패닉 가구가 30%나 과소평가된다고 합니다. 이를 이해하기 쉽게 설명하자면, 2020년 미국 인구조사에서 히스패닉 인구는 6,200만 명을 약간 넘었습니다. 만약 이 인구의 절반이 특정 시간대에 TV를 시청하고 광고주들이 RPD 데이터를 측정 기준으로 활용한다면, 광고주들은 인지하고 있는 것보다 900만 명 더 많은 사람들에게 도달할 수 있습니다.
중요한 점은 30%의 과소표현이 평균값이라는 것이다. 프로그램 수준에서는 빅데이터가 일반 인구와 다양한 시청자층 모두에 대해 훨씬 더 큰 차이로 과소 또는 과대 표현될 수 있다. 예를 들어, 빅데이터 측정과 그 기준이 되는 패널 기반 측정의 차이를 분석한 닐슨 연구에 따르면, RPD 측정은 프라임타임 프로그램의 미국 전체 노출 수를 69% 과대평가했다. 이에 비해 ACR 측정은 총 노출 수를 12% 과소평가했습니다. 스포츠 경기의 경우, RPD 측정은 히스패닉 시청자 수를 47% 과소평가한 반면, ACR 데이터는 동일한 시청자 수를 12% 과대평가했습니다.
광고주에게 이러한 측정 편차는 비용이 많이 들 수 있습니다. 그러나 새로운 데이터 소스의 공급이 증가함에 따라 측정 과정은 더욱 복잡해지고 있으며, 특히 실제 사람과 연결되지 않을 때 더욱 그렇습니다. 퍼블리셔와 광고주는 항상 가능한 한 가장 넓은 도달 범위를 원하지만, 이를 검증하는 데 필요한 분석적 엄밀성 없이서는 결코 그렇지 않을 것입니다.
선형 미디어와 디지털 미디어가 융합되면서 빅데이터 소스는 측정 작업에 필수적인 입력 자료가 되었습니다. 그러나 그 자체만으로는 신뢰할 만한 측정 자료로 활용하기 어렵습니다. 소비자들이 더 많은 기기와 채널을 통해 접촉함에 따라, 잠재적으로 과대평가된 참여도를 주장하는 데이터를 지적하는 것은 쉬워질 것입니다. 광고주들은 대체 측정 방식들이 제시하는 시청자 규모를 분명히 환영하겠지만, 그 수치에 기반해 광고 구매를 진행한다면 결국 실제 사람들을 반영하지 않는 숫자에 돈을 지불하게 될 것입니다.



