
技术进步带来的好处似乎永无止境。 我们能用手机查看家中安防状况,通过无人机接收杂货配送——甚至驾驶能自动泊车的汽车。电视设备同样日趋先进,在不断扩大的平台与频道生态中提供海量内容选择。然而尽管智能电视将在未来数年开启诸多可能性,它们自身并不能为媒体行业提供精准的用户画像。
智能电视已占据当地大型零售商电视卖场的绝大部分货架。 如今在商店里,你几乎找不到不支持联网的电视机。与所有联网设备一样,智能电视也助长了用户生成数据的激增:自动内容识别(ACR)技术正是制造商用于捕捉智能电视收视行为的核心手段。当这些数据与详细记录个人行为特征的信息相结合时,便能显著推动受众测量科学的进步。
鉴于智能电视的广泛普及及其产生的海量数据,众多企业将自动内容识别(ACR)数据视为衡量受众的途径并不令人意外。从数据规模来看,这种机遇极具吸引力。然而,尽管ACR数据源利润丰厚,但仅凭它不足以实现受众测量——因为它缺乏受众测量中最关键的要素:人。 除了 缺乏代表性——甚至无法确认用户是否真正观看屏幕内容——ACR数据还存在关键验证缺陷:它需要设备制造商将屏幕图像与参考图像进行匹配,才能确定显示内容。因此,释放ACR数据真正潜力的最佳方式,是将其与反映真实个人观看行为的数据进行校准。
当正常运行时,ACR技术会监测投射在电视玻璃上的图像,并通过这些图像推断正在显示的内容。 ACR生成的图像在许多方面如同内容的指纹。但收集"指纹"后,该技术还需确定图像出现在哪个网络或平台,以及出现时间。为此,技术需要将屏幕上的图像与制造商维护的参考库中的图像进行匹配。
当技术尝试进行匹配时,可能出现三种结果:
- 该图像与参考库中的单条记录相匹配。
- 该图像与参考库中的多个条目匹配
- 参考库中没有匹配的图像

对所有相关方而言,第一种结果是最理想的场景。第二种情况则稍逊一筹,且伴随一定程度的归因失误风险——这纯粹源于多重匹配的各种成因(例如跨平台播出、重播、同步播出)。 第三种情况则无人获得计分,显然是最不理想的结局。此类结果最常见的原因在于内容在原始设备制造商(OEM)未监测的网络上播出。
即便图像匹配技术本身可作为独立的测量方案,将其付诸实践也绝非易事。试想,要维护包含电视上每个事件每一帧画面的完整图库,其成本绝非小事。这项任务还将持续呈指数级增长。此外,图像数据也缺乏统一的保存期限标准。
那么我们如何确保ACR技术能实现精准匹配?若缺乏填补空白的技术机制,我们便无从知晓。正因如此,尼尔森投入了水印技术——其确定性远超签名技术,并为每条测量信号配备签名备份。这使得所有内容都能获得完整呈现,从而弥补了大数据本身存在的缺口。 填补这些空白后,来自ACR等渠道的大数据便能在日益细分的媒体环境中发挥规模优势。当我们运用加权控制将大数据与个人观看数据进行校准时,原本空白处的对比点便得以呈现。
尼尔森近期开展的一项研究旨在探究参考库缺失对ACR调谐日志的影响程度——该日志是基于ACR的测量体系的基础。在2021年9月的共同家庭分析中,我们通过分析两大ACR供应商合作伙伴的数据,探究参考库缺失可能对测量产生的影响。研究中,我们同时考察了可获取来源的收视来源集中度及收视分钟数。
在所有观看来源中,我们发现我们的自动内容识别(ACR)供应商合作伙伴仅监测了31%的可用频道。这意味着其参考库中缺少69%频道的数据。当我们分析观看时长时,发现23%的观看时长来自未被监测的频道。这意味着仅依赖ACR数据进行测量的主体,其家庭级曝光量统计将低估23%。
尽管ACR数据本身存在局限性,我们仍认识到其作为补充覆盖数据源所提供的规模与覆盖范围优势——类似于机顶盒的回传路径数据(RPD),我们的大数据策略同样通过与样本数据校准来弥补其可比性缺陷。 通过将大数据集与覆盖全美代表性样本的收视数据整合,我们不仅能显著扩大样本规模,更能运用严谨的数据科学方法填补数据空白,确保所有网络和平台上的全美受众群体获得公平代表。
本文的原始版本最初发表于AdExchanger。




