跳至内容
02_Elements/Icons/ArrowLeft 返回洞察力
洞察>受众

抽样是进行具有代表性的个人层面测量的关键

4 分钟阅读 | Uche Onyewu,数据科学总监 | 2019 年 7 月

您是否曾经想过,一家公司如何在不知道每个人都在做什么的情况下准确衡量消费者的行为?如果有,那您并不孤单。事实上,我们经常会遇到这样的问题。毕竟,美国有超过 3.25 亿人口,人们对我们在不了解每个人的情况下衡量媒体参与度和购物习惯的能力持怀疑态度是可以理解的。

出于很多原因,试图通过与尽可能多的人接触来衡量消费者行为并不现实,也不一定是个好主意。在其他情况下,这根本不可行。有些人选择不参与测量--无论是出于自愿还是环境所迫。而这可能会使得出的数据偏向于只关注那些最有可能参与的群体。

人对于个人层面的测量来说至关重要,而由关键人群组成的调查小组经过挑选,代表了更大范围的人群,可以帮助我们深入了解更大范围人群的行为。但这究竟是如何实现的呢,尤其是当小组中的人数远远少于我们要测量的更大群体时?

由于我们的调查小组能够从个人层面洞察真实的消费者行为,因此我们采用严格的数据科学和统计抽样方法,以确保我们通过调查小组和调查所测量的人群能够准确地代表更大范围的人群。一般来说,抽样是测量特定人群的一种统计方法,目的是将测量结果准确地扩展到代表更大的人群。但就像测量一样,并非所有的抽样方法都是一样的。

抽样方法通常分为两类:概率抽样和非概率抽样。在概率抽样中,人口中的每个人都有相同的机会被选中参与抽样。而在非概率抽样中,有些人被选中的机会可能较大,有些人被选中的机会可能较小。因此,为了确保平等的代表性,必须使用某种形式的概率抽样。

但是,取样不仅仅是选择这两种不同的方法。具体来说,取样过程的复杂程度和执行方式各不相同。换句话说,进行采样的参数是相当通用的,而任何给定采样的完整性都取决于采样准备的彻底程度。在无线电测量方面,我们采用了 100 多个关键流程,这些流程推动并实现了我们的便携式人员流量计 (PPM) 和音频日记测量服务。我们每天、每周、每月、每季度和每年都会执行这些流程,以确保尼尔森提供最具代表性的样本。

那么,整个过程是怎样的呢?首先,我们利用美国人口普查数据来估算所测量人群的人口构成(年龄、性别、种族、民族、语言偏好等)和地理构成,最终重点是为尼尔森产品确定抽样目标。然后,我们根据历史数据和预测模型,预测随机抽取的家庭的人口构成及其参与的可能性。我们在细化的地理层面(如教区、市或县)运行这些模型,并持续监控这些模型,以保持样本的代表性,并根据需要进行更新。

当需要为我们的小组招募住户时,我们会在尼尔森整体范围内使用各种招募方法。例如,在广播测量中,我们会联系样本供应商,他们会帮助我们建立测量区域内大量潜在小组成员的主要联系方式。这就是我们的起始样本。一旦我们存储了起始样本的联系信息,我们的团队就会开始样本选择过程,最终促使各种下游招募操作(例如,邮寄招募材料、进行电话访谈、会员代表走访家庭等)。

在整个过程中,有许多因素决定着一个家庭是否有机会参与我们的小组和调查。这些因素直接关系到我们能否获得具有代表性的调查样本。

的确,在我们生活的世界里,技术、cookies、返回路径数据、"喜欢"、播放列表算法和无数其他数字标记都会在我们的网络生活中留下 "足迹"。但很多数据并不完整。许多数据带有偏见。很多数据并不是用来衡量的。然而,个人层面的信息仍然是真正测量的权威来源。而抽样是开启个人层面代表性测量的关键。

继续浏览类似的见解