跳转到内容
洞察力>观众

抽样是代表个人层面测量的关键

4分钟阅读|Uche Onyewu,数据科学总监|2019年7月

你是否曾经停下来想,如果不知道每一个人在做什么,公司如何能够准确地衡量消费者的行为?如果是这样,你并不孤单。事实上,我们经常看到关于这个主题的问题。毕竟,有超过3.25亿人生活在美国,人们可能会对我们在不检查全国每个人的情况下衡量媒体参与和购物习惯的能力持怀疑态度,这是可以理解的。

由于许多原因,试图通过与尽可能多的人接触来衡量消费者的行为是不实际的,也不一定是个好主意。在其他情况下,这根本是不可行的。有些人选择不接受测量--不管是出于选择还是环境的原因。而这可能会歪曲所得到的数据,只关注那些最有可能参与的群体。

好消息是,在不与每个人单独接触的情况下,有可能了解一个非常大的群体的行为。 人是个人层面测量的关键,而由关键人群组成的小组被选为代表更大范围的人群,可以提供对更大人群行为的洞察力。但是,这究竟是如何做到的,特别是当小组包括的人数远远少于我们要测量的大群体时?

由于我们的小组提供个人层面的真实消费行为的洞察力,我们使用严格的数据科学和统计抽样方法,以确保我们通过小组和调查测量的人口准确地代表更大的人口。一般来说,抽样是一种测量特定人群的统计手段,目的是为了准确地扩大测量范围,以代表更大的人群。但就像测量一样,并非所有的抽样方法都是平等的。

抽样方法通常分为两类:概率型和非概率型。在基于概率的抽样中,人口中的每个人都有相同的机会被选中参与。在非概率抽样中,有些人被选中的机会有可能更大或更小。所以为了确保平等的代表性,必须使用某种形式的基于概率的抽样。

但是,取样不仅仅是在这两种不同的方法中挑选,还有更多的内容。具体来说,取样过程的复杂程度和执行情况会有所不同。换句话说,进行采样的参数是相当普遍的,而任何特定样本的完整性取决于它的准备工作有多彻底。对于无线电测量,我们应用了100多个关键流程,这些流程驱动并实现了我们的便携式人表(PPM)和音频日记测量服务。我们每天、每周、每月、每季和每年都会执行这些程序,以确保尼尔森产生尽可能多的代表性样本。

那么,整个过程是什么样子的呢?在开始时,我们利用美国人口普查数据来估计我们要测量的人口(年龄、性别、种族、民族、语言偏好等)和地理构成,最终侧重于为我们的尼尔森产品建立抽样目标。基于历史数据和预测模型,我们再预测随机选择的家庭的人口构成以及其参与的可能性。我们在细化的地理层面(如教区、城市或县)运行这些模型,我们不断监测这些模型,以保持代表性的样本,并根据需要进行更新。

当需要为我们的小组征集家庭时,我们在整个尼尔森使用各种招募方法。例如,对于广播测量,我们联系样本供应商,帮助我们建立一个测量区域内广泛的潜在小组成员的主要联系信息。这成为我们的起始样本。一旦我们储存了起始样本的联系信息,我们的团队就开始了样本选择过程,最终促使各种下游的招募操作(例如,邮寄招募材料,进行电话采访,会员代表访问家庭等)。

在整个过程中,有许多因素决定一个家庭是否有机会参与我们的小组和调查。这些因素直接关系到我们能否实现我们所测量的人口的代表性样本。

诚然,我们生活在一个技术、cookies、返回路径数据、喜欢、播放列表算法和无数其他数字标记的世界中,无论我们的在线生活将我们带到哪里,都会留下 "脚印"。但这些数据中的大部分并不完整。这些数据中的大部分带有偏见。许多数据并不打算用于测量。然而,个人层面的信息,仍然是真正的测量的最终来源。而抽样调查是打开个人层面的、有代表性的测量的关键。

继续浏览同一主题的洞察力