本コンテンツへスキップ
インサイト>TV & ストリーミング

ビッグデータセットに隠された問題点

6分で読めるシリーズ|ニールセン SVP データサイエンス モリー・ポピー氏|2021年10月号

ニールセンについて 最近、メディア業界では、測定の未来とビッグデータの有望性について、多くのエネルギーと興奮が巻き起こっています。Nielsenでは、ビッグデータの価値を長い間理解しており、実際、先月、全国テレビ測定サービスにビッグデータを追加する方法についての詳細を発表したばかりです。 

また、この数ヶ月で明らかになったように、完璧なパネルがないことも承知しています。 

しかし、データサイエンティストのチームが、ニールセンについて ビッグデータがその日を救い、業界で認識されているすべての課題を解決するという大まかな主張を耳にしたとき、懐疑的にならざるを得ません。

というのも、ビッグデータはその価値と素晴らしい可能性を持っていますが、現在、業界がアクセスできるビッグデータセットには非常に大きな限界があるからです。 

関連する最近の例

NielsenのPortable People Metersへのアクセスを失ったComscoreは、今後、ExperianのConsumerViewのデータセットを使用して、測定目的のために個々の視聴者を識別することを報告しました。結局のところ、ビッグデータが未来であるならば、その方向へのいかなるシフトも良いことに違いないのです。 

彼らの顧客や消費者にとっては残念なことですが、そうではありません。 

個人を特定できる情報に基づいてデータセットを照合し、直接収集したものとモデル化したものの両方の人口統計学的特性を提供する機能を提供するサードパーティのIDベンダーは、世の中に一握りしか存在しない。 

ニールセンでは、このデータを定期的にチェックしています。ニールセンの堅牢なパネルから得た情報を直接測定し、これらのデータセットが、1)世帯に正しくマッチしているか、2)人口統計や特性を正確に報告しているか、を検証しています。 

その結果、広告主の皆様にはご不便をおかけすることになります。 

現在流通しているデータセットの大半は、課金情報やオンライン行動の収集に基づいて構築されており、人口統計学的なプロファイルではありません。このようなデータセットには、年齢、収入、人種、民族など、リスト上の人々がどのような人々であるかという詳細な情報(ニールセンについて )がありません。このようなデータセットは、機械から機械への転送によって作成されるため、無駄や不正の可能性も高くなります。 

そのため、ある世帯に実際に誰が住んでいるのか、確実な情報は限られています。また、ある家庭の中で誰が特定の時間に特定の番組を見ているのかを語る能力もない。 

そのデータを他のソースと三角測量した場合でも、推定値に大きなギャップや誤差が生じることはほぼ確実です。しかし、このデータだけでは、測定に必要な正確性、客観性、透明性を提供することはできません。 

なぜそれが重要なのか

では、現実的にはどうなのでしょうか?それは、いくつかの意味があります。 

Comscoreの場合は、実際に10万人の実在の人物にマイクを取り付け、彼らが見ているものを正確に追跡するPersonal People Metersから移行しているのです。 

を、課金データを使って、ある時間にある住居の中で誰がある番組を見ているかを推測するモデルに置き換えると、誰が何を見ているかについての正確な読み取りができなくなります。 

しかし、もっと大きな意味を持つのは、このシフトによって、この国の真の姿をとらえることから、業界がさらに遠ざかってしまうことです。 

このようなデータセットの多くは、そこに住む人々が自分の家を持ち、長い間そこにいる場合に、その世帯に関するデータをより良く提供できることが分かっています。それは当然のことです。しかし、長く家を所有している人は、国民全体よりも白人で、裕福で、年齢が高い傾向があります。このようなデータセットでは、黒人や褐色人種、低所得者、若年層の数は、これらの層が減少するどころか増加している現在、意図的に少なくなっているのです。 

セットトップボックスのデータから構築されたデータセットにも同じことが言えます。このデータセットでは、ケーブルパッケージに高いお金を払うことを望むより裕福な消費者を過剰にカウントする傾向があり、多くのマーケティング担当者にとって重要なターゲットである低所得の消費者を不当に排除してしまうのです。 

メディア業界は、当然ながら、黒人や褐色人種のコミュニティを正確に表現することを最優先事項としてきました。Nielsenでは、数十年前からの実績は完璧ではありませんが、今日、私たちは最も正確で先進的な国のありのままの姿を見ることができます。 

代表的で、検証され、監査されたパネルに裏付けられていないビッグデータ由来の測定ツールは、そのような主張をすることはできません。ニールセンのパネルは、国勢調査の多くの人口統計を1%の変動率でターゲットにすることができますが、世の中にあるビッグデータに焦点を当てたオプションは、それに近いものではありません。業界は、ニールセンについて 、ビッグ・データが表現に関して提示する課題について、オープンで正直である必要があります。

より広い問題

はっきり言って、これはComscoreだけの問題ではありません。これは、現在あるすべてのビッグデータセットの問題なのです。 

2020年8月、ANAはMRCおよびSequent Partnersと共同で、メディアターゲティングにおいて多文化オーディエンスがどの程度正確に表現されているかを理解することを目的とした調査において、ニールセンのデータをベンチマークとして使用しました。この研究では、高品質のマーケティングとメディアデータの集合体を調べ、黒人、褐色人種、アジア人の視聴者をどれだけ正確にターゲットにしているかを理解しようとしました。この調査結果は厄介なものでしたが、私たちにとってはまったく驚くべきものではありませんでした。 

この調査では、業界が頼りにしているビッグデータセットが、これらの重要なコミュニティを正確にターゲットにするタスクに適していないことがわかりました。データセットが、堅牢なパネルのように、消費者の真の姿を示す豊富なデータ(ニールセンについて )を取得するように設計されていなかったこともあり、データには誤った表現や過少表現が横行していました。 

これに対し、ニールセンは、全米を代表する実在の人物から直接収集した豊富な情報を提供する、強力なパネルを有しています。その家庭には誰が住んでいるのか? その年齢層は?どのような人種や民族であるか?ある時点では誰がテレビを見ているのか?Nielsenのパネルがこれらの疑問に答えます。 

しかし、他の業界、つまり製薬会社が、医薬品の承認にパネルに似たアプローチをとっているのには理由があります。それは、利害関係が強い場合、実際に検証された人に代わるものはないからです。  

多くの業界関係者がビッグデータの可能性に期待していることは承知しています。ニールセンについて 私たちも同様です。しかし、業界として私たちは、ニールセンについて 、ビッグデータで解決できること、できないことを正直に言う必要があります。そして、メディア測定の未来は、ビッグデータのリーチと堅牢なパネルによる検証済みの個人データを組み合わせたアプローチであることを、私たちも理解しています。

この記事はNext TVに掲載されたものです。

同じトピックを見続ける