Lewati ke konten
Wawasan > TV & streaming

Masalah yang tidak begitu tersembunyi dengan kumpulan data besar

6 menit membaca | Molly Poppie, Ilmu Data SVP, Nielsen | Oktober 2021

Ada banyak energi dan kegembiraan di kalangan media akhir-akhir ini tentang masa depan pengukuran dan janji data besar. Di Nielsen, kami telah lama memahami nilai big data, bahkan baru bulan lalu kami mengumumkan detail tambahan seputar bagaimana kami menambahkannya ke layanan pengukuran TV nasional kami. 

Kami juga tahu bahwa tidak ada panel yang sempurna, seperti yang telah ditunjukkan oleh beberapa bulan terakhir. 

Tetapi ketika tim ilmuwan data kami mendengar beberapa klaim besar dan luas tentang data besar yang datang untuk menyelamatkan hari dan memperbaiki semua tantangan yang dirasakan di industri ini, sulit untuk tidak skeptis.

Itu karena, untuk semua nilai dan potensi luar biasa, kumpulan data besar yang saat ini dapat diakses oleh industri memiliki keterbatasan yang sangat nyata

Contoh terbaru yang relevan

Setelah kehilangan akses ke Portable People Meters Nielsen, Comscore melaporkan bahwa sekarang akan menggunakan kumpulan data dari ConsumerView Experian untuk membantu mereka mengidentifikasi pemirsa individu untuk tujuan pengukuran. Pengumuman mereka dibingkai dalam pers perdagangan sebagai kemajuan – lagipula, jika big data adalah masa depan, setiap pergeseran ke arah itu pasti merupakan hal yang baik. 

Sayangnya untuk pelanggan mereka, dan untuk konsumen, itu tidak terjadi. 

Ada beberapa vendor identitas pihak ketiga di luar sana yang menyediakan kemampuan untuk mencocokkan kumpulan data berdasarkan informasi yang dapat diidentifikasi secara pribadi dan memberikan karakteristik demografis, baik yang dikumpulkan maupun dimodelkan secara langsung. 

Di Nielsen, kami secara teratur memeriksa data ini. Kami melakukannya dengan secara langsung mengukur informasi dari panel kami yang kuat untuk memvalidasi seberapa akurat kumpulan data ini dalam 1) pencocokan yang benar dengan rumah tangga dan 2) melaporkan demografi dan karakteristik secara akurat. 

Apa yang biasanya kami temukan harus memberi pengiklan jeda. 

Sebagian besar kumpulan data yang ada saat ini dibangun di sekitar informasi penagihan atau pengumpulan perilaku online, bukan profil demografis. Mereka tidak memiliki detail yang kaya tentang siapa sebenarnya orang-orang dalam daftar mereka—dari usia, pendapatan, ras dan etnis—seperti yang Anda lakukan dengan panel yang kuat. Kumpulan data ini, karena dibuat oleh transfer mesin-ke-mesin, juga meningkatkan kemungkinan pemborosan dan penipuan. 

Karena itu, tingkat kepastian yang dapat mereka berikan kepada siapa yang benar-benar tinggal di rumah tangga tertentu terbatas. Dan mereka tidak memiliki kemampuan untuk mengatakan siapa di dalam rumah tertentu yang menonton program tertentu pada waktu tertentu. 

Bahkan ketika Anda melakukan triangulasi data itu dengan sumber lain, Anda hampir dijamin memiliki kesenjangan dan kesalahan besar dalam perkiraan Anda. Ini mungkin dapat diterima jika kasus penggunaan menargetkan, tetapi data ini sendiri tidak memberikan akurasi, objektivitas, dan transparansi yang diperlukan untuk memberikan pengukuran. 

Mengapa itu penting

Jadi apa artinya itu secara praktis? Yah, itu memiliki beberapa implikasi. 

Dalam kasus pergeseran Comscore dari Personal People Meters kami, yang sebenarnya membubuhkan mikrofon ke ~ 100,000 kehidupan nyata, memverifikasi orang dan melacak dengan tepat apa yang mereka tonton, 

untuk model yang menggunakan data penagihan untuk memberikan tebakan tentang siapa dalam tempat tinggal yang mungkin menonton program tertentu pada waktu tertentu, hasilnya akan menjadi pembacaan yang kurang akurat tentang siapa yang menonton apa. 

Tetapi implikasi yang mungkin lebih besar adalah bahwa pergeseran ini akan membuat industri lebih jauh dari menangkap representasi negara yang sebenarnya. 

Kita tahu bahwa banyak dari jenis kumpulan data ini melakukan pekerjaan yang lebih baik dalam menyediakan data di sekitar rumah tangga ketika orang-orang yang tinggal di sana memiliki rumah mereka sendiri dan telah berada di sana untuk waktu yang lama. Dan itu masuk akal. Masalahnya adalah bahwa pemilik rumah lama cenderung lebih berkulit putih, lebih makmur dan secara signifikan lebih tua daripada bangsa secara keseluruhan. Dengan desain kumpulan data ini mengurangi jumlah orang kulit hitam dan coklat, orang-orang berpenghasilan rendah dan orang-orang yang lebih muda, pada saat semua segmen itu tumbuh, tidak menyusut. 

Hal yang sama berlaku untuk kumpulan data yang dibangun dari data set top box, yang cenderung menghitung lebih banyak konsumen kaya yang bersedia membayar lebih untuk paket kabel dan dengan demikian secara tidak proporsional mengecualikan konsumen berpenghasilan rendah yang merupakan target penting bagi banyak pemasar. 

Industri media, memang benar, telah menjadikan secara akurat mewakili komunitas Kulit Hitam dan Coklat sebagai prioritas utama. Di Nielsen rekam jejak kami dalam beberapa dekade terakhir ini belum sempurna, tetapi hari ini kami memiliki pandangan bangsa yang paling akurat dan maju sebagaimana adanya. 

Alat pengukuran yang diturunkan dari big data yang tidak didukung oleh panel yang representatif, divalidasi, dan diaudit tidak dapat membuat klaim tersebut. Panel Nielsen dapat menargetkan banyak demografi dalam sensus dengan variabilitas 1%, tetapi opsi yang berfokus pada data besar di luar sana bahkan tidak mendekati itu. Industri harus terbuka dan jujur dengan dirinya sendiri tentang tantangan yang dihadirkan oleh data besar dalam hal representasi.

Masalah yang lebih luas

Untuk lebih jelasnya, ini bukan hanya masalah Comscore. Ini adalah masalah dengan semua data besar yang ditetapkan di sana saat ini. 

Pada bulan Agustus 2020 ANA, dalam kemitraan dengan MRC dan Sequent Partners, menggunakan data Nielsen sebagai tolok ukur dalam sebuah studi yang dirancang untuk memahami sejauh mana audiens multikultural diwakili secara akurat dalam penargetan media. Studi ini melihat kumpulan agregat data pemasaran dan media berkualitas tinggi dan berusaha memahami seberapa akurat data tersebut menargetkan audiens kulit hitam, coklat, dan Asia. Temuan itu meresahkan, tetapi sama sekali tidak mengejutkan bagi kami. 

Studi ini menemukan bahwa kumpulan data besar yang diandalkan industri tidak memenuhi tugas untuk menargetkan komunitas kritis ini secara akurat. Sebagian karena kumpulan data tidak dirancang untuk menangkap data yang kaya tentang siapa konsumen ini sebenarnya, seperti panel yang kuat, ada kesalahan representasi yang merajalela dan kurang terwakili dalam data. 

Sekarang bandingkan dengan panel kuat Nielsen, yang memberikan banyak informasi yang dikumpulkan secara langsung dari orang-orang di kehidupan nyata, perwakilan dari seluruh populasi AS. Siapa yang tinggal di rumah?  Berapa umur mereka? Sebagai apa ras dan etnis yang mereka identifikasi? Siapa yang menonton televisi pada titik waktu tertentu? Panel Nielsen menjawab pertanyaan-pertanyaan ini. 

Sekali lagi, panel sendiri tidak sempurna, tetapi ada alasan industri lain, yaitu farmasi, menggunakan pendekatan yang mirip dengan panel dalam menyetujui obat-obatan. Itu karena, ketika taruhannya tinggi, tidak ada pengganti untuk orang-orang yang nyata dan terverifikasi.  

Kami tahu bahwa banyak pelaku industri yang senang dengan janji big data, kami juga. Tetapi sebagai industri kita harus jujur tentang untuk apa data besar dapat dan tidak dapat diselesaikan. Dan kami juga memahami bahwa masa depan pengukuran media adalah pendekatan yang menggabungkan jangkauan data besar dengan data pribadi terverifikasi dari panel yang kuat.

Artikel ini awalnya muncul di Next TV.

Lanjutkan menjelajahi wawasan topik yang sama