
Últimamente, en los círculos mediáticos se ha generado mucho entusiasmo y expectación en torno al futuro de la medición y las promesas del big data. En Nielsen, hace tiempo que comprendemos el valor del big data; de hecho, el mes pasado anunciamos más detalles sobre cómo lo estamos incorporando a nuestro servicio nacional de medición de televisión.
También sabemos que ningún panel es perfecto, como han demostrado los últimos meses.
Pero cuando nuestros equipos de científicos de datos escuchan algunas de las grandes y amplias afirmaciones sobre que el big data vendrá a salvar el día y solucionará todos los retos percibidos en la industria, es difícil no ser escéptico.
Esto se debe a que, a pesar de su valor y su increíble potencial, los grandes conjuntos de datos a los que tiene acceso actualmente la industria tienen limitaciones muy reales.
Un ejemplo reciente relevante
Tras perder el acceso a los medidores portátiles de Nielsen, Comscore anunció que ahora utilizará conjuntos de datos de ConsumerView de Experian para identificar a los espectadores individuales con fines de medición. Su anuncio fue presentado en la prensa especializada como un avance; al fin y al cabo, si el big data es el futuro, cualquier cambio en esa dirección debe ser algo positivo.
Por desgracia para sus clientes y para los consumidores, ese no es el caso.
Existen varios proveedores de identidad externos que ofrecen la posibilidad de comparar conjuntos de datos basados en información de identificación personal y proporcionan características demográficas, tanto recopiladas directamente como modeladas.
En Nielsen, verificamos estos datos periódicamente. Lo hacemos midiendo directamente la información de nuestros sólidos paneles para validar la precisión de estos conjuntos de datos en 1) la correspondencia correcta con un hogar y 2) la comunicación precisa de datos demográficos y características.
Lo que solemos encontrar debería hacer reflexionar a los anunciantes.
La mayoría de los conjuntos de datos que existen hoy en día se basan en información de facturación o en la recopilación de comportamientos en línea, no en perfiles demográficos. No contienen detalles exhaustivos sobre quiénes son exactamente las personas que figuran en sus listas —desde la edad hasta los ingresos, pasando por la raza y el origen étnico— como ocurre con un panel sólido. Estos conjuntos de datos, al crearse mediante transferencias de máquina a máquina, también aumentan la posibilidad de desperdicio y fraude.
Por eso, el nivel de certeza que pueden ofrecer sobre quién vive realmente en un hogar determinado es limitado. Y no tienen capacidad para decir quién dentro de un hogar determinado está viendo un programa concreto en un momento específico.
Incluso cuando se triangulan esos datos con otras fuentes, es casi seguro que habrá grandes lagunas y errores en las estimaciones. Esto puede ser aceptable si el caso de uso es la segmentación, pero estos datos por sí solos no proporcionan la precisión, la objetividad y la transparencia necesarias para realizar mediciones.
Por qué es importante
¿Qué significa eso en la práctica? Bueno, tiene algunas implicaciones.
En el caso del cambio de Comscore, que ha dejado de utilizar nuestros medidores personales, que en realidad consisten en micrófonos que se colocan a unas 100 000 personas reales y verificadas para realizar un seguimiento exacto de lo que ven,
a un modelo que utiliza datos de facturación para proporcionar estimaciones aproximadas de quién dentro de una vivienda podría estar viendo un programa determinado en un momento dado, el resultado será una lectura menos precisa de quién está viendo qué.
Pero la consecuencia más importante es que este cambio alejará aún más a la industria de capturar una representación fiel del país.
Sabemos que muchos de estos tipos de conjuntos de datos proporcionan mejor información sobre los hogares cuando las personas que viven en ellos son propietarias de su vivienda y llevan mucho tiempo residiendo en ella. Y eso es lógico. El problema es que los propietarios de larga duración suelen ser más blancos, más ricos y significativamente mayores que la población general del país. Por su diseño, estos conjuntos de datos subestiman el número de personas negras y morenas, de personas con ingresos más bajos y de personas más jóvenes, en un momento en el que todos esos segmentos están creciendo, no disminuyendo.
Lo mismo ocurre con los conjuntos de datos creados a partir de los datos de los decodificadores, que tienden a sobrevalorar a los consumidores más acomodados que están dispuestos a pagar más por los paquetes de televisión por cable y, por lo tanto, excluyen de manera desproporcionada a los consumidores con ingresos más bajos, que son objetivos importantes para muchos profesionales del marketing.
La industria de los medios de comunicación ha convertido, con razón, la representación precisa de las comunidades negras y latinas en una prioridad fundamental. En Nielsen, nuestro historial en este ámbito, que se remonta a décadas atrás, no ha sido perfecto, pero hoy en día tenemos la visión más precisa y avanzada de la nación tal y como es en realidad.
Las herramientas de medición derivadas del big data que no están respaldadas por un panel representativo, validado y auditado no pueden hacer esa afirmación. Los paneles de Nielsen pueden dirigirse a muchos grupos demográficos dentro del censo con una variabilidad del 1 %, pero las opciones centradas en el big data que existen ni siquiera se acercan a eso. La industria debe ser abierta y honesta consigo misma sobre los retos que plantea el big data en lo que respecta a la representación.
Un problema más amplio
Para ser claros, esto no es solo un problema de Comscore. Es un problema que afecta a todos los grandes conjuntos de datos que existen actualmente.
En agosto de 2020, la ANA, en colaboración con el MRC y Sequent Partners, utilizó los datos de Nielsen como referencia en un estudio diseñado para comprender en qué medida las audiencias multiculturales estaban siendo representadas con precisión en la orientación de los medios de comunicación. El estudio analizó una recopilación agregada de datos de marketing y medios de comunicación de alta calidad y trató de comprender con qué precisión se estaba orientando a las audiencias negras, morenas y asiáticas. Los resultados fueron preocupantes, pero no nos sorprendieron en absoluto.
El estudio reveló que los grandes conjuntos de datos en los que se basa la industria no estaban a la altura de la tarea de dirigirse con precisión a estas comunidades críticas. En parte debido a que los conjuntos de datos no estaban diseñados para capturar datos detallados sobre quiénes son realmente estos consumidores, como lo hacen los paneles robustos, había una gran cantidad de datos erróneos y subrepresentados.
Ahora compárese eso con los sólidos paneles de Nielsen, que proporcionan una gran cantidad de información recopilada directamente de personas reales, representativas de toda la población estadounidense. ¿Quién vive en el hogar? ¿Qué edad tienen? ¿Con qué raza y etnia se identifican? ¿Quién está viendo la televisión en un momento dado? El panel de Nielsen responde a estas preguntas.
Una vez más, los paneles por sí solos no son perfectos, pero hay una razón por la que otras industrias, concretamente la farmacéutica, utilizan enfoques similares a los paneles para aprobar medicamentos. Esto se debe a que, cuando hay mucho en juego, no hay nada que pueda sustituir a personas reales y verificadas.
Sabemos que muchos actores del sector están entusiasmados con las promesas del big data, y nosotros también lo estamos. Pero como sector, debemos ser sinceros sobre lo que el big data puede y no puede resolver. Y también entendemos que el futuro de la medición de los medios de comunicación es un enfoque que combine el alcance del big data con los datos personales verificados de paneles sólidos.
Este artículo apareció originalmente en Next TV.



