Lo que hay que saber: Las ventajas y desventajas del big data en la medición de audiencias | Nielsen Lo que hay que saber: Las ventajas y desventajas del big data en la medición de audiencias | Nielsen
02_Elements/Icons/ArrowLeft Volver a Insight

Información > Audiencias

Lo que hay que saber: las ventajas y desventajas del big data en la medición de audiencias

8 minutos de lectura

Última actualización:

El big data sigue acaparando titulares, pero ¿qué es exactamente y por qué es tanto una ventaja como un posible obstáculo para la medición precisa de la audiencia? Analizamos sus ventajas, sus inconvenientes y las formas de sacarle partido.  

¿Qué es el big data?

En el mundo de los medios lineales, el big data suele referirse a dos tipos de flujos de datos producidos por los mismos sistemas que distribuyen la programación a los usuarios finales: los datos de retorno (RPD) de los decodificadores de cable o satélite (como Dish o DirecTV) y el reconocimiento automático de contenidos (ACR) de los televisores inteligentes conectados a Internet (como Samsung o Vizio).

Datos ACR

En lugar de registrar los cambios de canal, la tecnología ACR supervisa las imágenes que aparecen en la pantalla del televisor. Las imágenes actúan como huellas dactilares, que se comparan con una gran biblioteca de referencia para identificar qué programa o anuncio se está emitiendo realmente. Las imágenes se marcan con la hora para saber cuándo se está reproduciendo.

Datos RPD

Registra el canal al que está sintonizado el decodificador y la hora a la que se producen los cambios de canal. Esos datos pueden cotejarse con la programación televisiva para determinar qué programa se está emitiendo en ese momento concreto, y con los datos de los servidores publicitarios del proveedor o de sus socios para averiguar a qué publicidad está expuesto el hogar.

En ambos casos, los usuarios finales permiten la recopilación de datos en sus dispositivos. La cooperación es relativamente alta porque la recopilación de datos no solo impulsa la medición, sino también características muy deseadas, como las preferencias de los usuarios y las recomendaciones de contenido. Un conjunto de datos RPD o ACR puede abarcar más de 30 millones de dispositivos.

¿Por qué es tan importante el big data?

Hubo un tiempo en el que la gente solo podía elegir entre unos pocos canales. Unaaudiencia1 superior a 60 (como la del final de M*A*S*H en 1983) o incluso a 40 (como la del final de Seinfeld en 1998) es inconcebible hoy en día para una serie con guion. Vivimos en un mundo mucho más fragmentado, con una lista muy larga de opciones de programación.

Esto es fantástico para los telespectadores, pero complica las cosas para las investigaciones basadas en paneles: en un panel nacional con 101 000 personas, un programa de televisión con una audiencia del 0,2 será visto por 80 hogares, y quizá solo uno en el área metropolitana de Atlanta o Dallas. Con decenas de millones de dispositivos bajo medición, el big data permite a las empresas de investigación informar sobre el uso de la televisión a un nivel mucho más detallado, proporcionando cobertura a muchos más programas con audiencias pequeñas y a menudo diversas. Pero, por sí solo, el big data nunca se diseñó para ser utilizado en la medición de audiencias.

Desafío n.º 1: los macrodatos no son representativos

Para realizar transacciones con confianza, los compradores y vendedores de medios necesitan una solución de medición que refleje la población en toda su diversidad: todos los grupos de edad, razas, etnias y muchas otras características demográficas y de comportamiento clave deben estar presentes y ser proporcionales en los datos subyacentes.

Pero el tamaño no garantiza la representatividad. Al analizar los recuentos instalados en el panel nacional de televisión de Nielsen, hemos descubierto que los hogares con RPD son desproporcionadamente más antiguos y menos diversos racialmente que la población general. Los hogares hispanos, por ejemplo, están infrarrepresentados en aproximadamente un 30 %, y los jefes de familia menores de 25 años están casi totalmente ausentes de los conjuntos de datos de RPD. Por otro lado, los conjuntos de datos ACR se inclinan hacia edades más jóvenes que la población general y también tienen más miembros por hogar. El uso de la ponderación estadística en los macrodatos puede ocultar el problema, pero no puede compensar los comportamientos de visualización únicos y ausentes de las audiencias infrarrepresentadas.

Para empeorar las cosas, una solución de medición que se base exclusivamente en datos de RPD y ACR pasaría por alto los hogaresque solo reciben señales por aire2 y por streaming, que constituyen una parte cada vez mayor del mercado.

Reto n.º 2: es posible que los macrodatos no recojan todo el comportamiento de visualización.

Aunque incluyeran hogares representativos, los conjuntos de datos RPD y ACR no recogen los datos de visualización de todos los decodificadores instalados en el hogar ni de otros televisores que no sean inteligentes. Esos televisores adicionales pueden reproducir programas diferentes para diferentes miembros de la familia (como programas de cocina en la cocina o programas infantiles en la sala de juegos), por lo que no solo los hogares de big data no son representativos de la población, sino que el big data en sí mismo no es representativo de todo el visionado que puede estar ocurriendo en esos hogares.

Un problema frustrante para las empresas de investigación que dependen del RPD es que el decodificador suele permanecer encendido cuando se apaga el televisor al que está conectado. Esa sintonización «fantasma» puede exagerar el visionado real entre un 145 % y un 260 %, dependiendo del proveedor. Existen modelos que pueden implementarse para compensarlo, pero sin un punto de referencia, como un panel informado por el visionado real, puede resultar difícil desarrollar la heurística adecuada.

ACR tampoco es inmune a los problemas de calidad de los datos. Algunas aplicaciones de streaming para televisores inteligentes bloquean ACR para que no capture el contenido que aparece en pantalla mientras se utiliza la aplicación. Puede parecer que el televisor está apagado, cuando en realidad el contenido ha sido bloqueado por una aplicación. Además, la mayoría de los proveedores solo supervisan una pequeña parte de toda la programación disponible. En un análisis reciente, descubrimos que los proveedores de ACR solo supervisan actualmente el 31 % de todas las emisoras disponibles, y que el 23 % de los minutos grabados siguen procediendo de emisoras que no se supervisan. Al no haber huellas digitales de referencia con las que comparar, esos visionados no se registran.

Reto n.º 3: Los macrodatos no incluyen datos demográficos sobre los espectadores.

Los proveedores de RPD y ACR recopilan datos de sintonización de millones de dispositivos, pero no saben quién está viendo los contenidos, que es lo que los anunciantes realmente quieren saber.

Una forma de compensar esa deficiencia es asociarse con proveedores demográficos externos. Esas empresas mantienen un registro de la composición demográfica de todos los hogares del país, y una empresa de investigación podría intentar modelar quién ve qué simplemente a partir de la suma total de los datos de sintonización de un hogar determinado y la composición demográfica de ese hogar.

¿Un programa infantil? Debe ser de un niño de la casa. ¿Un combate de lucha libre? Debe ser de un espectador masculino. Sin un punto de referencia de la vida real que ayude al algoritmo de aprendizaje automático, es fácil ver dónde puede fallar este tipo de modelado. Como era de esperar, su fiabilidad disminuye progresivamente con el tamaño del hogar, lo que acaba perjudicando la precisión de los datos para las familias más numerosas, como las que tienen hijos, espectadores no blancos y más jóvenes. 

El valor persistente de los datos de panel 

Para las marcas y las empresas de medios de comunicación que buscan una solución estable y fiable para medir la audiencia, los retos descritos anteriormente son insuperables. Los datos de panel son fundamentales para superar esas limitaciones.

En Nielsen, cuando analizamos los datos RPD o ACR, podemos identificar qué hogares y dispositivos forman parte de nuestros paneles y comparar los datos de sintonización de esos hogares con el comportamiento de visualización capturado por nuestros medidores. Al utilizar nuestros paneles como fuente de información veraz en esos hogares, podemos identificar dónde se desvían los macrodatos de la realidad y desarrollar modelos sólidos para ajustar esas anomalías.

Por ejemplo, hemos desarrollado una metodología para determinar la ubicación de un dispositivo dentro de una vivienda y asociar sus datos de sintonización a espectadores específicos. Otro modelo nos ayuda a determinar si un televisor está apagado mientras el decodificador está encendido. Otro modelo más puede clasificar las actualizaciones de dispositivos que se registran como sintonizaciones adicionales, así como las situaciones en las que un dispositivo devuelve más de un evento de sintonización al mismo tiempo.

Las personas, no los dispositivos

En última instancia, la investigación de audiencias se centra en las personas, no en los dispositivos.

No hay duda de que el big data es una gran incorporación al arsenal de los investigadores de medios. Abre la puerta a informes más detallados de lo que jamás había sido posible en el pasado. Pero es intrínsecamente defectuoso, sesgado y, lo que es más importante, miope: captura datos de sintonización, no datos de visualización.

Para alcanzar su máximo potencial, es necesario limpiarlo, completarlo, calibrarlo y enriquecerlo con datos demográficos relevantes. Ahí es donde entran en juego los datos de panel. El aprendizaje automático funciona mejor con datos de entrenamiento y validación sólidos, y no hay mejores datos de entrenamiento en el sector que los datos de panel representativos a nivel nacional que constituyen el núcleo del negocio actual de la investigación de medios.

Lo que hay que saber sobre Nielsen Need to Know revisa los fundamentos de la medición de audiencias y desmitifica los temas más candentes de la industria de los medios de comunicación. Lea todos los artículos aquí.

Nota

 1 La audiencia doméstica es el porcentaje de hogares de un país que sintonizan un programa determinado.
2 Programación disponible a través de una «señal» procedente de una antena. Las emisiones por aire (OTA) fueron el primer tipo de televisión disponible.

Seguir navegando por perspectivas similares

Nuestros productos pueden ayudarle a usted y a su empresa

  • Anuncio Intel

    Diferencie su marca de la competencia con inteligencia publicitaria en todos los canales y plataformas,...

  • Anuncio Intel

    Diferencie su marca de la competencia con inteligencia publicitaria en todos los canales y plataformas,...

  • Audiencias avanzadas

    Integre sin problemas audiencias propias y de terceros en sus planes de medios y estrategias de medición con...