
Las ventajas del avance tecnológico parecen infinitas. Podemos comprobar la seguridad de nuestros hogares desde nuestros teléfonos, recibir entregas de comestibles mediante drones e incluso conducir coches que pueden aparcar en paralelo por nosotros. Nuestros televisores están avanzando al mismo ritmo, ofreciendo opciones de contenido aparentemente infinitas en un panorama cada vez más amplio de plataformas y canales. Sin embargo, a pesar de las muchas puertas que los televisores inteligentes abrirán en los próximos años, por sí solos no podrán proporcionar a la industria de los medios de comunicación una visión precisa de quién los utiliza.
Los televisores inteligentes han invadido la sección de televisores de las grandes superficies. Hoy en día, es difícil encontrar en una tienda un televisor que no tenga conexión a Internet. Y, al igual que todos los dispositivos conectados, los televisores inteligentes contribuyen a la creciente proliferación de datos generados por los usuarios: los datos de reconocimiento automático de contenidos (ACR) son la tecnología que utilizan los fabricantes de equipos originales para capturar la sintonización en los televisores inteligentes. Cuando se combinan con información que detalla el comportamiento representativo a nivel individual, estos conjuntos de datos suponen un avance significativo en la ciencia de la medición de audiencias.
Dada la amplia adopción de los televisores inteligentes y los datos que producen, no es de extrañar que numerosas empresas estén recurriendo a los datos ACR como forma de medir las audiencias. Desde una perspectiva puramente cuantitativa, la oportunidad es muy atractiva. Sin embargo, por muy lucrativa que sea la fuente de datos ACR, no es suficiente por sí sola para medir las audiencias, simplemente porque carece del aspecto más importante que existe en la medición de audiencias: las personas. Además de no ser representativos—ni siquiera saber si alguien está viendo realmente lo que aparece en la pantalla—, los datos ACR tienen un defecto crítico de validación: requieren que el fabricante del dispositivo compare la imagen de la pantalla con una imagen de referencia para determinar qué contenido se está mostrando. Por lo tanto, la mejor manera de aprovechar todo el potencial de los datos ACR es calibrarlos con datos que reflejen el comportamiento real de visualización a nivel individual.
Cuando funciona según lo previsto, la tecnología ACR supervisa las imágenes que se proyectan en la pantalla del televisor y las utiliza para deducir qué contenido se está mostrando. Las imágenes que proporciona ACR actúan en muchos sentidos como una huella digital del contenido. Pero después de recopilar las «huellas digitales», la tecnología necesita determinar en qué red o plataforma apareció la imagen, así como cuándo apareció. Para ello, la tecnología necesita comparar la imagen de la pantalla con una imagen contenida en una biblioteca de referencia mantenida por el fabricante.
Hay tres resultados posibles cuando la tecnología intenta realizar esa correspondencia:
- La imagen coincide con una sola entrada en la biblioteca de referencia.
- La imagen coincide con varias entradas de la biblioteca de referencia.
- No hay ninguna imagen coincidente en la biblioteca de referencia.

Para todas las partes implicadas, el primer resultado es el escenario ideal. El segundo escenario es menos ideal y conlleva cierto riesgo de desacreditación, simplemente debido a las diversas razones que explican las múltiples coincidencias (por ejemplo, emisiones en diferentes cadenas, repeticiones, emisiones simultáneas). En el tercer escenario, nadie obtiene crédito, lo que obviamente es el escenario menos deseable. La razón más común para este resultado es que el contenido se emite en una cadena que el OEM no supervisa.
Aunque la comparación de imágenes fuera una solución viable como medida independiente, nunca sería posible aprovecharla como tal. Como se puede imaginar, el coste de mantener una biblioteca con todos y cada uno de los fotogramas de todos los eventos televisados no es poca cosa. Además, se trata de una tarea que crecerá exponencialmente de forma perpetua. Tampoco existen períodos de retención estándar para las imágenes.
Entonces, ¿cómo sabemos que la tecnología ACR hará la combinación correcta? Sin un mecanismo que pueda llenar los vacíos, no lo sabemos. Es por eso que Nielsen ha invertido en marcas de agua, que son mucho más deterministas que las firmas, así como en copias de seguridad de firmas para cada fuente medida. Eso proporciona una representación de todo el contenido, llenando los vacíos asociados con el big data por sí mismo. Una vez rellenados estos huecos, el big data procedente de fuentes como ACR ofrece la ventaja de la escala en un panorama mediático cada vez más segmentado. Y cuando utilizamos controles de ponderación para calibrar el big data con datos de visualización a nivel individual, podemos ver puntos de comparación que, de otro modo, estarían en blanco.
En un estudio reciente, Nielsen trató de comprender en qué medida estas lagunas en la biblioteca de referencia afectan a los registros de sintonización ACR, que son la base de la medición basada en ACR. En un análisis de hogares comunes realizado en septiembre de 2021, analizamos los datos de nuestros dos socios proveedores de ACR para comprender en qué medida las lagunas en la biblioteca de referencia podrían influir en la medición. En nuestro estudio, examinamos tanto la concentración de fuentes de visualización como los minutos vistos de las fuentes disponibles.
En todas las fuentes de visualización, descubrimos que nuestros socios proveedores de ACR supervisan solo el 31 % de las emisoras disponibles. Eso significa que no mantienen datos en sus bibliotecas de referencia para el 69 % de las emisoras. Cuando analizamos los minutos vistos, descubrimos que el 23 % de los minutos procedían de emisoras que no se supervisan. Eso significa que las empresas que utilizan únicamente datos ACR para la medición estarían subestimando las impresiones a nivel doméstico en un 23 %.
A pesar de las limitaciones de los datos ACR por sí solos, entendemos la oportunidad de escala y alcance que ofrecen como fuente adicional de cobertura, similar a la de los datos de retorno (RPD) de los decodificadores, que nuestra estrategia de big data también calibra con datos de panel para abordar limitaciones comparables. Al integrar conjuntos de big data con nuestros datos de audiencia, que proporcionan una medición representativa del total de Estados Unidos, podemos aumentar significativamente el tamaño de nuestras muestras, al tiempo que aplicamos rigurosas metodologías de ciencia de datos para llenar los vacíos y garantizar una representación justa de la audiencia total de Estados Unidos en todas las redes y plataformas.
Una versión de este artículo apareció originalmente en AdExchanger.



