Este artículo apareció por primera vez en The Conversation.
Tras el trágico tiroteo de la semana pasada en Bondi Beach, en las redes sociales han estado circulando teorías de conspiración y desinformación deliberada.
Una cosa a la que algunas personas se han aferrado es a la idea de que los datos de Google Trends muestran un aumento en las búsquedas de “Naveed Akram”, el nombre del sobreviviente del presunto atacante, en Tel Aviv (u otro lugar) antes de que ocurriera el tiroteo. En un sorprendente salto lateral, se reveló que Akram debía ser un agente israelí.
Conozca las novedades con la aplicación 7NEWS: Descárguela ahora
Una historia similar se desarrolló cuando el activista de derecha estadounidense Charlie Kirk fue asesinado en septiembre y después de un ataque contra un miembro de la Guardia Nacional estadounidense en noviembre.
Entonces, ¿qué está pasando aquí? Google dijo a ABC que Google Trends a veces puede mostrar búsquedas cuando en realidad no sucedió nada debido al “ruido estadístico”.
He estudiado exhaustivamente la mecánica de Google Trends en mi investigación y puedo confirmar que esto es cierto, y que el “ruido” puede generar resultados extraños, especialmente cuando se buscan términos inusuales o provienen de un área pequeña.
¿Cómo funciona Google Tendencias?
Google Trends muestra información sobre lo que buscan los usuarios en diferentes lugares y momentos. Los datos utilizados son lo que los estadísticos llaman “series temporales”, pero son inusuales en varios sentidos.
En primer lugar, puedes elegir fácilmente diferentes escalas de tiempo, como minutos a minutos y años.
El segundo es el hecho de que los datos son sólo una pequeña muestra del volumen verdaderamente gigantesco de búsquedas en Google. Las series temporales suelen contener todos los datos disponibles (como estas estadísticas sobre hospitalizaciones anuales).
La página de ayuda de Google Trends explica esto de la siguiente manera:
Aunque en Google Trends solo se utiliza una muestra de las búsquedas de Google, esto es suficiente porque realizamos miles de millones de búsquedas por día.
Ruido estadístico y búsqueda rara.
Sin embargo, mi investigación muestra que las consultas relacionadas con términos que no se buscan ampliamente (como “Naveed Akram” antes disparos) o en una zona geográfica pequeña (donde hay menos personas realizando búsquedas) puede mostrar una amplia variación en los resultados de una muestra a otra.
Muchas publicaciones engañosas en las redes sociales muestran resultados de tendencias de un área pequeña (como solo la ciudad de Tel Aviv), lo que provoca variaciones. La alta variación provoca un patrón muy diferente de valores cero o cercanos a cero con algunos picos grandes aislados, lo cual es muy evidente en la publicación a continuación.

Estos picos a menudo son causados por “ruido estadístico” en los datos: pequeñas fluctuaciones aleatorias que se suavizan cuando observamos una gran cantidad de eventos. Puedes ver esto claramente cuando lo comparas con búsquedas que tienen un gran volumen.
Cómo cambian los resultados de Google Trends con el tiempo
Otro concepto erróneo sobre los datos relacionados con el tiempo. Algunas publicaciones mencionan cómo los resultados mostrados parecen cambiar de una vista a la siguiente. De hecho, esto es lo que esperan los datos de Google Trends.
Esta es una combinación de la escala de tiempo utilizada y el hecho de que Google sólo utiliza la muestra de datos completa. Para obtener resultados precisos, debe agregar muchas muestras de datos de Google Trends.
Sin embargo, esto presenta un nuevo desafío. Para datos a corto plazo (como los utilizados en estas publicaciones de redes sociales), Google continúa actualizando los resultados en tiempo real. Para datos a largo plazo, Google solo agrega una muestra nueva por día (aunque hemos desarrollado un método para evitar esto).
Qué significan los números de Google Trends
Un tercer concepto erróneo es que el número que se muestra en el gráfico de Tendencias de Google es el número de búsquedas de un término en particular. Sin embargo, Google Trends explica útilmente que los valores se “normalizan según el tiempo y la ubicación” y luego se “escalan en un rango de 0 a 100”.
Esto significa que el punto temporal de la serie con el mayor número de búsquedas se establece en 100 y todos los demás puntos se escalan en relación con él. Entonces, si el número máximo de búsquedas es 10, aparecerá como 100, y si hay tres búsquedas al mismo tiempo, aparecerá como 30 (aunque Google no reduce las búsquedas de muy bajo volumen).


En cierto sentido, el número para cada momento representa la probabilidad de que se produzca una búsqueda que contenga el término especificado en ese lugar y en ese momento.
Entonces, una publicación sobre la tendencia de búsqueda del presunto asesino de Charlie Kirk afirma que hay “menos de 1 entre 1 MIL MILLONES de probabilidades de que suceda” no es cierta.
De hecho, es muy posible: si “Tyler James Robinson” (el presunto asesino de Charlie Kirk) tiene 30 búsquedas y “Lance Twiggs” (el socio de Robinson) tiene 40, se verá exactamente este patrón (si 40 se escala a 100; 30 se escala en consecuencia a 75).
El poder del sentido común
Incluso sin comprender toda esta información sobre los datos de Google Trends, algo de sentido común puede ayudar. Por ejemplo, hay muchas personas llamadas Naveed Akram, incluido un jugador de fútbol paquistaní llamado Muhammad Naveed Akram.
Es posible que se realicen algunas búsquedas de “Naveed Akram” incluso antes del 14 de diciembre, por lo que no es sorprendente. (Google Trends devuelve todas las búsquedas que contienen la consulta, por lo que “Naveed Akram” también devolverá “Muhammad Naveed Akram”).
Los datos de Google Trends pueden resultar muy útiles para comprender eventos en tiempo real. Por ejemplo, se ha utilizado para predecir -con un margen de error- los resultados de elecciones y referendos.
Sin embargo, para hacerlo bien y no perpetuar la ficción, debemos comprender los datos e interpretar los resultados correctamente. Y Google Trends ciertamente no dice nada sobre Naveed Akram y el ataque terrorista de Bondi.
Jacques Raubenheimer es investigador senior en bioestadística en la Universidad de Sydney.







