Si no está en Google no existe: ¿cómo hemos llegado a esto?

(Por Borja Sanz Urquijo, Universidad de Deusto) Cuando inicié mis cursos del programa de doctorado, uno de nuestros profesores, de una universidad griega, habló sobre la interesante investigación que habían realizado dos estudiantes de la Universidad de Standford. Esos estudiantes, Larry Page y Sergei Brin, acababan de sentar las bases para fundar el motor de búsqueda que es hoy el emperador absoluto del reino de Internet.

En ese momento había desarrollos mucho mejores en la literatura científica para crear algoritmos de buscadores de contenido online, diversas propuestas para ordenar y poder encontrar la aguja en el pajar de la recién nacida World Wide Web, pero solo uno, Google, ha acabado dominando el mundo.

Larry Page y Sergey Brin, fundadores de Google, en septiembre de 2003. Wikimedia Commons / Ehud Kenan, CC BY

Poner orden a la Web

En 1999, Larry y Sergei, en colaboración con otros dos investigadores, publicaron un artículo que forma parte de la historia de la tecnología:The PageRank Citation Ranking: Bringing Order to the Web. En ese artículo describían PageRank, un método para calificar páginas web de manera objetiva y mecánica, atendiendo con eficacia el interés humano y la atención que dedica.

Su propuesta era una forma novedosa de ordenar la información. Esencialmente, esa es la base del trabajo de un buscador: recorrer todas las páginas web para recopilar la información existente; modelarla y, finalmente, mostrarnos los enlaces a las páginas que más se acercan a nuestra consulta. Pero PageRank incluyó un elemento clave, diferente del resto de motores de búsqueda en desarrollo, y que le situó primero en la carrera.

La clave: las fuentes de enlace de las páginas

La novedad de PageRank es el modo en que ordena, cómo elige lo primero que ofrece. El algoritmo pondera en la puntuación la importancia de las fuentes que enlazan cada página. Esto fue entonces, en la primera década del siglo, un ¡Eureka!, una idea clave que prendió el motor de la máquina Google.

Por ejemplo, si la página contiene información sobre universidades, será más importante si otra universidad, como puede ser www.deusto.es, la enlaza desde su web que si la enlaza un taller de mecánica. Pero si la información es sobre mecánica, mejor si la enlazan los talleres (y cuantos más mejor).

Hasta entonces, la labor de ordenar y priorizar tanta información requería una gran cantidad de tiempo y recursos informáticos. Google abarató tanto estos costes y consiguió tanta eficacia en el proceso, que las empresas lo acogieron con alfombra roja.

Portada del prototipo de Google el 11 de noviembre de 1998, cuando el buscador todavía estaba alojado en la web de la Universidad de Stanford. Archive.org

El empuje de Google a las grandes empresas tecnológicas

En su libro Gracias por llegar tarde…, el periodista Thomas L. Friedman destaca dos artículos científicos que analizan cómo el desarrollo logrado por Google fue la base que permitió el despegue de varias de las empresas tecnológicas punteras que hoy dirigen los más ricos del mundo.

Los científicos destacaban que Google permitía procesar grandes cantidades de datos en varios ordenadores de forma simultánea(MapReduce: Simplified Data Processing on Large Clusters y que los ficheros, pese a estar dispersos en muchos servidores distintos, se podían ver como si estuvieran en un único ordenador. ¿Qué significa esto? Significa hipereficacia y ahorro, un cambio transformador en la forma de trabajar con grandes volúmenes de información.

Primer servidor de Google, en el Computer History Museum, Mountain View, California. Wikimedia Commons / Samm, CC BY-SA

La revolución que supuso Google: ordenar la información del mundo

En la era pre-Google, la tendencia era procesar la información en grandes servidores, que alcanzaban su límite rápidamente. Por muy grande que fuera un procesador, en un momento dado se colmaba. Google, en cambio, es virtualmente infinito. Permite ordenar y almacenar información en ordenadores corrientes conectados a la red, que funciona como un único ordenador. Este fue un ¡Eureka! más, el que conquistó a las empresas nativas de internet y las catapultó con un ambicioso objetivo: “organizar la información del mundo y hacerla accesible y útil para todos los usuarios”.

Paso a paso, empresa a empresa, usuario a usuario, todos fueron eligiendo Google.

Y llegó el dinero a raudales

El negocio despegó definitivamente cuando Google encontró una forma de monetizar toda la información almacenada a través de los anuncios. Pese a que no era su idea inicial, dado el crecimiento que estaban viviendo y la necesidad de financiación, en el año 2000 crearon Google Adwords, ahora Google Ads.

Esta plataforma permite, a través de un sistema de subastas en tiempo real, mostrar publicidad personalizada a cada usuario en función de la información que se tiene sobre él. El sistema, entre otras acciones, ha hecho que si Google fuera un estado tendría más dinero que cuarenta países africanos juntos.

La cara oscura de tanto poder

Pero la máquina presenta problemas. Para ser lo más efectiva posible, el seguimiento de las acciones que realiza el usuario tiene que ser muy alto, y esto mina un derecho fundamental, la privacidad (aunque Google argumenta que los datos no salen de la empresa).

Google, además, es juez y parte en toda la cadena. Tiene en sus manos el sistema operativo móvil más utilizado del mundo (Android), el navegador web más usado, una gran red de anunciantes y la llave de la puerta de entrada a internet: el buscador.

Hoy el debate no se centra solo en lo que Google supone como algoritmo, en cuanto a optimización del rendimiento y eficacia. También en la ética y los derechos fundamentales.

Portada del buscador Google el 1 de septiembre de 2022.

Si no está en Google, no existe

El buscador ofrece a priori los resultados que encajan mejor con las expectativas de los usuarios, pero no tienen que ser objetivamente mejores que las que no aparecen en Google. Así, la única información que cuenta es la que el buscador ha elegido. El resto, no existe.

Google está en el centro de la explosión del proceso de captura de información, atrae a los mejores profesionales de distintos ámbitos, no sólo tecnológicos. El usuario se ha acostumbrado a los resultados que da Google y no busca más. Si algo no está en Google, definitivamente no existe, o no importa si existe.

Como decía mi profesor de doctorado, había propuestas mucho mejores en la literatura científica para crear algoritmos de buscadores. Sin embargo, Google ha ganado con distancia la carrera del siglo.

Borja Sanz Urquijo, Profesor Universitario asistente especializado en ciberseguridad e inteligencia artificial., Universidad de Deusto

Este artículo fue publicado originalmente en The Conversation. Lea el original.