El algoritmo del buscador de Google.


Diseñar un buscador como Google supone abordar un problema de ingeniería matemática. De un modo simplificado la cuestión principal sería: ¿En qué orden deben mostrarse los resultados de un búsqueda? Un primer modelo se basaría en el supuesto de que la importancia de cierta página web guarda relación con la cantidad de páginas  que enlazan con ella. Sin embargo, podemos tener una página que, aunque no la enlacen muchas otras, las pocas que lo hagan sean muy importantes. Además, este método sería fácilmente manipulable.

En 1998, dos jóvenes estudiantes de informática de la Universidad californiana de Stanford, Larry Page y Sergey Brin, ultimaban los detalles de un proyecto de investigación bautizado con el nombre de "Anatomía de un buscador hipertextual a gran escala." En él se contenía la primera formulación de PageRank, un sencillo y elegante algoritmo encargado de jerarquizar las páginas de un listado cualquiera en función de su relevancia. PageRank se convertiría en la columna vertebral de un buscador que en pocos años desplazaría a Yahoo, Altavista y tantos otros en las preferencias de miles de millones de internautas. Google, PageRank es de una elegancia y simplicidad extremas, y su funcionamiento puede formularse tal como sigue:


  • PR(A) sería el valor de una página A.
  • PR(i), el de una página i que incluye un enlace a la página A.
  • d es un factor llamado "de ajuste", de valor comprendido entre 0 y 1, empleado para asegurar la convergencia de la serie. 
  • C(i), el número de enlaces de la página PR(i) hacia otras páginas.
  • n, el número total de páginas que incluyen un enlace a la página A.

La relevancia de una página cualquiera es el resultado de sumar la relevancia de todas las páginas que la citan, ponderadas por la cantidad total de enlaces de cada una.