fbpx
Wikipedia

PageRank

PageRank es una marca registrada, creada y desarrollada [1]​ por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. El primer documento sobre el proyecto, que describe el PageRank y el prototipo inicial del motor de búsqueda de Google, se publicó en 1998. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de Google, Larry Page (apellido, del cual, recibe el nombre este algoritmo) en la Universidad de Stanford mientras estudiaba el posgrado en ciencias de la computación.

Google ordena los resultados de la búsqueda utilizando su propio algoritmo PageRank. A cada página web se le asigna un número en función del número de enlaces de otras páginas que la apuntan, el valor de esas páginas y otros criterios no públicos.

PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas "importantes", es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas "importantes". Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.

Algoritmo

El algoritmo inicial del PageRank lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google: “The Anatomy of a Large-Scale Hypertextual Web Search Engine":[2]

 

Donde:

  •   es el PageRank de la página A.
  • d es un factor de amortiguación que tiene un valor entre 0 y 1.
  •   son los valores de PageRank que tienen cada una de las páginas i que enlazan a A.
  • C(i) es el número total de enlaces salientes de la página i (sean o no hacia A).

Algunos expertos aseguran que el valor de la variable d suele ser 0,85. Representa la probabilidad de que un navegante continúe pulsando links al navegar por Internet en vez de escribir una url directamente en la barra de direcciones o pulsar uno de sus marcadores y es un valor establecido por Google. Por lo tanto, la probabilidad de que el usuario deje de pulsar links y navegue directamente a otra web aleatoria es 1-d.[3]​ La introducción del factor de amortiguación en la fórmula resta algo de peso a todas las páginas de Internet y consigue que las páginas que no tienen enlaces a ninguna otra página no salgan especialmente beneficiadas. Si un usuario aterriza en una página sin enlaces, lo que hará será navegar a cualquier otra página aleatoriamente, lo que equivale a suponer que una página sin enlaces salientes tiene enlaces a todas las páginas de Internet.

La calidad de la página y el número de posiciones que ascienda se determina por una "votación" entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página. Un hiperenlace a una página cuenta como un voto de apoyo. El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan. Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto. Si no hay enlaces a una página web, no hay apoyo a esa página específica. El PageRank de la barra de Google va de 0 a 10. Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación, 1 es la calificación mínima que recibe un sitio normal, y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank. Parece ser una escala logarítmica. Los detalles exactos de esta escala son desconocidos. En los últimos tiempos Google está tratando de mantener un poco "privado" su PageRank para evitar manipulaciones, pero existen sitios donde se puede comprobar el PageRank.[4]

Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg, es el algoritmo HITS.

Manipulación

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han diseñado métodos para manipular artificialmente el PageRank de una página. Entre estos métodos hay que destacar el spam, consistente en añadir enlaces a una cierta página web en lugares como blogs, libros de visitas, foros de Internet, etc. con la intención de incrementar el número de enlaces que apuntan a la página.

A principios del 2005 Google implementó un nuevo atributo para hiperenlaces rel="nofollow" como un intento de luchar contra el spam. De esta forma cuando se calcula el peso de una página, no se tienen en cuenta los links que tengan este atributo.

Antecedentes

PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto para la Información Científica (ISI) en los Estados Unidos durante la década del 50. El SCI pretende resolver la asignación objetiva de méritos científicos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos científicos) es más alto, colaboran en mayor medida con el desarrollo de su área de investigación. El índice de citación es un elemento determinante para seleccionar qué investigadores reciben becas y recursos de investigación.

Últimas actualizaciones del PageRank

Las actualizaciones del PageRank tenía lugar algunas veces al año, y tardan varios días en completarse. Aquí se pueden ver las fechas de actualizaciones del Pagerank.[5]

  • 1.ª semana de diciembre del 2013
  • 1.ª semana de noviembre de 2012
  • 1.ª semana de agosto de 2012
  • 1.ª semana de mayo de 2012
  • 1.ª semana de febrero de 2012
  • 2.ª semana de noviembre de 2011
  • 4.ª semana de junio de 2011
  • 3.ª semana de enero de 2011[6]
  • 1.ª semana de abril de 2010
  • 4.ª semana de diciembre de 2009
  • 4.ª semana de octubre de 2009
  • 4.ª semana de mayo de 2009
  • 4.ª semana de marzo de 2009
  • 4.ª semana de diciembre de 2008
  • 3.ª semana de octubre de 2008
  • 4.ª semana de julio de 2008
  • 4.ª semana de mayo de 2008
  • 2.ª semana de marzo de 2008
  • 2.ª semana de enero de 2008
  • 4.ª semana de octubre de 2007
  • 4.ª semana de abril de 2007
  • 3.ª semana de enero de 2007
  • 2.ª semana de octubre de 2006
  • 2.ª semana de julio de 2006

Actualmente, lleva sin actualizarse desde 2013.[7]

Véase también

Bibliografía

  • Langville, Amy N.; Meyer, Carl D. (2006). Google's PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press. ISBN 0-691-12202-4. 
  • Page, Lawrence; Brin, Sergey; Motwani, Rajeev y Winograd, Terry (1999). The PageRank citation ranking: Bringing order to the Web. 
  • Richardson, Matthew; Domingos, Pedro (2002). «The intelligent surfer: Probabilistic combination of link and content information in PageRank». Proceedings of Advances in Neural Information Processing Systems 14. 
  • Cheng, Alice; Friedman, Eric J. «Manipulability of PageRank under Sybil Strategies». Proceedings of the First Workshop on the Economics of Networked Systems (NetEcon06). 
  • Altman, Alon; Tennenholtz, Moshe. . Proceedings of the 6th ACM conference on Electronic commerce (EC-05). Archivado desde el original el 30 de mayo de 2008. 

Referencias

  1. «Google». www.google.com. Consultado el 18 de julio de 2021. 
  2. "The Anatomy of a Large-Scale Hypertextual Web Search Engine" (en inglés)
  3. Sergey Brin y Lawrence Page (1998). «The anatomy of a large-scale hypertextual Web search engine (Sección 2.1.1 Description of PageRank Calculation)». p. 107-117. 
  4. Comprobar el PageRank
  5. Page-Rank.es. «Historial de actualización de PageRank». 
  6. Barry Schwartz. «First Google Toolbar PageRank Update Of 2011». 
  7. Last PageRank update

Enlaces externos

  • Method for node ranking in a linked database: la patente originaria de PageRank.
  • The Anatomy of a Large-Scale Hypertextual Web Search Engine: el prototipo de Google
  •   Datos: Q184316
  •   Multimedia: PageRank

pagerank, marca, registrada, creada, desarrollada, google, enero, 1999, ampara, familia, algoritmos, utilizados, para, asignar, forma, numérica, relevancia, documentos, páginas, indexados, motor, búsqueda, primer, documento, sobre, proyecto, describe, prototip. PageRank es una marca registrada creada y desarrollada 1 por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numerica la relevancia de los documentos o paginas web indexados por un motor de busqueda El primer documento sobre el proyecto que describe el PageRank y el prototipo inicial del motor de busqueda de Google se publico en 1998 Sus propiedades son muy discutidas por los expertos en optimizacion de motores de busqueda El sistema PageRank es utilizado por el popular motor de busqueda Google para ayudarle a determinar la importancia o relevancia de una pagina Fue desarrollado por los fundadores de Google Larry Page apellido del cual recibe el nombre este algoritmo en la Universidad de Stanford mientras estudiaba el posgrado en ciencias de la computacion Google ordena los resultados de la busqueda utilizando su propio algoritmo PageRank A cada pagina web se le asigna un numero en funcion del numero de enlaces de otras paginas que la apuntan el valor de esas paginas y otros criterios no publicos PageRank confia en la naturaleza democratica de la web utilizando su vasta estructura de enlaces como un indicador del valor de una pagina en concreto Google interpreta un enlace de una pagina A a una pagina B como un voto de la pagina A para la pagina B Pero Google mira mas alla del volumen de votos o enlaces que una pagina recibe tambien analiza la pagina que emite el voto Los votos emitidos por las paginas consideradas importantes es decir con un PageRank elevado valen mas y ayudan a hacer a otras paginas importantes Por lo tanto el PageRank de una pagina refleja la importancia de la misma en Internet Indice 1 Algoritmo 1 1 Manipulacion 2 Antecedentes 3 Ultimas actualizaciones del PageRank 4 Vease tambien 5 Bibliografia 6 Referencias 7 Enlaces externosAlgoritmo EditarEl algoritmo inicial del PageRank lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google The Anatomy of a Large Scale Hypertextual Web Search Engine 2 P R A 1 d d i 1 n P R i C i displaystyle rm PR A 1 d d sum i 1 n rm PR i over C i Donde P R A displaystyle rm PR A es el PageRank de la pagina A d es un factor de amortiguacion que tiene un valor entre 0 y 1 P R i displaystyle rm PR i son los valores de PageRank que tienen cada una de las paginas i que enlazan a A C i es el numero total de enlaces salientes de la pagina i sean o no hacia A Algunos expertos aseguran que el valor de la variable d suele ser 0 85 Representa la probabilidad de que un navegante continue pulsando links al navegar por Internet en vez de escribir una url directamente en la barra de direcciones o pulsar uno de sus marcadores y es un valor establecido por Google Por lo tanto la probabilidad de que el usuario deje de pulsar links y navegue directamente a otra web aleatoria es 1 d 3 La introduccion del factor de amortiguacion en la formula resta algo de peso a todas las paginas de Internet y consigue que las paginas que no tienen enlaces a ninguna otra pagina no salgan especialmente beneficiadas Si un usuario aterriza en una pagina sin enlaces lo que hara sera navegar a cualquier otra pagina aleatoriamente lo que equivale a suponer que una pagina sin enlaces salientes tiene enlaces a todas las paginas de Internet La calidad de la pagina y el numero de posiciones que ascienda se determina por una votacion entre todas las demas paginas de la World Wide Web acerca del nivel de importancia que tiene esa pagina Un hiperenlace a una pagina cuenta como un voto de apoyo El PageRank de una pagina se define recursivamente y depende del numero y PageRank de todas las paginas que la enlazan Una pagina que esta enlazada por muchas paginas con un PageRank alto consigue tambien un PageRank alto Si no hay enlaces a una pagina web no hay apoyo a esa pagina especifica El PageRank de la barra de Google va de 0 a 10 Diez es el maximo PageRank posible y son muy pocos los sitios que gozan de esta calificacion 1 es la calificacion minima que recibe un sitio normal y cero significa que el sitio ha sido penalizado o aun no ha recibido una calificacion de PageRank Parece ser una escala logaritmica Los detalles exactos de esta escala son desconocidos En los ultimos tiempos Google esta tratando de mantener un poco privado su PageRank para evitar manipulaciones pero existen sitios donde se puede comprobar el PageRank 4 Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg es el algoritmo HITS Manipulacion Editar Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador se han disenado metodos para manipular artificialmente el PageRank de una pagina Entre estos metodos hay que destacar el spam consistente en anadir enlaces a una cierta pagina web en lugares como blogs libros de visitas foros de Internet etc con la intencion de incrementar el numero de enlaces que apuntan a la pagina A principios del 2005 Google implemento un nuevo atributo para hiperenlaces a href Nofollow html title Nofollow rel nofollow a como un intento de luchar contra el spam De esta forma cuando se calcula el peso de una pagina no se tienen en cuenta los links que tengan este atributo Antecedentes EditarPageRank ha tomado su modelo del Science Citation Index SCI elaborado por Eugene Garfield para el Instituto para la Informacion Cientifica ISI en los Estados Unidos durante la decada del 50 El SCI pretende resolver la asignacion objetiva de meritos cientificos suponiendo que los investigadores cuyo factor de impacto numero de publicaciones y o referencias bibliograficas en otros trabajos cientificos es mas alto colaboran en mayor medida con el desarrollo de su area de investigacion El indice de citacion es un elemento determinante para seleccionar que investigadores reciben becas y recursos de investigacion Ultimas actualizaciones del PageRank EditarLas actualizaciones del PageRank tenia lugar algunas veces al ano y tardan varios dias en completarse Aqui se pueden ver las fechas de actualizaciones del Pagerank 5 1 ª semana de diciembre del 2013 1 ª semana de noviembre de 2012 1 ª semana de agosto de 2012 1 ª semana de mayo de 2012 1 ª semana de febrero de 2012 2 ª semana de noviembre de 2011 4 ª semana de junio de 2011 3 ª semana de enero de 2011 6 1 ª semana de abril de 2010 4 ª semana de diciembre de 2009 4 ª semana de octubre de 2009 4 ª semana de mayo de 2009 4 ª semana de marzo de 2009 4 ª semana de diciembre de 2008 3 ª semana de octubre de 2008 4 ª semana de julio de 2008 4 ª semana de mayo de 2008 2 ª semana de marzo de 2008 2 ª semana de enero de 2008 4 ª semana de octubre de 2007 4 ª semana de abril de 2007 3 ª semana de enero de 2007 2 ª semana de octubre de 2006 2 ª semana de julio de 2006Actualmente lleva sin actualizarse desde 2013 7 Vease tambien EditarGoogle Motor de busqueda Pagina de resultados del buscador Posicionamiento en buscadoresBibliografia EditarLangville Amy N Meyer Carl D 2006 Google s PageRank and Beyond The Science of Search Engine Rankings Princeton University Press ISBN 0 691 12202 4 Page Lawrence Brin Sergey Motwani Rajeev y Winograd Terry 1999 The PageRank citation ranking Bringing order to the Web Richardson Matthew Domingos Pedro 2002 The intelligent surfer Probabilistic combination of link and content information in PageRank Proceedings of Advances in Neural Information Processing Systems 14 Cheng Alice Friedman Eric J Manipulability of PageRank under Sybil Strategies Proceedings of the First Workshop on the Economics of Networked Systems NetEcon06 Altman Alon Tennenholtz Moshe Ranking Systems The PageRank Axioms Proceedings of the 6th ACM conference on Electronic commerce EC 05 Archivado desde el original el 30 de mayo de 2008 Referencias Editar Google www google com Consultado el 18 de julio de 2021 The Anatomy of a Large Scale Hypertextual Web Search Engine en ingles Sergey Brin y Lawrence Page 1998 The anatomy of a large scale hypertextual Web search engine Seccion 2 1 1 Description of PageRank Calculation p 107 117 Comprobar el PageRank Page Rank es Historial de actualizacion de PageRank Barry Schwartz First Google Toolbar PageRank Update Of 2011 Last PageRank updateEnlaces externos EditarMethod for node ranking in a linked database la patente originaria de PageRank The Anatomy of a Large Scale Hypertextual Web Search Engine el prototipo de Google Datos Q184316 Multimedia PageRankObtenido de https es wikipedia org w index php title PageRank amp oldid 137083145, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos