|
Qué
es el PageRank O PAGE RANK
PageRank
es una marca registrada y
patentada por Google el 9 de enero de 1999 que ampara una familia de
algoritmos utilizados para asignar de forma numérica la relevancia de
los documentos (o páginas web) indexados por un motor de búsqueda. Sus
propiedades son muy discutidas por los expertos en optimización de
motores de búsqueda. El sistema PageRank es utilizado por
el popular motor de búsqueda Google para ayudarle a determinar la
importancia o relevancia de una página. Fue desarrollado por los
fundadores de Google, Larry Page y Sergey Brin, en la Universidad de
Stanford.
PageRank confía en la naturaleza democrática de la web
utilizando su vasta estructura de enlaces como un indicador del valor de
una página en concreto. Google interpreta un enlace de una página A a
una página B como un voto, de la página A, para la página B. Pero Google
mira más allá del volumen de votos, o enlaces que una página recibe;
también analiza la página que emite el voto. Los votos emitidos por las
páginas consideradas "importantes", es decir con un PageRank
elevado, valen más, y ayudan a hacer a otras páginas "importantes". Por
lo tanto, el PageRank de una página refleja la importancia
de la misma en Internet.
El algoritmo inicial del
PageRank
lo podemos encontrar en el
documento original donde sus creadores presentaron el prototipo de
Google: “The Anatomy of a Large-Scale Hypertextual Web Search Engine":2
Donde:
PR(A) es el PageRank de la página A.
d es un factor de amortiguación que tiene un valor entre 0 y 1.
PR(i) son los valores de PageRank que tienen cada una de las
páginas i que enlazan a A.
C(i) es el número total de enlaces salientes de la página i (sean o no
hacia A).
Algunos expertos aseguran que el valor de la variable d suele ser 0,85.3
Representa la probabilidad de que un navegante continúe pulsando links
al navegar por Internet en vez de escribir una url directamente en la
barra de direcciones o pulsar uno de sus marcadores y es un valor
establecido por Google. Por lo tanto, la probabilidad de que el usuario
deje de pulsar links y navegue directamente a otra web aleatoria es
1-d.4 La introducción del factor de amortiguación en la fórmula resta
algo de peso a todas las páginas de Internet y consigue que las páginas
que no tienen enlaces a ninguna otra página no salgan especialmente
beneficiadas. Si un usuario aterriza en una página sin enlaces, lo que
hará será navegar a cualquier otra página aleatoriamente, lo que
equivale a suponer que una página sin enlaces salientes tiene enlaces a
todas las páginas de Internet.
El peso o importancia de una página
es el resultado de una "votación" entre todas las demás páginas de la
World Wide Web acerca del nivel de importancia que tiene esa página. Un
hiperenlace a una página cuenta como un voto de apoyo. El PageRank
de una página se define recursivamente y depende del número y
PageRank de todas las páginas que la enlazan. Una página que
está enlazada por muchas páginas con un PageRank alto consigue
también un PageRank alto. Si no hay enlaces a una página web, no
hay apoyo a esa página específica. El PageRank de la barra
de Google va de 0 a 10. Diez es el máximo PageRank posible
y son muy pocos los sitios que gozan de esta calificación, 1 es la
calificación mínima que recibe un sitio normal, y cero significa que el
sitio ha sido penalizado o aún no ha recibido una calificación de
PageRank . Parece ser una escala logarítmica. Los detalles exactos
de esta escala son desconocidos.
Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg,
es el algoritmo HITS.
Manipulación del PageRank
Debido a la importancia comercial que
tiene aparecer entre los primeros resultados del buscador, se han
diseñado métodos para manipular artificialmente el PageRank de una
página. Entre estos métodos hay que destacar el spam, consistente en
añadir enlaces a una cierta página web en lugares como blogs, libros de
visitas, foros de Internet, etc. con la intención de incrementar el
número de enlaces que apuntan a la página.
A principios del 2005 Google
implementó un nuevo atributo para hiperenlaces rel="nofollow" como un
intento de luchar contra el spam. De esta forma cuando se calcula el
peso de una página, no se tienen en cuenta los links que tengan este
atributo.
PageRank ha tomado su modelo del Science Citation Index (SCI)
elaborado por Eugene Garfield para el Instituto de información
científica (ISI) en los Estados Unidos durante la década del 50. El
Science Citation Index pretende resolver la asignación objetiva de
méritos científicos suponiendo que los investigadores cuyo factor de
impacto (número de publicaciones y/o referencias bibliográficas en otros
trabajos científicos) es más alto, colaboran en mayor medida con el
desarrollo de su área de investigación. El índice de citación
(PageRank) es un elemento determinante para seleccionar qué
investigadores reciben becas y recursos de investigación.
Page Rank: Visión general de la tecnología
Google es la única empresa abocada a
desarrollar el "motor de búsqueda perfecto", definido por su cofundador
Larry Page como algo que "comprende exactamente lo que el usuario quiere
decir y le entrega exactamente lo que está buscando". Con ese fin en
mente, Google insiste en continuar innovando y se niega a aceptar las
limitaciones de los modelos existentes. Por ello, desarrolló su propia
infraestructura de servidores y la avanzada tecnología PageRank ™
que cambió la manera de llevar a cabo las búsquedas.
Desde el principio, los programadores de Google reconocieron que, para
proporcionar los resultados más rápidos y precisos, era necesaria una
nueva configuración de servidores. A diferencia de la mayoría de los
motores de búsqueda que emplean un grupo de servidores grandes que
suelen ralentizarse cuando procesan picos de carga, Google
utiliza equipos conectados para encontrar rápidamente la respuesta a
cada consulta. Esa innovación permitió lograr tiempos de respuesta más
veloces, mayor escalabilidad y menores costes. Es una idea que otros han
copiado desde entonces, mientras que Google sigue puliendo su
tecnología interna para hacerla cada vez más eficiente.
El software integrado en la tecnología de búsqueda de Google realiza una
serie de cálculos simultáneos en tan sólo una fracción de segundo. Los
motores de búsqueda tradicionales se basan, en gran parte, en la
frecuencia con que una palabra aparece en una página web. Google,
en cambio, emplea la tecnología PageRank ™ para examinar toda la
estructura de vínculos de la web y determinar qué páginas son las más
importantes. A continuación, realiza un análisis de concordancia de
hipertextos para establecer qué páginas son relevantes para la búsqueda
específica que se esté procesando. Al combinar la importancia general
con la relevancia específica respecto de una consulta en particular,
Google puede colocar los resultados más relevantes y fiables en primer
lugar.
Tecnología PageRank : PageRank realiza una medición objetiva de
la importancia que tienen las páginas web. Para ello, resuelve una
ecuación que contiene más de 500 millones de variables y 2.000 millones
de términos. En lugar de contar los vínculos directos,
PageRank interpreta un vínculo de la Página A a la Página B
como un voto que recibe la Página B de parte de la Página A. PageRank
evalúa, de esa manera, la importancia que tiene una página
determinada al contar la cantidad de votos que recibe.
PageRank también considera la importancia de cada página que emite
un voto, dado que a los votos procedentes de determinadas páginas se les
otorga un valor mayor, incrementando así el valor de la página
vinculada. Las páginas importantes reciben una valoración de PageRank
más alta y aparecen en la parte superior de los resultados de
búsqueda. La tecnología de Google emplea la inteligencia colectiva de la
web para determinar la importancia de una página. Los resultados se
obtienen sin ningún tipo de participación humana; por este motivo, los
usuarios han llegado a confiar en Google como fuente de información
objetiva, libre de la manipulación que se genera cuando los sitios pagan
por ocupar determinada posición en los resultados.
Análisis de concordancia de hipertextos: el motor de búsqueda de Google
también analiza el contenido de cada página. Sin embargo, en lugar de
explorar simplemente el texto de la página (que los editores de sitios
pueden manipular mediante metaetiquetas), la tecnología de Google
analiza todo el contenido de una página y toma en cuenta también las
fuentes, las subdivisiones y la ubicación precisa de cada palabra.
Asimismo el PageRank de Google analiza el contenido de páginas
web vecinas para garantizar que los resultados encontrados son los más
relevantes para la consulta del usuario.
Las innovaciones de Google no se limitan al escritorio. Para que los
usuarios que acceden a la web a través de dispositivos portátiles puedan
obtener resultados de búsqueda rápidos y precisos, Google desarrolló
también la primera tecnología de búsqueda inalámbrica que traduce al
momento el código HTML a formatos optimizados para WAP, i-mode, J-SKY y
EZWeb. Actualmente, Google provee su tecnología inalámbrica a diferentes
líderes del mercado, por ejemplo, a AT & T Wireless, Sprint PCS, Nextel,
Palm, Handspring y Vodafone, entre otros.
Opinión:
Es deseo de todo WebMaster es que su
trabajo se refleje en resultados. El logro debe ser obtener
comunicaciones web relevantes para el usuario más allá de los deseos y
objetivos. El usuario es el que manda y a él nos debemos. El Page
Rank debería ser la "medida del usuario", a eso debemos apuntar.
-Conocer
el PageRank de una página -
volver |
Adsense
|