Расчет PageRank
Объяснив, что такое вес PageRank, т. е., что вы узнаете, когда
получаете информацию о нем, и насколько он важен… в этом разделе я
расскажу вам примерно как он вычисляется. Знать это не обязательно,
однако, если вы поймете это, вы будете лучше понимать, как следует его
применять.
Когда Google был только исследовательским проектом, они [Брин и Пэйдж — прим. А. С.]
написали статью, подробно описывающую формулу, которая определяет вес
PageRank для страницы. Хотя они, возможно, уже не используют в точности
эту формулу, она представляется достаточно корректной для сегодняшних
целей. Вот она:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)),
где PR(A) — это вес PageRank страницы A (тот вес, который мы хотим вычислить),
D — это коэффициент затухания, который обычно установливают равным 0,85,
PR(T1) — вес PageRank страницы, указывающей на страницу A,
C(T1) — число ссылок с этой страницы,
PR(T1)/C(T1) означает, что мы делаем это для каждой страницы, указывающей на страницу A
Жуть! Для тех из вас, кто не является математиком, здесь есть полная
информация по этой формуле — вы не можете просто вычислить вес
PageRank за один прием, как тут. Чтобы вычислить вес PageRank
страницы A вам понадобится знать веса PageRank всех страниц,
указывающих на страницу A. Их веса PageRank будут частично
зависеть от страницы A, указывающей на них, либо каких-то других
страниц, ссылающихся на них. Какая глупая формула. Что она нам говорит,
так это одну очень важную вещь о весе PageRank любой страницы.
Вес PageRank, передаваемый на страницу A со страницы B,
которая указывает на нее, уменьшается с каждой ссылкой куда-нибудь,
которая находится на странице B. Это означает, что вес страницы,
по существу, это мера его голоса; страница может разделить этот голос
между одной, двумя или многими ссылками, но общая голосующая сила будет
всегда той же самой.
Сейчас забудьте формулу на некоторое время, потому что легче
рассмотреть пример реализации, который очень похож на PageRank. Он
должен помочь нам лучше понять PageRank. Назовем его MiniRank.
SearchEngines.ru