Оригинальный алгоритм расчета PageRank был разработан создателями Google Лоуренсом Пэйджем и Сергеем Брином. Алгоритм выглядит следующим образом:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
PR(A) - PageRank страницы A, PR(Ti) - PageRank страницы Ti, которая ссылается на страницу A, C(Ti) - количество внешних ссылок страницы Ti (линков, ссылающихся на другие сайта), d - коэффициент дампа, лежащий в промежутке от 0 до 1.
PageRank не классифицирует веб узлы как единое целое, а определяется для каждой страницы отдельно. Чем меньшее число внешних ссылок, рассположенных на страницы Ti, тем больший вес они имеют.
d - коэффициент дампа (смягчающий коэффициент), определяющий вероятность того, что случайных пользователь, посетивший страницу Ti перейдет по внешней ссылке на страницу A (как правило, случайная величина).
Существует также другой алгоритм расчета PageRank:
PR(A) = (1-d) / N + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
где N - общее число всех страниц Интернета. Данный алгоритм не расходится в корне с предоженным ранее. (1-d) / N - это математическое ожидание, определяющее вероятность перехода пользователя сайта Ti на страницу А.
Алгоритм расчета PageRank Рассмотрим пример расчета PageRank для страниц A, B и C. При этом страница А ссылается на страницу B, B ссылается на страницу C, а страницы А и C - ссылаются друг на другу (например, при обмене ссылками).
Согласно алгоритму Пейджа и Брина, коэффициент смягчения d обычно устанавливается 0.85, но для более простого расчета установим его как 0.5.