Главная страница статей --> Хитрости при программировании php, заметки по базам данных

Алгоритм расчета PageRank

Источник: realcoding.net

Оригинальный алгоритм расчета PageRank был разработан создателями Google Лоуренсом Пэйджем и Сергеем Брином. Алгоритм выглядит следующим образом:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

PR(A) - PageRank страницы A,
PR(Ti) - PageRank страницы Ti, которая ссылается на страницу A,
C(Ti) - количество внешних ссылок страницы Ti (линков, ссылающихся на другие сайта),
d - коэффициент дампа, лежащий в промежутке от 0 до 1.

PageRank не классифицирует веб узлы как единое целое, а определяется для каждой страницы отдельно. Чем меньшее число внешних ссылок, рассположенных на страницы Ti, тем больший вес они имеют.

d - коэффициент дампа (смягчающий коэффициент), определяющий вероятность того, что случайных пользователь, посетивший страницу Ti перейдет по внешней ссылке на страницу A (как правило, случайная величина).

Существует также другой алгоритм расчета PageRank:

PR(A) = (1-d) / N + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

где N - общее число всех страниц Интернета. Данный алгоритм не расходится в корне с предоженным ранее. (1-d) / N - это математическое ожидание, определяющее вероятность перехода пользователя сайта Ti на страницу А.

Алгоритм расчета PageRank
Рассмотрим пример расчета PageRank для страниц A, B и C. При этом страница А ссылается на страницу B, B ссылается на страницу C, а страницы А и C - ссылаются друг на другу (например, при обмене ссылками).

Согласно алгоритму Пейджа и Брина, коэффициент смягчения d обычно устанавливается 0.85, но для более простого расчета установим его как 0.5.



Расчитаем PageRank для страниц:

PR(A)= 0.5 + 0.5 PR(C)
PR(B)= 0.5 + 0.5 (PR(A)/ 2)
PR(C)= 0.5 + 0.5 (PR(A)/ 2 + PR(B))

Решаем полученное уравнение и получаем:

PR(A)= 14/13 = 1.07692308
PR
(B)= 10/13 = 0.76923077
PR
(C)= 15/13 = 1.15384615

Очевидно, что сумма PageRank страниц равна трем, что полностью совпадает с количеством страниц.



Похожие статьи:
- Работа с SQLite
- Киберсквотинг и киберсквотеры
- Ода раскрутке
- Определение размера удаленного файла
- Эффект плавного перехода на JavaScript
- Комплекс Denwer: Apache+PHP+MySQL+Perl за 5 минут
- Опрос с помощью AJAX
- Фиксирование шрифтов на странице с помощью таблицы стилей
- Свойства текста
- Установка сервера Apache 2 + Perl + PHP
- Два источника World Wide Web
- Два стиля ajax’а
- Страсти вокруг AJAX накаляются


Оглавление | Обсудить на форуме | Главная страница сайта | Карта сайта |

Контакты
Редакция:
[0.002]