Как Google присваивает оценку веб-странице

Этот документ составлен на основе патентной заявки, поданной Google в патентное бюро США 26 апреля 2007 года (1). Он подробно рассказывает, как каждой странице присваивается балл, который будет определять ее позицию в результатах поисковика. Анализируются все критерии, определяющие расположение страницы, и, следовательно, раскрываются причины, вызывающие эффект песочницы.

Дата документа

Дата важна для назначения балла. Для определения даты документа возможно несколько способов: Это может быть дата индексации или дата размещения ссылки на странице.
Если количество ссылок на странице растет быстрее, чем для более старой страницы, это даст лучший балл, но также может сигнализировать о спаминге.
Если документ новее среднего значения страниц в результате, ему можно присвоить лучший балл, чтобы улучшить положение, чтобы учесть его новизну.

Изменение содержимого страницы

Балл не одинаков в зависимости от того, меняется часто содержание документа или нет.
Для определения изменений можно хранить весь документ, либо подпись, которая представляет его в целом, либо часть, которая считается необходимой для документа.
Оценка может быть положительной или отрицательной в зависимости от этих изменений.

Анализ запросов и щелчков мыши на результатах

Можно учесть, как документ выбирается из результатов запроса.
Если некоторые термины чаще встречаются в запросах пользователей, документ, связанный с этими терминами (содержащий их или содержащий их бэклинки), будет иметь лучший балл.
Если документ часто отвечает на подобные запросы, то этот документ получит лучший балл.
Следует учитывать, что некоторые запросы остаются в силе, в то время как отвечающие на них страницы отличаются друг от друга (например, в спортивных результатах). Балл падает, если документ больше не отвечает на запрос.
В некоторых областях, таких как FAQ, новизна документа важна и улучшает балл.
Однако если пользователи нажмут на ссылку более старого документа и проигнорируют последние, то этот документ будет иметь лучший балл.
Документ, который чаще появляется в запросах на какую-то тему, но меньше, когда поле уточняется, будет иметь меньший балл (например, тема может быть спортом, и он возвращается к теме конкретного спортивного клуба).
Если документ появляется в запросах без связи между ними, это сигнализирует о спаме, и балл снижается.

Условие для ссылок на странице

Учитывается появление бэклинков и их исчезновение.
Если появление новых бэклинков со временем уменьшится, значит, документ становится устаревшим, то его счет будет снижен.
И наоборот, если это число стремится к прогрессу, у него будет лучший результат.
Если содержимое документа изменено, но ссылка, содержащаяся в нем на другой странице, сохраняется, это добавляет значение этой ссылке и, следовательно, повышает оценку связанной страницы.
Ценность ссылок растет, если они «доверяют», что, например, происходит с правительственными сайтами.
Скорость появления обратных ссылок сообщает о спаме. Предполагается, что страницы данного типа притягивают ссылки на заданную скорость. Если появляется слишком много бэклинков, это предполагает обмен ссылками или покупку, или страницы свободной регистрации (например, каталогов, N.D.T.) и это спам.

Текст привязок

Изменение текста привязок означает, что документ был обновлен.
Если текст меняется и отличается от формулировок привязок, это означает переделку документа, а то, что он уже не актуален с привязками, что нежелательно.
С этого момента можно определить дату, когда та или иная область сменится тематикой, а ссылки до этой даты будут проигнорированы.
Если документ испытывает незначительные изменения, нужно сохранить формулировку якорей, их стаж является залогом актуальности.

Трафик на странице

Если трафик, то есть количество чтений одной страницы, значительно уменьшается, значит, документ устарел. Сравниваются время и периоды, чтобы оценить уменьшение трафика.
Учитывается трафик, поступающий от рекламы. Если размещать рекламу на других сайтах с высокой посещаемостью, то у страницы будет лучший балл, чем у объявлений на мелкие сайты.

Поведение посетителей

Количество раз, когда страница выбрана в результатах поиска, имеет значение, а также время, потраченное на доступ к странице.
В зависимости от того, будет ли посетитель больше или меньше времени проводить на странице, она будет считаться актуальной или устаревшей. Если посетители со временем будут проводить на странице все меньше времени, она будет считаться устаревшей.

Сведения о доменном имени

Учитывается хостинг, Интранет, Интернет или сеть баз данных документов.
Последние домены могут использоваться спамерами и поэтому считаться менее легитимными.
Учитываются данные сервера имен, владельца домена, контакты, адреса сервера имен. Частые изменения - признаки спама. IP-адреса и другие данные, используемые для этих неустойчивых узлов, регистрируются в базе данных вместе с соответствующими документами.
Сервер имен лучше рассматривать, если он ссылается на разные домены для разных реестров. Плохо, если на нем размещаются порносайты, сайты спама, домены, содержащие коммерческие слова.
Оценка документа зависит от домена и его размещения.

Предыдущие ранги

Учитываются прежние ранги. Количество позиций, которые документ зарабатывает за определенное время, меняет его оценку. Однако если ранг остается высоким, в то время как позиции, как правило, меняются со временем по теме, это указывает на коммерческую тему и более высокую вероятность спама.
Если количество выделений для страницы будет увеличиваться или если выбор будет более частым, у страницы будет лучший балл.
Двигатель следит за пиками в ранге документов, синонимом новостей или спама. Чтобы изменить ситуацию, учитываются разные факторы. Например, документ, упоминаемый в новостях, не является спамом.
Напротив, внезапное падение ранга документа говорит о том, что он устарел.
В заключение, изменение ранга документа влияет на его оценку и будущий ранг.

Букмарки

Букмарки и другие такие данные влияют на оценку документа. Учитывается факт добавления или удаления из этого типа списка. Влияет и то, что к документу в списке часто обращаются.
Учитываются кэш-память, временные каталоги, а также cookie. Все это указывает на то, просматривается ли документ или нет.

Уникальные и привязанные слова

Частота одного слова или предложения в привязках учитывается в связи со ссылками на них.
Если есть подозрительные якоря, в частности, так как в разных документах много индентских надписей, это повлияет на счет этих документов и тех, кто имеет на них ссылку.

Неуместные ссылки

Входящие или исходящие неактуальные ссылки являются индикатором спама и снижают оценку страницы.

Тема документа

Он используется для определения своего балла.
Тема документа определяется по редким словам, URL, сводке, содержанию и т.д.
Если тема набора документов меняется, это указывает на другого владельца или тему, и вся информация о документе становится устаревшей. Или это означает, что документ используется для спама.

(1) Источник в Бюро патентов и торговых марок США.

Также был подан патент на расчет FreshRank, заметка о свежести страниц.