Перевод патента с описанием алгоритма Панды

Подробности этого алгоритма и то, как он действует для выбора страниц и наказания за них, полностью описаны в патенте 8.682.892.

Этот документ представляет собой двойной перевод, с одной стороны, на французский, с другой - на простой язык документа, представляемого в ЮСПТО и получившего одобрение, написанного на английском языке и на юридическом субязыке, где любое местоимение исключается и, следовательно, излишне повторяется .


USPTO et Panda

Способ, описанный в патенте, применяется только к страницам, отобранным для ответа на поиск и предназначенным для изменения их первоначального ранжирования в зависимости от коэффициента изменения, применяемого к сайту и определяемого соотношением.

Расчет этого соотношения заключается в том, чтобы пересчитать с одной стороны независимые ссылки на документы сайта. с другой стороны, для подсчета поисковых запросов, ведущих к документам, составляющим эту группу, и на основе этих двух чисел определить коэффициент изменения, который должен применяться к первоначальному баллу каждого документа, который зависит от других критериев позиционирования .
Метод, как правило, наказывает сайты, основная часть трафика которых поступает из поисковой системы, потому что их веб-мастера лучше разбираются в SEO. Кроме того, он поддерживает более поздние страницы, которые имеют больше шансов получить новые ссылки.

Патент 8 682 892, присвоенный Google, авторами которого являются Навнит Панда и Владимир Офицеров, был подан 28 сентября 2012 года и выдан 25 марта 2014 года.


Определение терминов

Ресурс: Веб-страница, изображение, текстовый документ, мультимедийное содержимое, представленное в результатах поиска .

Группа ресурсов: Цель состоит в том, чтобы присвоить один и тот же балл набранному набору ресурсов, связанных между собой, а также оценить независимость возвращающихся связей, и объединять ресурсы в группы. Это может быть домен или поддомен, или набор доменов, принадлежащих одному и тому же владельцу.

Множественные группы ресурсов: Совокупность групп, участвующих в поиске (более или менее сайтов) и рассматриваемых как отдельные и независимые друг от друга.

Независимые ссылки: Для того чтобы использовать ссылки со страницы на ресурс для оценки его полезности, ссылки из разных групп ресурсов целевой группы ресурсов определяются как независимые.

Коэффициент изменения: Группе присваивается фактор, который изменяет положение результатов в группе по сравнению с показателем позиционирования, зависящим от релевантности и других сигналов, и этот же фактор применяется ко всем ресурсам группы. Таким образом, все страницы сайта перед их размещением наказываются одним и тем же фактором.

Стандартизированный коэффициент изменения. После расчета коэффициента изменения для группы (возможно, сайта) этот коэффициент корректируется в соответствии со всеми группами, принадлежащими к одному и тому же разделу .

Справочный запрос - это запрос, который приводит к ресурсу в группе и одним пользователем. Чтобы быть эталонным, его должен делать пользователь, который ранее не проводил поиск, приводящий к другим ресурсам из той же группы. Пользователь идентифицируется по идентификатору или cookie.
Эти запросы участвуют в расчете коэффициента изменения, поэтому штраф панды.

Запрос навигации: Некоторые запросы поиска считаются пользователями при поиске конкретного сайта или страницы. Это определяется данными, хранящимися в поисковой системе, которые идентифицируют этот тип запросов.

Заявлено

следующее:
  1. Метод, реализованный одним или несколькими компьютерами, который включает в себя определение,
    - для каждой из множества групп ресурсов соответствующий подсчет входящих ссылок на ресурсы в группе,
    - для каждой из множества групп ресурсов соответствующий подсчет справочных запросов;
    Определять
    - для каждой из множества групп ресурсов коэффициент изменения, соответствующий группам ресурсов,
    - в то время как соответствующий балл основан на подсчете независимых ссылок и подсчете справочных запросов для группы;
    и ассоциировать
    - с каждой в множестве групп ресурсов, коэффициент изменения для группы
    - в то время как соответствующее изменение, характерное для группы, изменяет начальную оценку, созданную для ресурсов в группе, в ответ на полученные запросы поиска.
  2. Этот метод позволяет получать запрос от пользователя; имеются данные о множестве ресурсов с их начальной оценкой позиционирования для каждого ресурса; идентифицируют группу ресурсов для каждой; Начальный балл каждого ресурса корректируется в соответствии с коэффициентом изменения, который применяется к группе, частью которой он является. Это генерирует новый балл
  3. .
  4. Новый балл используется для получения рейтинга позиционирования для каждого ресурса. Результаты представлены пользователю в соответствии с новым баллом.
  5. Перед представлением результата вносятся дальнейшие коррективы в рейтинг.
  6. Различают группу ресурсов на основе каждого доступного URL-адреса ресурсов в индексе.
  7. Чтобы настроить начальную оценку с коэффициентом изменения, необходимо определить коэффициент изменения для каждого ресурса на основе значения в группе.
  8. Чтобы скорректировать начальный балл каждого ресурса, его умножают на коэффициент изменения, который его касается.
  9. При создании конкретного коэффициента изменения для первого ресурса результатов поиска определяется, является ли это навигационным запросом. При этом первоначальный балл не меняется.
  10. При определении коэффициента изменения ресурса, который является первым результатом поиска, определяется, что это не навигационный запрос.
  11. Определить, что значение начального балла первого ресурса результатов поиска не превышает первого порога. А если он превышает его, то генерирует коэффициент изменения для этого ресурса, который не меняет первоначальный балл.
  12. При создании коэффициента изменения для второго ресурса результатов поиска определяется, что начальный балл превышает значение первого коэффициента, но не превышает значения второго и более высокого уровня. Если T.sub.1 является первым компенсатором, IS - начальный балл, M - коэффициент изменения группы, формула для определения коэффициента изменения f.sub.1 для ресурса составляет :
    f.sub.1 = T.sub.1 + ( IS - T.sub.1) M / IS 
  13. При генерировании коэффициента изменения, специфического для третьего ресурса результатов поиска: определяется, что начальный балл превышает значение второго уровня; и генерируется модифицирующий фактор f.sub.2, такой как :
    f.sub.2 = f.sub.3 / log.sub.T.sub.2 (IS) g(f.sub.3)
    где T.sub.2 - значение второго компенсатора,
    f.sub.3 - исходный фактор изменения, специфичный для ресурса,
    и g (f.sub.3) - функция смягчения, уменьшающая эффект коэффициента изменения для конкретных интервалов значений начального
  14. коэффициента изменения.
  15. f.sub.3 оценивается по следующей формуле:
    f.sub.3 = T.sub.1 + (IS-T.sub.1) M / IS
    где T.sub.1 - значение первого уровня, IS - начальный балл, M - коэффициент изменения для группы.
  16. Функция смягчения определяется как:
    g(f.sub.3)=1,
    if f.sub.3.ltoreq.Q and g(f.sub.3) = (1-f.sub.3)/1-P,
    if f.sub.3 > Q
    где Q - заданное значение уровня.
  17. Метод в 1 указывает, когда независимая связь для группы ресурсов - это связь от исходного ресурса к целевому ресурсу, где цель включена в определенную группу, а источник и цель определены как независимые.
  18. Чтобы определить в 15, что источник и цель независимы, определяется, что они включены в различные группы ресурсов.
  19. 15-й способ включает в себя определение того, что у исходной и целевой групп нет шансов быть в отношениях.
  20. Способ в 15 включает в себя определение того, что исходный ресурс не имеет шансов быть дубликатом целевого ресурса.
  21. В соответствии со способом в 1 эталонный поиск для конкретной группы ресурсов является ранее представленным запросом поиска, который был классифицирован как относящийся к ресурсу в этой группе.
  22. Способ на 19 включает в себя определение, что ранее представленный запрос включает в себя один или несколько терминов, которые были определены как относящиеся к ресурсу в группе.
  23. Способ в 1, где определяется коэффициент изменения для группы, включает в себя: определение начального коэффициента изменения для группы, который является отношением количества независимых связей, подсчитанных для группы, к количеству запросов ссылок, подсчитанных для группы
  24. .
  25. Способ на 21, касающийся конкретной группы ресурсов, включает в себя: разбиение множества групп ресурсов на множество разделов на основе соответствующих учетных записей справочных запросов ;
    и определение нормализованного коэффициента изменения для конкретной группы путем нормализации ее начального коэффициента на основе начального коэффициента нормализации групп в одном и том же разделе.
  26. Система включает в себя: определение для каждой в множестве групп ресурсов соответствующего подсчета независимых входящих ссылок на ресурсы группы. Определить для каждого соответствующий подсчет справочных запросов. Определить для каждой из групп коэффициент изменения, основанный на подсчете независимых связей и счетчиках справочных запросов, и связать с каждой группой ресурсов коэффициент изменения, характерный для группы, таким образом, чтобы этот фактор изменял начальные показатели ресурсов группы.
  27. Таким образом, система согласно 23 получает первый запрос поиска от пользователя, получает данные, идентифицирующие множество ресурсов результатов поиска с их начальной оценкой для каждого, Определяет группы ресурсов, к которым принадлежит каждая из них, и корректирует начальную оценку в соответствии с коэффициентом изменения группы, чтобы создать новую оценку.
  28. Система согласно 24 использует полученный новый балл для классификации ресурсов, удовлетворяющих запросу, и отображения результатов на основе этих оценок позиционирования.
  29. Система согласно 25 осуществляет дальнейшие корректировки оценок позиций, полученных перед отображением результатов.
  30. Система согласно 23, в которой идентифицируются связи между источником и целью и определяется, что источник и цель независимы.
  31. Система согласно 27, в которой определяется, что источник и цель независимы, определяет, что исходный и целевой ресурс принадлежат к разным группам ресурсов.
  32. Система согласно 27 определяет, что исходная и целевая группы не связаны.
  33. Система по 27, в которой определяется независимость групп, определяет, что у исходного ресурса мало шансов быть дубликатом цели.
  34. Система согласно 23, в которой запрос ссылки для группы ресурсов является запросом, ранее отправленным для ресурса, который считается принадлежащим этой группе.
  35. Система по п. 31, в которой эталонный запрос идентифицируется тем, что он содержит термин или более, касающийся ресурса.
  36. Система согласно 23, где определяется коэффициент изменения группы, определяет первоначальный коэффициент изменения, который является отношением числа независимых связей, рассчитываемых для этой группы, к количеству запросов ссылок, рассчитанных для этой группы.
  37. Система согласно 33 распределяет множество групп ресурсов на множество разделов, основываясь на их соответствующем подсчете справочного запроса; и определяет нормализованный коэффициент изменения для группы, стандартизируя начальный коэффициент на основе коэффициента групп ресурсов в разделе, к которому он принадлежит.
  38. (С 35 по 46 уточняется, что все ранее описанные шаги выполняются компьютером. Поскольку юридический язык игнорирует местоимения, каждая претензия повторяется, указывая, что она реализуется машиной...)

Описание


ОСНОВА

Эта спецификация касается классификации результатов поисковых запросов, представляемых поисковой системе в Интернете.

Цель поисковых систем состоит в том, чтобы определить ресурсы, то есть веб-страницы, изображения, текстовые документы, мультимедийные материалы, которые имеют отношение к потребностям пользователя, и представить информацию о ресурсах наиболее полезным для пользователя способом. Поисковые системы Интернета обычно возвращают набор результатов поиска, каждый из которых идентифицирует ресурс, в ответ на запрос, отправленный пользователем.

Резюме

(В резюме отражены моменты, ранее изложенные в претензии.)

Материал предмета, описанный в спецификации, реализуется для достижения хотя бы одного из следующих преимуществ:

КРАТКОЕ ОПИСАНИЕ РИСУНКОВ

РИС. 1 показывает пример поисковой системы.

РИС. 2 - порядковый номер примера процесса для настройки начального балла ресурса, идентифицируемого системой поиска для принятого запроса поиска.

РИС. 3 - порядковый номер примера процесса для определения коэффициента изменения для группы ресурсов.

РИС. 4 - порядковый номер примера процесса для определения стандартных коэффициентов изменения для групп ресурсов.

РИС. 5 - порядковый номер примера процесса для формирования коэффициента изменения, специфичного для ресурса.

Такие номера и обозначения на различных чертежах указывают на такие элементы.

ПОДРОБНОЕ ОПИСАНИЕ

(В деталях отражены моменты, касающиеся реализации изложенной методики, которые будут интересны только адвокатам в ходе судебного разбирательства. Эти моменты не отражены в этом переводе, который предназначен для веб-мастеров. Но он также дает дополнительные подробности, которые мы переводим ниже.)

На рис. 1 показан пример поисковой системы, номер 114. Это пример системы для поиска информации, реализованной в компьютерной программе на одном или нескольких компьютерах в одном или нескольких местах.

В некоторых случаях система 114 поиска может быть реализована на устройстве 104 пользователя, например, если пользователь устанавливает приложение, которое выполняет поиск для устройства пользователя.

Группа ресурсов является частью ресурсов Интернета. Группа может быть разнообразной. Группа ресурсов на основе адреса определяется URL-адресом ресурсов группы.
Ресурсы сгруппированы так, чтобы ни один из них не принадлежал более чем одной группе. Например, группа может включать все ресурсы, к которым можно получить доступ с помощью доменного имени. Таким образом, группа может включать http://www.domaine.com/ressource1, http://www.domaine.com/ressource2 и т.д. независимо от того, когда ресурсы станут доступны поисковой системе для их индексации.
В качестве альтернативы группа ресурсов может включать каждый ресурс, к которому можно получить доступ по определенному имени узла в форме http://hôte.example.com/ressourceX. (NDT: субдомен).
Возможны другие группировки на основе адреса. Можно использовать только часть ресурсов домена или поддомена.
В качестве альтернативы группа ресурсов может включать несколько доменов или поддоменов.

2 - порядковый номер примера процесса (№ 200) для настройки начального балла ресурса.

Система получает данные, идентифицирующие ресурс и его начальную оценку. Начальный балл ресурса (до Panda, NDT) может быть измерением релевантности ресурса по отношению к запросу, измерением качества ресурса или и тем, и другим.

Система идентифицирует группу ресурсов на основе адреса, которому принадлежит ресурс (204), основываясь на URL. Группа может разделить один и тот же домен с нашим хостингом.
Он получает доступ к данным коэффициентов изменения (206). База данных хранит коэффициенты изменения для всех групп.

Сайтема генерирует фактор изменения, специфичный для ресурса (208). Как правило, система может настроить коэффициент изменения группы на основе одного или нескольких параметров запроса, чтобы создать его.

Система применяет конкретный коэффициент изменения к исходному баллу (210). Коэффициент изменения ресурса может быть коэффициентом умножения, применяемым к начальной оценке для получения измененного балла. (NdT: не указан другой метод, «может» кажется «восточным»).

Рис. 3 - порядковый номер примера процесса (300) для определения коэффициента изменения для группы ресурсов. Она выполняется для каждой из групп в целом.

Система подсчитывает независимые связи для группы (302). Ссылка для группы ресурсов - это входящая ссылка на ресурс группы, которая является целью. Ссылки могут включать гиперссылки или неявные ссылки. Неявная ссылка - это ссылка на целевой ресурс без гиперссылки, по которой пользователь не может следовать.

Связь считается независимой, если источник и цель принадлежат к разным группам.

Система может получить доступ к данным, свидетельствующим о том, что группы ресурсов могут быть связаны друг с другом. Потому что они принадлежат одной и той же сущности, размещены в одной и той же сущности или созданы одной и той же сущностью. При этом система считает, что ресурсы обеих групп не независимы.

Еще один пример: Система может иметь доступ к данным, которые указывают, как два ресурса похожи в одном или нескольких аспектах, поэтому имеют содержимое, изображения, формат, таблицу стилей и т. Д. идентичные или аналогичные. Если данные указывают на то, что оба ресурса достаточно похожи, он делает вывод, что они не независимы.

Возможно, система вычисляет балл независимости на основе значений атрибутов, рассматриваемых для пары ресурсов, и классифицирует их как независимые, если балл удовлетворяет критерию.

Возможно, система имеет связь не более чем с каждым ресурсом в каждой группе, указывающей на целевую группу. В других случаях, если в ресурсах одной исходной группы к ресурсам целевой группы выявлено более одной связи, количество независимых связей, подсчитанных для целевой группы, может быть функцией от общего количества независимых связей. Общее количество независимых связей может быть общим количеством, найденным в ресурсах. Это может быть логарифм этого числа. Или другая функция этого числа.

Запрос считается ссылающимся на ресурс в соответствии с признанным термином, содержащимся в нем. Этот термин может быть URL-адресом или частью URL-адреса. Например, «example.com». В качестве другого примера, если данные указывают на то, что «example sf» и «esf» обычно используются пользователями Интернета для ссылки на ресурс, URL-адрес которого «http://www.example.com», то запросы, содержащие такие термины, как «example sf news» и «esf reviews», считаются ссылочными запросами для группы, в которую входит ресурс, URL-адрес которого «http://www.example.com».

Навигационный запрос может также рассматриваться как ссылка на ресурс. Это запрос на получение конкретного сайта или страницы (вместо списка результатов, NdT). Система оценивает его по базе данных, которая записывает запросы такого рода.

В некоторых реализациях система считает в качестве справочных запросов для группы только запросы, отправленные уникальными пользователями. Так что если они еще не подавали запросы на ресурсы из одной группы. Система идентифицирует пользователей с помощью обычных средств, таких как cookie, логин идентификации. Это может применяться в течение ограниченного периода или нет.

Фактором изменения может быть отношение количества независимых связей с группой к количеству запросов ссылок для группы. Так что по формуле:

M = IL / RQ

где M - коэффициент изменения, IL - количество независимых связей, RQ - количество запросов ссылок.

В некоторых реализациях вместо того, чтобы хранить коэффициент изменения для группы, этот фактор нормализуют и хранят нормализованный фактор.

Рис. 4 - порядковый номер примера процесса (№ 400) для определения стандартных коэффициентов изменения для групп ресурсов.

Система может разбивать группы ресурсов (402) на основе подсчета запросов ссылок, чтобы каждый раздел включал группы ресурсов, количество которых находится в пределах интервала.
Для этого система может сравнивать факторы изменения только между группами, в которых имеется количество аналогичных запросов ссылок.

Для каждой группы в разделе система нормализует коэффициент изменения (404), основываясь на коэффициентах других групп раздела. Например, он может рассчитать статистическое измерение факторов. Например, это может быть центральная тенденция, такая как среднее арифметическое, геометрическое или гармоническое, медианное, доминирующее значение и т. Д.
Или статистическое измерение может быть минимальным или максимальным коэффициентом изменения.
Нормализованный коэффициент изменения НМ для данной группы в разделе может быть выражен как:

NM = M - m / m

где M - коэффициент изменения для группы и m - статистическое измерение.

Рис. 5 - порядковый номер примера процесса (№ 500) для формирования коэффициента изменения, специфичного для ресурса. Процесс 500 может быть выполнен для каждого из ресурсов в ответ на запрос, полученный от пользователя.

При получении запроса на переход к ресурсу система присваивает фактору изменения значение, которое не влияет на начальную оценку соответствующего ресурса.

В противном случае система определяет, находится ли начальный балл ниже значения первого уровня. Если да, то коэффициент изменения меняется таким образом, чтобы не изменять первоначальный балл.

Если первоначальный балл не находится ниже первого уровня, система определяет, находится ли он ниже второго уровня. Если это так, система определяет первый коэффициент изменения, который должен быть применен к начальной оценке.
Например, если коэффициент изменения мультипликативен, то первый коэффициент f.sub.1 может быть выражен как:

f.sub.1 = T.sub.1 + (IS - T.sub.1)M / IS

где T.sub.1 - значение первого уровня, IS - начальный балл, а M - коэффициент изменения для группы ресурсов. Так что фактор изменения, который падает тем более, что первоначальный балл растет.

Если первоначальный балл не находится ниже второго уровня, система генерирует второй коэффициент изменения, который должен быть применен к нему. Он может быть основан на первом .
Например, если FM мультипликативен, второй фактор f.sub.2 можно выразить как:

f.sub.2 = f.sub.1 / log.sub.T.sub.2(IS)g(f.sub.1)

где T.sub.2 - значение второго уровня, а g (f.sub.1) - функция смягчения, уменьшающая влияние второго FM на IS для конкретных интервалов первого FM.
Например, функция смягчения может быть определена таким образом, что, если первая FM превышает один уровень, вторая FM, когда она применяется к начальной баллу, имеет пониженный эффект, чтобы не влиять на значение начального балла.
В некоторых реализациях функция смягчения определяется как морсифицированная функция, такая как:

g(f.sub.1)=1, 
if f.sub.1.ltoreq.Q and g(f.sub.1)=(1-f.sub.1)/1-P, 
if f.sub.1>Q

где Q - заданное значение уровня. В этих реализациях, если значение log.sub.T.sub.2 (IS) g (f.sub.1) меньше 1, поэтому если f.sub.1 равно единице и, следовательно, продукт равен нулю, система может сделать quef.sub.2 равным f.sub.1, чтобы значение f.sub.2 не было больше, чем f.sub.1 или f.sub.2 неопределенный

(Приводимые ниже пункты предназначены для включения юридических терминов, необходимых для применения патента, с указанием материала, на котором реализуется метод. Поэтому они игнорируются.)

Комментарии

Все это можно определить как усовершенствование PageRank и мы достаточно далеки от критериев качества, которые дает Google. Это только бэклинки из разных источников и поиск разными пользователями, формируя соотношение для определения качества сайта! Все это сводится к математической формуле, которая оставляет место для большого приближения и, в частности, рассекречивает страницы, содержащие очень точные ответы, но на малоизвестных сайтах. Популярность сайта предполагается фактором качества и он должен распространяться на все страницы и «ресурсы» сайта...

Переведён и сдан Денисом Суро 31 марта 2014 года. Любое воспроизводство запрещено на другом сайте, но разрешено в печатном виде.