Сценарий PHP: Карта сайта с количеством возвращаемых ссылок
На основе CSV-файла GWT и содержимого сайта устанавливает иерархическую карту сайта с количеством обратных ссылок для каждой страницы.
Значение, которое учитывается, - это второе значение таблицы, предоставленной в Google Webmaster Tools: количество ссылок с разных сайтов.
Сводная таблица, созданная сценарием в виде HTML-файла, позволяет оценить популярность различных типов страниц на сайте в зависимости от количества полученных ссылок.
Предпосылки:
-
В
- текущей конфигурации скрипт требует локального образа сайта, если сценарий не вращается на сервере, в этом случае требуется только статический сайт, то есть страницы хранятся как HTML-файлы.
- Кроме того, карта сайта в стандартном формате XML.
- Необходимо установить интерпретатор PHP.
- Загрузить список ссылок обратно в учетную запись GWT в формате CSV.
Сам сценарий не требует установки. После извлечения из архива, чтобы создать карту, начинается с команды:
php backcount.php
При наличии файла карты сайта команда:
php backmap.php
Но нужно создать файл backcount.ini, чтобы ввести информацию о вашем сайте, что в двух строках:
site=c:/example.com map:sitemap.xml csv=www-example-com_20140530_ExternalLinks_LinkedPages.csv
Первая строка указывает корень места для хранения страниц. Второй - локальный путь к карте сайта. Эти две команды являются альтернативными, backcount использует только сайт и backmap использует карту.
Третий - путь и имя файла csv. Можно добавить несколько строк cv, чтобы сравнить эволюцию во времени.
Если нужно управлять несколькими сайтами, для каждого можно создать ini-файл.
При запуске программа запрашивает имя ini-файла. Затем можно ввести имя или непосредственно нажать Enter, если используется файл по умолчанию backcount.ini.
Вы можете пропустить расширение .ini, программа добавит его для вас.
Затем программа создает HTML-таблицу в файле с первым именем из имени CSV-файла. Каталоги сайта выделены жирным шрифтом и следуют за списком содержащихся в них файлов. В каждой строке справа находится количество возвращенных ссылок.
Чтение этой таблицы четко покажет, какая часть сайта наиболее популярна, а какая никому не интересна, это гораздо проще, чем с оригинальным списком, классифицированным по количеству бэклинков и не указывающим страницы без каких-либо обратных ссылок.
Их можно отменить, чтобы улучшить рейтинг сайта в результатах поиска... Посмотрите, почему в «Алгоритме Панды» ясно.
Упрощенное использование
В последней версии сценария в августе 2015 года уже не нужно давать список CSV-файлов при условии, что они помещаются в тот же каталог, что и backcount.php.
Просто укажите общий для CSV-файлов префикс в ini-файле. Например, если ваш сайт www.example.com, общий префикс будет: www-example-com:
site=c:/example.com prefix=www-example-com
Затем выполните предыдущие действия.
Архив backcount.zip содержит исходный код на языке Script и исполняемый код на PHP.
Версии
- 21 августа 2015 года. Новая упрощенная версия на основе общего префикса. Имя создаваемого HTML-файла теперь состоит из префикса и полной даты
- 20 мая 2015 года. Обновлено для работы с последними версиями PHP.
- 9 ноября 2014 года. Ссылки на каталоги не были засчитаны. Это исправлено.
- 23 октября 2014 года. Адаптирует исходный код для Script 2. Поддержка нескольких CSV с вычислением разницы. Показывает общее количество обратных ссылок на HTML-странице и в консоли.
- Июнь 2014 года. Первая версия .
Формат CSV часто используется для создания списков, которыми можно обмениваться между различными программами. Вышеприведенный скрипт использует простые функции, потому что он ограничен хорошо заданным файлами, но при желании использовать этот формат в своих программах с файлами разного происхождения могут пригодиться специализированные инструменты :
- CSVfix. Позволяет классифицировать список по алфавиту, выполнить поиск, преобразовать в XML или SQL, сравнить два CSV-файла. Исполняемая бинарная программа доступна для Windows или Linux.
- Csvkit. Выполняет те же операции. Написано на Питоне.
- OpenRefine. В отличие от предыдущих, которые работают в командной строке, имеет графический интерфейс. Однако он плохо работает на больших файлах.