Какой формат синдикации выбрать, Atom или RSS 2.0
?Хотя в прошлом были предложены и другие решения, появились три формата синдикации:
- RSS 2.0, или Really Simple Syndication, Гарвард
- RSS 1.0, или Rich Site Summary, группой RSS-DEV, и
- Atom через IETF, формат широко используется, но все еще определяется.
Эти форматы были определены не просто духом конкуренции, а с определенной целью, что мы будем развивать, чтобы ответить на вопрос, поставленный в названии.
RSS 2.0
Спецификации на французском языке, переведенные мной, размещаются на этом сайте.
Этот формат был определен Дэйвом Виннером с явной целью простоты, свободы и расширяемости. Никаких ограничений по размеру текстов нет. Автор хотел определить ядро, очень простое в реализации и при этом предлагающее возможность бесконечных расширений, но с использованием пространств имен, что равносильно добавлению категории, в которую можно определить все необходимые для того или иного приложения тэги.
RSS 1.0
Спецификации на французском языке, также переведенные мной, размещаются на этом сайте.
В отличие от RSS 2.0, который имеет чистый XML, RSS-версия повторяет первоначальный принцип формата синдикации 0.9 в формате RDF и расширяет его.
Возобновление формата RDF, подробно описанного в спецификации, имеет целью добавить мета-данные к данным, включенным в поток, то есть добавить информацию к теме информации, содержащейся в файле RSS-канала.
Формат также расширяется с помощью модулей, которые являются XML-пространствами имен, как в RSS 2.0.
Мета-данные обеспечивают компьютерную обработку работы, которую можно сделать из документа, поэтому формат 1.0 вписывается в рамки, где хочется узнать, для чего нужен поток. Именно поэтому этот формат используется для синдикации блогов, так как есть сайты, специализирующиеся на анализе блогосферы, стремящиеся узнать тенденции в Сети и группы влияния, и поэтому эти сайты смогут воспользоваться информацией о каналах, предоставляемой RSS 1.0.
Атом
В настоящее время ведется работа над спецификацией, и было предложено определение стандарта под ссылкой на RFC 4287.
Формат был определен для дополнения и замены RSS, который считается недостаточным, поскольку он имеет прежде всего простую цель.
Атом точнее
Тип содержимого тегов, чистый текст или HTML-код указан в Atom, но не в 2.0. Это может помочь программному обеспечению, которое обрабатывает и отображает каналы, хотя большинство ожидает найти чистый текст.
Интегрирование
Atom определяется внутри пространства имен, что позволяет интегрировать его с другими XML-документами без конфликта имен. Можно даже добавить содержимое Atom в RSS-канал 2.0 без коллизий.
Стандартизация
Atom находится в процессе стандартизации, что не приносит ничего большего по сравнению с таким фактическим стандартом, как RSS 2.0. У него есть схема, которая может помочь использовать некоторые XML-программы, но ничто не запрещает писать схему для других форматов, так как их определение заморожено.
Atom записывает даты в стандарт RFC 3339, в то время как в RSS 2.0 нет стандартов. Это не имеет значения, когда ты используешь дату как строку символов для отображения, но формат полезен, если ты хочешь извлечь из нее элементы: год, месяц, день...
Протокол о публикации
Atom предоставляет протокол для публикации или даже редактирования ресурсов на основе HTTP. Доступ к потоку или входу в поток возможен методом GET. А с помощью методов POST и DELETE можно добавлять или удалять новости. Протокол еще не стандартизирован, но позволит реализовать инструменты синдикации.
Помощь ПО
Помимо вышеуказанных спецификаций, Atom предлагает больше помощи в программном обеспечении потоковой обработки. Например, он проводит различие между абсолютными и относительными URL. Требуется несколько дополнительных строк кода с другими форматами.
Заключение
Три формата, три цели:
- Самый простой (хотя и расширяемый) формат - RSS 2.0 .
В значительной степени достаточно для отображения ссылок на статьи сайта. - Получить информацию о канале: RSS 1.0 .
- Использование более сложных программ обработки потоков с более высокими требованиями к формату данных: Atom.
Формат 1.0 часто используется программными средствами управления содержанием, которые автоматически генерируют RSS-файл, блоги, для использования веб-сайтами 2.0, такими как Technorati.
Atom был принят Google для большинства своих сервисов, в то время как такие крупные сайты, как CNN или BBC, предлагают синдикацию своих новостей в RSS 2.0. Обратите внимание, что при показе простого примера потока Atom разница с форматом 2.0 не является вопиющей. То же самое касается файла, предоставленного моим менеджером блога, мета-информацию еще предстоит найти.
Если у вас нет проблем с совместимостью с определенной службой или программным обеспечением для анализа, формат 2.0 оказывается достаточным .
Дополнительная информация
- Гдата. У Google есть собственный протокол публикации, который распознает и форматы Atom, и RSS.