Какой формат синдикации выбрать, Atom или RSS 2.0

?

Хотя в прошлом были предложены и другие решения, появились три формата синдикации:
- RSS 2.0, или Really Simple Syndication, Гарвард
- RSS 1.0, или Rich Site Summary, группой RSS-DEV, и
- Atom через IETF, формат широко используется, но все еще определяется.

Эти форматы были определены не просто духом конкуренции, а с определенной целью, что мы будем развивать, чтобы ответить на вопрос, поставленный в названии.

RSS 2.0

Спецификации на французском языке, переведенные мной, размещаются на этом сайте.
Этот формат был определен Дэйвом Виннером с явной целью простоты, свободы и расширяемости. Никаких ограничений по размеру текстов нет. Автор хотел определить ядро, очень простое в реализации и при этом предлагающее возможность бесконечных расширений, но с использованием пространств имен, что равносильно добавлению категории, в которую можно определить все необходимые для того или иного приложения тэги.

RSS 1.0

Спецификации на французском языке, также переведенные мной, размещаются на этом сайте.
В отличие от RSS 2.0, который имеет чистый XML, RSS-версия повторяет первоначальный принцип формата синдикации 0.9 в формате RDF и расширяет его.
Возобновление формата RDF, подробно описанного в спецификации, имеет целью добавить мета-данные к данным, включенным в поток, то есть добавить информацию к теме информации, содержащейся в файле RSS-канала.
Формат также расширяется с помощью модулей, которые являются XML-пространствами имен, как в RSS 2.0.
Мета-данные обеспечивают компьютерную обработку работы, которую можно сделать из документа, поэтому формат 1.0 вписывается в рамки, где хочется узнать, для чего нужен поток. Именно поэтому этот формат используется для синдикации блогов, так как есть сайты, специализирующиеся на анализе блогосферы, стремящиеся узнать тенденции в Сети и группы влияния, и поэтому эти сайты смогут воспользоваться информацией о каналах, предоставляемой RSS 1.0.

Атом

В настоящее время ведется работа над спецификацией, и было предложено определение стандарта под ссылкой на RFC 4287.
Формат был определен для дополнения и замены RSS, который считается недостаточным, поскольку он имеет прежде всего простую цель.

Атом точнее

Тип содержимого тегов, чистый текст или HTML-код указан в Atom, но не в 2.0. Это может помочь программному обеспечению, которое обрабатывает и отображает каналы, хотя большинство ожидает найти чистый текст.

Интегрирование

Atom определяется внутри пространства имен, что позволяет интегрировать его с другими XML-документами без конфликта имен. Можно даже добавить содержимое Atom в RSS-канал 2.0 без коллизий.

Стандартизация

Atom находится в процессе стандартизации, что не приносит ничего большего по сравнению с таким фактическим стандартом, как RSS 2.0. У него есть схема, которая может помочь использовать некоторые XML-программы, но ничто не запрещает писать схему для других форматов, так как их определение заморожено.
Atom записывает даты в стандарт RFC 3339, в то время как в RSS 2.0 нет стандартов. Это не имеет значения, когда ты используешь дату как строку символов для отображения, но формат полезен, если ты хочешь извлечь из нее элементы: год, месяц, день...

Протокол о публикации

Atom предоставляет протокол для публикации или даже редактирования ресурсов на основе HTTP. Доступ к потоку или входу в поток возможен методом GET. А с помощью методов POST и DELETE можно добавлять или удалять новости. Протокол еще не стандартизирован, но позволит реализовать инструменты синдикации.

Помощь ПО

Помимо вышеуказанных спецификаций, Atom предлагает больше помощи в программном обеспечении потоковой обработки. Например, он проводит различие между абсолютными и относительными URL. Требуется несколько дополнительных строк кода с другими форматами.

Заключение

Три формата, три цели:

  1. Самый простой (хотя и расширяемый) формат - RSS 2.0 .
    В значительной степени достаточно для отображения ссылок на статьи сайта.
  2. Получить информацию о канале: RSS 1.0
  3. .
  4. Использование более сложных программ обработки потоков с более высокими требованиями к формату данных: Atom.

Формат 1.0 часто используется программными средствами управления содержанием, которые автоматически генерируют RSS-файл, блоги, для использования веб-сайтами 2.0, такими как Technorati.
Atom был принят Google для большинства своих сервисов, в то время как такие крупные сайты, как CNN или BBC, предлагают синдикацию своих новостей в RSS 2.0. Обратите внимание, что при показе простого примера потока Atom разница с форматом 2.0 не является вопиющей. То же самое касается файла, предоставленного моим менеджером блога, мета-информацию еще предстоит найти.
Если у вас нет проблем с совместимостью с определенной службой или программным обеспечением для анализа, формат 2.0 оказывается достаточным .

Дополнительная информация