Карта сайта — файл sitemap.xml

Ромчик
0

sitemap.xml - карта сайтаДоброе время суток. Сегодня я хочу немного отвлечься от WordPress и поговорить о поисковых системах. Точнее затронуть тему составления карты сайта для того, чтобы помочь поисковым роботам наиболее грамотно индексировать наш ресурс. Но хочу сразу заметить, что составление карты сайта (файла sitemap.xml) не гарантирует индексирование Вашего ресурса. Sitemap.xml — это всего лишь рекомендация для индексирования. Пожалуй начнем…

Для начала давайте разберемся, что такое карта сайта (sitemap)? Sitemap — это файл в формате xml, который содержит список URL и некоторые метаданные (информацию о приоритете, последнее изменение и о вероятной частоте изменения). Данный файл помогает поисковикам более грамотно индексировать Ваш ресурс. Но учтите наличие файла sitemap.xml не дает гарантии, что страница будет проиндексирована роботом.
Теперь давайте остановимся на формате файла sitemap.
Формат протокола файла sitemap состоит из xml-тегов. Кодировка файла — UTF8. Все значения в файле sitemap должны маскироваться.  Под маскировкой понимается маскировка всех перечисленных в таблице символов.

Символ Маскирование
Амперсанд & &
Одинарные кавычки '
Двойные кавычки « "
Больше > >
Меньше < &lt;

Пример файла sitemap.xml:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
     <loc>http://www.example.com/</loc>
     <lastmod>2005-01-01</lastmod>
     <changefreq>monthly</changefreq>
     <priority>0.8</priority>
  </url>
  <url>
     <loc>http://www.example.com/catalog?item=12&amp;desc=vacation_hawaii</loc>
     <changefreq>weekly</changefreq>
  </url>
  <url>
     <loc>http://www.example.com/catalog?item=73&amp;desc=vacation_new_zealand</loc>
     <lastmod>2004-12-23</lastmod>
     <changefreq>weekly</changefreq>
  </url>
  <url>
     <loc>http://www.example.com/catalog?item=74&amp;desc=vacation_newfoundland</loc>
     <lastmod>2004-12-23T18:00:15+00:00</lastmod>
     <priority>0.3</priority>
  </url>
  <url>
     <loc>http://www.example.com/catalog?item=83&amp;desc=vacation_usa</loc>
     <lastmod>2004-11-23</lastmod>
  </url>
</urlset>

Теперь давайте разберемся с определениями XML-тегов.

Тег  Обязательный  Описание
 <urlset>  Да  Указывает стандарт данного файла
 <url>  Да  Это родительский тег для каждой записи URL. Все остальные теги являются дочерними этому тегу.
 <loc>  Да  Непосредственно адрес страницы. Длина не должна превышать 2048 символов.
 <lastmod>  Нет  Дата последнего изменения файла. Указывается в формате ГГГГ-ММ-ДД
 <changefreq>  Нет  Вероятная частота изменения данной страницы. Может содержать следующие параметры:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never
 <priority>  Нет  Приоритетность страницы относительно других страниц на этом ресурсе. Принимает значение от 0,0 до 1,0. Значение по умолчанию для страницы равно 0,5.

Ограничения накладываемые на sitemap.xml
В файле sitemap должно быть не более 50000 URL, а размер самого файла не должен превышать 10 МБ. Для того, чтобы уменьшить размер данного файла можно его сжимать с помощью архиватора gzip. Также на сайте можно использовать несколько sitemap, которые должны быть объединены с помощью специального файла индекса sitemap.
Пример индекса файла sitemap:


<?xml version="1.0" encoding="UTF-8"?>
<a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_sitemapindex">sitemapindex</a> xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_sitemap">sitemap</a>
      <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_loc">loc</a>http://www.example.com/sitemap1.xml.gz</loc>
      <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_lastmod">lastmod</a>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_sitemap">sitemap</a>
      <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_loc">loc</a>http://www.example.com/sitemap2.xml.gz</loc>
      <a href="http://www.sitemaps.org/ru/protocol.html#sitemapIndex_lastmod">lastmod</a>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

 Тег  Обязательный Описание
 <sitemapindex>  Да  Содержит информацию о всех файлах sitemap
 <sitemap>   Да  Содержит информацию о каждом файле sitemap
 <loc>   Да  Указывает местоположение файла sitemap
 <lastmod>  Нет  Указывает дату последнего изменения текущего файла sitemap

Мы рассмотрели с Вами необходимость создания карты сайта, так называемого файла sitemap. Разобрали структуру и определили значения всех тегов данного файла. А также коснулись ограничений, которые накладываются на него.
И как мы видим создание данного файла в ручную достаточно трудоемкая работа и не очень благодарная работа. И тут нам на помощь приходит замечательный плагин Google XML Sitemaps, который автоматически создает карту сайта. Но об этом мы поговорим в следующей статье, так что не пропускайте выхода новых постов, подписавшись на RSS-рассылку моего блога. А пока все.
Всем удачного освоения CMS WordPress.

Понравилась статья? Поделись с друзьями.
  • Add to favorites
  • Добавить ВКонтакте заметку об этой странице
  • Twitter
  • Facebook
  • Мой Мир
  • LiveJournal
  • Одноклассники
  • Блог Я.ру
  • MySpace
  • FriendFeed
  • В закладки Google
  • Google Buzz
  • Яндекс.Закладки
  • Reddit
  • StumbleUpon
  • Technorati
  • del.icio.us
  • БобрДобр
  • LinkedIn
  • Memori.ru
  • Сто закладок
  • Blogger

©2012-2017 По всем вопросам обращайтесь через форму обратной связи

Яндекс.Метрика