Как самому создать XML Sitemap?

Как самому создать XML Sitemap?

Пару дней назад я писала статью о том, какие бывают карты сайта и насколько важно их использовать на своем сайте. В той статье я упомянула о том, что лучше всего, если у вас будет карта сайта XML. Так как ее большим преимуществом XML Sitemap является возможность использования мета-данных, которые позволяют вам снабдить поисковых роботов дополнительной информацией по каждой странице.

Однако, согласитесь, было бы здорово самому знать в подробностях , каким образом работает такая карта сайта и уметь, если понадобится, сделать ее самому. Поэтому давайте мы попробуем вместе с вами создать простую карту сайта sitemap.xml шаг за шагом.

Тренинг по вёрстке сайта на HTML5 и CSS3

Я подготовила для вас два видеоурока по этой теме.

В первом видео мы с вами посмотрим, из чего состоит файл sitemap.xml, и по шагам разберем, что нужно делать, что создать его самому.




Во втором видео я рассказываю о картах сайта для видеофайлов и картинок, а также то, каким образом можно проверить на работоспособность свой файл sitemap.xml, на наличие ошибок и как дать знать о ней поисковику.



Чтобы вам было удобно, ниже я излагаю основные моменты, затронутые мной в видео.

Создание sitemap.xml:

Шаг 1:

Создайте текстовый файл, назовите его sitemap и сохраните с расширением.xml

Шаг 2:

Далее нам нужно сообщить поисковым роботам информацию по кодировке нашей карты сайта. Мы это проделаем с помощью кода:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
</urlset>

Шаг 3:

Нашим следующим шагом будет добавление ссылок, что мы и сделаем прямо перед закрытием тега urlset. Каждая ссылка добавляется с помощью тега url таким образом:

<url>
    <loc>http://www. vashsait.ru/</loc>
    <lastmod>2013-01-25</lastmod>
    <changefreq>daily</changefreq>
    <priority>1</priority>
</url>

Теперь давайте посмотрим на элементы, которые мы написали:

Тег loc используется для того, чтобы дать ссылку на страницу, которую мы просто пишем внутри него. Это обязательный тег!!!

Остальные теги вы можете использовать или не использовать по своему усмотрению.

Тег lastmod показывает дату, когда в последний раз страница обновлялась.

В теге chahgefreq мы указываем среднее значение того, как часто будет меняться наша страница (hourly - каждый час, daily - ежедневно, weekly - каждую неделю, monthly - каждый месяц, yearly - каждый год, never - никогда).

Также с помощью тега priority мы можем обозначить приоритетность, которая варьируется от 0.0 до 1.0 (по принципу, чем выше, тем важнее).

Или же мы можем не указывать важность, тогда по умолчанию для страницы будет стоять значение 0.5.

Здесь нужно учитывать также то, что если для всех страниц мы поставим максимум важности, то это нам не поможет по большому счету, потому что приоритетность рассматривается относительно других страниц. То есть, если для некоторых мы поставим высокую приоритетность, а для других - среднюю или низкую, в зависимости от их содержания, то это будет намного лучше.

Шаг 4:

Теперь, когда наша карта готова, нам нужно загрузить ее в корневую директорию своего сайта.

Еще несколько вещей, которые нам нужно иметь ввиду при создании карты сайта:

  1. Все ссылки, которые мы там записываем должны идти на один и тот же хост.
  2. Максимальная длина ссылки - 2048 знаков (думаю, что этого будет вполне достаточно smile)
  3. В карте сайта может содержаться максимум 50 000 ссылок.
  4. А также максимальный размер для карты сайта - это 50 MB.

Если ваша карта сайта слишком велика, вы можете разбить ее на несколько частей. В этом случае вам нужно будет создать индексный файл, который будет объединять их в одно целое.

Такой файл выглядит практически так же, как и обычная карта сайта:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www. vashsait.ru/sitemap1.xml</loc>
   </sitemap>
   <sitemap>
      <loc>http://www. vashsait.ru/sitemap2.xml</loc>
   </sitemap>
</sitemapindex>

На примере выше мы можем видеть индексный файл для всех остальных файлов sitemap, объединяющий в себе две карты сайта. Теоретически индексный файл может содержать ссылки максимум на 50 000 карт сайта.

Карты сайта для видеофайлов.

Также вполне возможно создать отдельную карту сайта для видео, которые у вас есть.

Вы можете создать для этого отдельный файл, либо добавить информацию о видео, содержащихся на вашем сайте, в тот же самый файл.

Имейте ввиду, что поисковики анализируют не все видеоформаты, а только некоторые из них (такие как wmv, mp4, mpg, m4v, mpeg, asf, flv, avi, ra, swf и ram).

Давайте посмотрим на пример карты сайта для видео и обсудим ее элементы.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
 <url>
   <loc>http://www. vashsait.ru/video-page.html</loc>
   <video:video>
     <video:thumbnail_loc>http://www. vashsait.ru/video-thumbnail.jpg</video:thumbnail_loc>
     <video:title>Самое лучшее видео!</video:title>
     <video:description>Как сказано в названии, это самое лучшее видео, которое когда-либо было записано!  
     </video:description>
     <video:content_loc>http://www. vashsait.ru/video.mp4</video:content_loc>
     <video:duration>120</video:duration>
   </video:video>
 </url>
</urlset>
  • Тег loc определяет страницу, где находится видео.
  • Тег video:thumbnail используется для того, чтобы отображать картинку видео, которую вы хотите использовать в качестве представления своего видео в разделе кратких обзоров (если такой имеется на вашем сайте).
  • Тег video:title - понятно, что здесь мы пишем название видео.
  • Тег video:description - краткое объяснение того, что содержится в видео.
  • Тег video:content - тут указываете ссылку расположения файла вашего видео на сайте
  • Тег video:duration - длительность видео в секундах.

Список и значения всех тегов вы можете посмотреть в инструментах вебмастера Google.

Если у вас есть какие-то трудности в процессе создания карты сайта для видеофайлов самостоятельно, вы можете использовать генератор видео карт сайта от Google. Он сгенерирует вам код, а вам останется только вставить его в карту сайта.

Карты сайта для картинок.

такие карты сайта будут служить вам незаменимым подспорьем, если вы хотите, чтобы ваши картинки показывались в поисковой выдаче Google, таким образом давая вам больше посетителей. Также как и в случае с картой сайта для видеофайлов, вы можете добавить информацию по своим картинкам в уже существующую карту сайта или же создать для них отдельный файл.

Простая карта для изображений выглядит таким образом:

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
 <url>
   <loc>http:// vashsait.ru/page.html</loc>
   <image:image>
     <image:loc>http:// vashsait.ru/image1.jpg</image:loc>
   </image:image>
   <image:image>
     <image:loc>http:// vashsait.ru/image2.jpg</image:loc>
   </image:image>
 </url>
</urlset>

Первое, что вам нужно сделать, это обозначить страницу, где можно найти изображения с помощью тега loc.

Затем используйте тег image:image, чтобы перечислить все изображения с вашей страницы (вплоть до 1000 штук).

Проверка карты сайта на работоспособность.

Все мы прекрасно знаем о том, как легко ошибкам вкрасться в код, так что замечательной идеей будет проверить созданную самостоятельно карту сайта на работоспособность, чтобы убедиться в том, что в ее код не закрались ошибки.

Я показываю во втором видео, как это можно сделать, используя инструменты для вебмастеров Google, где вы можете протестировать карту сайта перед тем, как подключить ее к поисковой системе.

Сообщите поисковикам о своей карте сайта.

После того, как мы создали и проверили свою карту сайта на работоспособность, самое время дать знать о ней поисковикам. Опять же в видео я показываю, каким образом это можно сделать на примере Google. Также вы можете добавить ссылку на свою карту сайта в файл robots.txt (кстати, об этом я забыла сказать в видео.)

Все что для этого необходимо - просто написать там дополнительную строчку, например:

Sitemap: http://vashsait.ru/sitemap.xml

И если у вас есть несколько файлов с картами сайта, то в файле robots.txt будет достаточно указать только индексный файл.

На этом все, желаю вам удачи и надеюсь, что информация оказалась для вас полезной!

Автор статьи: Елена Лощилова.

Комментариев: 8 RSS

Тренинг по вёрстке сайта на HTML5 и CSS3
Оставьте комментарий!

Вы можете войти под своим логином или зарегистрироваться на сайте.

(обязательно)

Комментариев: 8
  •  Александр | 29 июля 2013 в 18:11:40

    Неожиданно закралась ошибка в тексте статьи smile

    Тег log используется для того, чтобы дать ссылку на страницу, которую мы просто пишем внутри него. Это обязательный тег!!!

    Видимо, тут имеется в виду тег loc

    •  Alex | 5 сентября 2016 в 21:59:07

      Ничего не понял. У меня на сайте более 2000 картинок. Это что я должен в ручную писать ссылки картинок для своего image sitemap Какой программой это можно сделать? Сайт на DLE.

  •  Елена | 30 июля 2013 в 17:51:19

    Спасибо, Александр smile Исправила...

  •  Санек | 15 марта 2014 в 23:34:18

    Спасибо. Полезный урок.

  •  Санек | 15 марта 2014 в 23:44:32

    А есть что нибудь в таком роде, про robots.txt? Спасибо еще раз smile.

  •  Елена | 20 марта 2014 в 06:13:47

    Пожалуйста, Александр. smile К сожалению, про robots.txt нет уроков...

    •  ehtimal | 4 февраля 2016 в 21:35:20

      Здравствуйте Елена, все установил так как надо еще раньше. А теперь не знаю почему ткая фигня. Вот ссылка на xml -карту arts-portrait.ru/sitemap.xml

      •  Сергей | 13 июля 2016 в 15:27:10

        Здравствуйте! Спасибо очень актуальная информация