Добавление сайта

Вы неверно ввели код с картинки
Ошибка. Попробуйте отправить еще раз
Форма отправлена.

Веб-мастеру

Поисковый механизм «Спутника» основывается на классических алгоритмах информационного поиска и собственных разработках команды проекта, который зародился в 2006 году как небольшой стартап энтузиастов.

Сегодня «Спутник» запущен в режиме открытого beta-тестирования с целью усовершенствовать работу сервиса на больших объёмах данных и отладить взаимодействие системы с реальными пользователями.

Общее качество поисковой выдачи обеспечивается поисковыми алгоритмами, обучающую базу для которых формирует служба асессоров. Данные, полученные в ходе beta-тестирования и эксплуатации системы в открытом доступе, позволят улучшить алгоритмы ранжирования и качество работы системы.Технологии «Спутника» направлены на создание безопасного и полезного поискового сервиса, который предоставляет достоверную информацию и защищает пользователя от вредоносного контента, сайтов с порнографическим содержанием, пропагандой употребления наркотиков и другими материалами, нарушающими законодательство Российской Федерации.

Фильтрация ненормативного контента происходит на основе семантического описания указанных предметных областей. Для пользователя поисковой системы семейный фильтр представлен в виде трех возможных настроек: легкий, умеренный и строгий.

Оценку поисковой выдачи для формирования обучающей базы поисковых алгоритмов обеспечивает служба асессоров.

Поисковый робот SputnikBot

Поисковый робот «Спутника» SputnikBot ежедневно обходит сайты русского сегмента интернета. Собранная им информация в дальнейшем обрабатывается и попадает в индекс поисковой системы.

Все запросы поискового робота приходят из подсетей 109.207.13.0/24, 5.143.224.0/21, 95.167.189.0/25. Заголовок User-Agent, посылаемый роботом, выглядит следующим образом: Mozilla/5.0 (compatible; SputnikBot/2.3; +http://corp.sputnik.ru/webmaster). Номер версии бота, в данном случае 2.3, со временем будет увеличиваться.

Чтобы избежать чрезмерной нагрузки на сайты, поисковый робот SputnikBot при загрузке страниц придерживается следующих правил:

  • Если у сайта имеется несколько поддоменов, одновременная загрузка страниц может производиться не более чем с четырёх поддоменов;
  • Страницы с каждого поддомена загружаются последовательно;
  • Минимальная задержка по умолчанию между двумя последовательными запросами к поддомену составляет 2 секунды.

Запретить или разрешить обход и индексацию определённых страниц сайта можно одним из следующих способов:

  • С помощью директив Disallow/Allow в файле robots.txt
  • С помощью meta-тегов robots
  • C помощью HTTP-заголовков X-Robots-Tag

Кроме того, при помощи директивы Crawl-delay в файле robots.txt можно управлять скоростью обхода страниц сайта. При анализе файла robots.txt поисковый робот использует директивы, описанные для User-Agent с именем SputnikBot:

  • User-Agent: SputnikBot
  • Disallow:

Регистр символов в имени бота значения не имеет. Не следует указывать номер версии поискового робота.

В случае если директивы для робота SputnikBot отсутствуют, поисковый робот будет использовать директивы общие для всех роботов:

  • User-Agent: *
  • Disallow: /

Требования к префиксам пути директив Disallow/Allow:

  • пустой префикс директивы Disallow эквивалентен записи Allow: /
  • пустой префикс директивы Allow эквивалентен записи Disallow: /

Все непустые префиксы должны начинаться с символа / . Допускается использование специальных символов:

  • * - обозначает произвольное количество символов в пути (0 и более);
  • $ - обозначает конец пути.

В случае конфликта директив Disallow/Allow используется директива, имеющая более длинный префикс пути; при одинаковой длине префикса приоритет отдаётся директиве Allow. Всё, что не запрещено явным образом, считается разрешённым для загрузки и индексации.

При помощи директивы Crawl-delay можно задать минимальную задержку между двумя последовательными запросами робота к сайту. Значение минимальной задержки может быть дробным:

  • User-Agent: SputnikBot
  • Crawl-delay: 0.1

Для получения дополнительной информации или решения проблем, связанных с работой поискового робота SputnikBot на вашем сайте, обратитесь по адресу abuse@sputnik.ru.