XERN Analytics Bot
SEO-краулер сервиса xern.ru. Эта страница — для администраторов сайтов, заметивших обращения с нашего User-Agent.
Кто мы и что делаем
XERN Analytics — российский сервис SEO-аналитики. По запросу владельца сайта (или его SEO-специалиста) мы периодически обходим сайт и снимаем технические метрики: статусы страниц, теги, скорость отклика, изменения относительно предыдущих сканов.
Если бот сканирует ваш сайт — кто-то из ваших коллег или партнёров подключил его к нашему сервису. Если вы хотите остановить сканирование, см. раздел «Как отключить» ниже.
Идентификация
Бот всегда представляется User-Agent'ом:
XERNAnalyticsBot/1.0 (+https://xern.ru/bot; contact@xern.ru)
IP-адреса исходящих запросов фиксированы за инфраструктурой xern.ru. Если нужен список — напишите нам.
Принципы вежливости
- robots.txt — соблюдаем директивы
Disallow,Allow,Crawl-delayдля нашего User-Agent. - Скорость — не более 1 запроса в секунду на хост по умолчанию (можем ниже, если сайт явно просит).
- 429 Too Many Requests — уважаем заголовок
Retry-Afterи автоматически снижаем нагрузку на остаток скана. - Адаптация — если ваш сайт начал отвечать медленно (p95 > 3с), мы автоматически снижаем скорость вдвое.
- Размер ответа — читаем не более 2 МБ HTML, остальное игнорируем.
- Тип контента — обходим только HTML (текст/xhtml), бинари (PDF/изображения/видео) не качаем.
- Quiet hours — владелец проекта может задать «тихие часы», в которые мы не запускаем сканы.
Как отключить
Несколько способов, любой работает:
- Добавьте в
robots.txt:User-agent: XernAnalyticsBot Disallow: / - Напишите нам — мы добавим домен в общий blocklist.
- Свяжитесь с владельцем проекта в XERN Analytics — он может удалить сайт из мониторинга.
Жалоба или вопрос
Если бот ведёт себя некорректно (игнорирует robots.txt, создаёт чрезмерную нагрузку, нарушает наши же принципы выше) — напишите на contact@xern.ru. Включите:
- Доменное имя вашего сайта
- Дата/время инцидента (по возможности access-log или RPS-график)
- User-Agent и IP-адреса наших запросов
Мы отвечаем в течение рабочего дня.