X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Правильно ли составил robots.txt
rownong27
rownong27
Topic Starter сообщение 8.8.2017, 4:58; Ответить: rownong27
Сообщение #1


Здравствуйте.
Я составил robots для сайта (внизу указаны боты, чтобы сайт не посещали): https://goo.gl/PZ1qYW

Вопросы:
1. Корректно ли составлен robots.txt? Если есть замечания, то напишите.
2. Нет ли там каких-то пересечений (чтобы не получилось так, что для ботов перекрыл посещение сайта в Disallow: / , а в итоге перекрыл для всех поисковиков)?
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Антоныч88
Антоныч88
сообщение 8.8.2017, 9:11; Ответить: Антоныч88
Сообщение #2


Доброго всем утра!

Нет не правильно составили.

Мне кажется, что будет правильнее так:


User-agent: Yandex
Disallow: /cabinet
Disallow: /*ref=
Disallow: /presentation
Disallow: /portfolio/perevozka
Disallow: /?*

Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term&utm_id

Sitemap: http://site.ru/sitemap.xml

Host: site.ru


User-agent: Googlebot
Disallow: /cabinet
Disallow: /*ref=
Disallow: /presentation
Disallow: /portfolio/perevozka
Disallow: /?*

Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term&utm_id

Sitemap: http://site.ru/sitemap.xml

User-agent: Bingbot
Disallow: /cabinet
Disallow: /*ref=
Disallow: /presentation
Disallow: /portfolio/perevozka
Disallow: /?*

Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term&utm_id


Sitemap: http://site.ru/sitemap.xml

User-agent: Slurp
Disallow: /cabinet
Disallow: /*ref=
Disallow: /presentation
Disallow: /portfolio/perevozka
Disallow: /?*

Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term&utm_id



Sitemap: http://site.ru/sitemap.xml



User-agent: Mail.Ru
Disallow: /cabinet
Disallow: /*ref=
Disallow: /presentation
Disallow: /portfolio/perevozka
Disallow: /?*

Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term&utm_id


Sitemap: http://site.ru/sitemap.xml



User-agent: AhrefsBot
Disallow: /

User-agent: MJ12bot
Disallow: /

User-agent: statdom.ru
Disallow: /

User-agent: oBot
Disallow: /

User-agent: DotBot
Disallow: /

User-agent: openstat.ru
Disallow: /

User-agent: BLEXBot
Disallow: /

User-agent: SemrushBot
Disallow: /

User-agent: SemrushBot-SA
Disallow: /

User-agent: uCrawlr
Disallow: /

PS: Яндекс бота я поставил тут вместо для всех ботов (*), вероятнее всего его Вы забыли, а * лучше использовать для тех ботов которым Вы хотите закрыть доступ, но я точно не знаю, что Вы в конечном итоге хотите)

Сообщение отредактировал Антоныч88 - 8.8.2017, 9:23


--------------------
Выполняю недорогие прогоны по сайтам с ИКС
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 8.8.2017, 10:27; Ответить: genjnat
Сообщение #3


Непонятно зачем Clean-param, если у вас не популярный форум или мощный сайт которого боты задалбываю. А судя по Disallow: /portfolio/perevozka это не так.
Как выше заметили, правила для каждого бота нужно прописать отдельно (а не перечислять в одном ботов), но непонятно зачем, если для всех ботов они идентичные. Достаточно User-agent: *
Непонятно зачем блокировать каких-то ботов, опять же, если они не создают проблем с нагрузкой.
И без сайта, в любом случае ответить не получится.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
rownong27
rownong27
Topic Starter сообщение 8.8.2017, 20:21; Ответить: rownong27
Сообщение #4


Спасибо за ответы.

Цитата(genjnat @ 8.8.2017, 10:27) *
Достаточно User-agent: *
Непонятно зачем блокировать каких-то ботов, опять же, если они не создают проблем с нагрузкой.

ДО этого я заметил что Google не понимает "Достаточно User-agent: *" для него нужно прописывать отдельно "User-agent: Googlebot"
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 8.8.2017, 22:10; Ответить: genjnat
Сообщение #5


Цитата(rownong27 @ 8.8.2017, 19:21) *
Google не понимает "Достаточно User-agent: *


Не понимает, так не понимает...
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Illegal
Illegal
сообщение 9.8.2017, 21:02; Ответить: Illegal
Сообщение #6


rownong27, Прошу прощения за оффтоп, но как это не читает? Заходим в гугл вебмастер, выбираем проверочку Robots.txt и он всё показывает, что и как читает, так-же есть ф-ция "посмотреть, как гуглбот" и смотрим, что он всё видит (PS: Этой функцией можно загонять удалённые DMCA ссылочки, делаем на другой урл 301й, и вбиваем, и воаля"). Он это читает, но последнее время, я заметил, даже за яндексом, что он, иногда, может просто игнорировать написанное в роботсе.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Учимся правильно отвечать
17 falken 21625 13.7.2020, 18:13
автор: falken
Открытая тема (нет новых ответов) Как правильно купить сайт?
6 magnet 2757 9.3.2020, 18:54
автор: Plya
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыСколько денег правильно реинвестировать?
4 Bilish 1155 20.1.2020, 19:03
автор: Santey
Открытая тема (нет новых ответов) Как правильно называется такой шаблон?
1 sc2r2bey 3155 17.12.2019, 21:10
автор: Ostromir
Горячая тема (нет новых ответов) Услуги по сбору новостей .txt для ваших сайтов, любые тематики + Отзывы
Импорт в DLE, WP (Xml, SQL) с отложенной публикацией под заказ
138 Akira 79098 12.8.2019, 21:28
автор: neonix


 



RSS Текстовая версия Сейчас: 24.4.2024, 18:19
Дизайн