X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Яндекс не понимает User-agent: *, Яндекс перестал понимать User-agent: *
salamandra
salamandra
Topic Starter сообщение 17.6.2010, 21:56; Ответить: salamandra
Сообщение #1


После сегодняшнего АПа, в индекс одного из сайтов попало +18к страниц (было 18к). Такой массы страниц не добавлял, все дубли закрыты. Начал смотреть что-же такое, и что Яндекс запихнул в индекс.

Обнаружил в индексе страницы которые закрыты в файле robots.txt.

Disallow: /profile.php?*lookup=

Начал проверять через Вебмастер - "Анализ robots.txt" и обнаружил что страницы данного вида индексируются, а внизу "Используемые секции" не обнаружил User-agent: *, а обнаружил только User-agent: Yandex (в этой секции о профилях ничего небыло).

Раньше все было норм, когда составлял robots.txt проверял через "Анализ robots.txt". То есть было и User-agent: * и User-agent: Yandex

Только что полностью убрал секцию User-agent: Yandex, оставил только User-agent: * и Профили снова "запрещены".

Вывод: если присутствует User-agent: Yandex, Яндекс бот не смотрит на User-agent: *

Такое уже давно? Или я только проснулся?

Может кто ответит наконец?

Сообщение отредактировал salamandra - 17.6.2010, 22:32
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
_Dave_
_Dave_
сообщение 19.6.2010, 16:25; Ответить: _Dave_
Сообщение #2


На форуме давно говорят что всегда для Яндекса прописывайте отдельные команды в robots

Сообщение отредактировал _Dave_ - 19.6.2010, 16:25


--------------------
Забанен по совокупности нарушений
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Vibos
Vibos
сообщение 19.6.2010, 16:34; Ответить: Vibos
Сообщение #3


В панельке вебмастера написанно, что если есть директива User-agent: Yandex, то все что в User-agent: * игнорируется. Так что дублируйте все правила с "User-agent: *" в "User-agent: Yandex"
Сам когда-то на это попался.

http://help.yandex.ru/webmaster/?id=996567#996568
В роботе Яндекса используется сессионный принцип работы, на каждую сессию формируется определенный пул страниц, которые планирует закачать робот. Сессия начинается с закачки robots.txt сайта, если его нет, он не текстовый или на запрос робота возвращается HTTP-код отличный от '200', считается, что доступ роботу не ограничен. В самом robots.txt проверяется наличие записей, начинающихся с 'User-agent:', в них ищутся подстроки 'Yandex', либо '*' (регистр значения не имеет), причем, если обнаружено 'User-agent: Yandex', директивы для 'User-agent: *' не учитываются. Если записи 'User-agent: Yandex' и 'User-agent: *' отсутствуют, считается, что доступ роботу не ограничен.


Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.


Сообщение отредактировал Vibos - 19.6.2010, 16:36
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыНастройка яндекс директ рекламы БЕЗ РАСХОДОВ БЮДЖЕТА
Количество продаж будет ОГРАНИЧЕННО!
22 ITstaf 4418 23.4.2024, 21:00
автор: 100ftd
Открытая тема (нет новых ответов) Аналоги Яндекс Директ
4 kuz999 1850 23.4.2024, 18:55
автор: xramoviy
Открытая тема (нет новых ответов) Atlantic 2.0 - для безлимитного решения кликами Recaptcha и кликовой капчи Яндекс
3 waterworld 1631 14.3.2024, 12:29
автор: waterworld
Открытая тема (нет новых ответов) Где дешевле клики в Яндекс.Директ или Таргет ВК?
2 rownong27 1007 18.2.2024, 9:49
автор: rownong27
Открытая тема (нет новых ответов) Как в Яндекс.Директ задать для компании дневное ограничение бюджета?
0 rownong27 1030 16.2.2024, 16:18
автор: rownong27


 



RSS Текстовая версия Сейчас: 25.4.2024, 4:00
Дизайн