Почему google индексирует страницы вида

Сообщение сайта

(Сообщение закроется через 3 секунды)

Здравствуйте, гость (

| Вход | Регистрация )

SEO форум MaulTalk.com > Поисковая оптимизация > Google

Почему google индексирует страницы вида, http://сайт/пост/feed

Опции

MeTrA

Topic Starter

30.7.2012, 0:11; Ответить: MeTrA

Сообщение #1

Участник

Группа: User
Сообщений: 240
Регистрация: 14.12.2008
Поблагодарили: 71 раз
Репутация:

Почему google индексирует страницы вида http://сайт/пост/feed, хотя в роботс прописаны правила

Disallow: */feed/
Disallow: */feed
Disallow: */?feed=

Кроме этого, индексирует http://сайт/category/название/page/2, хотя есть правило
Disallow: */page/*

Из-за чего это может быть?

Сообщение отредактировал MeTrA - 30.7.2012, 0:12

--------------------

Подбор запросов для поднятия посещаемости, SEO-консультации - недорого, скидки

РЕРАЙТ 1$, каждому 1 бесплатная (пробная) статья

Ответить с цитированием данного сообщения

funkydance funkydance 30.7.2012, 0:40; Сообщений: 1143 Поблагодарили: 284 раза Репутация: 40 Просмотр профиля	30.7.2012, 0:40; Ответить: funkydance Сообщение #2
Старожил Группа: Banned Сообщений: 1143 Регистрация: 9.10.2011 Поблагодарили: 284 раза Репутация: 40	А эти правила для Гугл Бота прописаны? Если стоит User-agent: Google или * то на ваш вопрос ответит только гугл

kauak kauak 30.7.2012, 0:48; Сообщений: 247 Поблагодарили: 46 раз Репутация: 17 Просмотр профиля	30.7.2012, 0:48; Ответить: kauak Сообщение #3
Участник Группа: User Сообщений: 247 Регистрация: 30.10.2011 Из: Украина Поблагодарили: 46 раз Репутация: 17	Несколько выдержек из справки для вебмастеров от Google: Файл robots.txt ограничивает доступ роботов, сканирующих Интернет для поисковых систем, к вашему сайту. Перед обращением к страницам сайта эти роботы автоматически ищут файл robots.txt, который запрещает им доступ к определенным страницам. Файл robots.txt необходим только в том случае, если на вашем сайте есть содержание, которое не следует включать в индекс поисковых систем. Если вы хотите, чтобы поисковые системы включали в свои индексы все содержание вашего сайта, файл robots.txt (даже пустой) не требуется. Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL-адреса, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс. В результате URL страницы, а также другие общедоступные сведения, например текст ссылок на сайт или заголовок из каталога Open Directory Project (www.dmoz.org), могут появиться в результатах поиска Google. Чтобы полностью исключить вероятность появления контента страницы в индексе Google, даже если на нее ссылаются другие сайты, используйте метатег noindex. Если робот Googlebot начнет сканировать страницу, то обнаружит метатег noindex и не станет отображать ее в индексе. Обратите внимание: чтобы увидеть тег noindex, мы должны просканировать вашу страницу, поэтому существует небольшая вероятность, что поисковый робот Googlebot не увидит метатег noindex и не отреагирует на него. Кроме того, если вы заблокировали эту страницу с помощью файла robots.txt, мы также не сможем увидеть этот тег. Подробнее тут: http://alaev.info/blog/post/3013 Сообщение отредактировал kauak - 30.7.2012, 0:48

MeTrA Topic Starter MeTrATopic Starter 31.7.2012, 15:39; Сообщений: 240 Поблагодарили: 71 раз Репутация: 11 Просмотр профиля	Topic Starter 31.7.2012, 15:39; Ответить: MeTrA Сообщение #4
Участник Группа: User Сообщений: 240 Регистрация: 14.12.2008 Поблагодарили: 71 раз Репутация: 11	(funkydance @ 30.7.2012, 2:40) Если стоит User-agent: Google или * то на ваш вопрос ответит только гугл Да для google это прописано в роботс. Нашел в шаблоне темы, закоментированные строчки RSS ленты комментариев, вида http://сайт/пост/feed, может он их индексировал. Но повторюсь они были закоментированы. -------------------- Подбор запросов для поднятия посещаемости, SEO-консультации - недорого, скидки РЕРАЙТ 1$, каждому 1 бесплатная (пробная) статья

contentforsites

1.8.2012, 11:48; Ответить: contentforsites

Сообщение #5

Новичок

Группа: User
Сообщений: 23
Регистрация: 1.8.2012
Поблагодарили: 3 раза
Репутация:

Потому, что robots.txt не всегда помогает

. У самого как-то был подобный случай, только с Яндексом, когда он по каким-то причинам начал индексировать запрещённый в роботсе контент. Когда удалось пробиться в поддержку, ответили, что глюк. Потом страницы пропали.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой

или обратитесь к любому из модераторов.

« Предыдущая тема · Google · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Похожие темы

Тема	Ответов	Автор	Просмотров	Последний ответ
⭐⭐⭐ Google Voice \| Gmail - OLD аккаунты "SMS и звонки" ⭐⭐⭐	14	Chekon	4267	10.4.2024, 11:07 автор: Chekon
Если статья не в индексе Google - она уникальна или нет?	5	uahomka	1424	3.4.2024, 23:56 автор: Liudmila
Google запускает новый браузер элементами искусственного интеллекта	38	arendator	13466	21.3.2024, 18:10 автор: Rebex
Сайт не индексируется в Google без добавления ссылок в адурилку	4	Nekit	1081	20.3.2024, 21:44 автор: MorKer
Google adwords показывает дробное количество конверсий	0	Megaspryt	750	16.3.2024, 23:19 автор: Megaspryt

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 17.4.2024, 12:47

Дизайн