Запрет на индесацию всех роботов

Сообщение сайта

(Сообщение закроется через 3 секунды)

Здравствуйте, гость (

| Вход | Регистрация )

SEO форум MaulTalk.com > Поисковая оптимизация > Поисковая оптимизация (SEO)

Запрет на индесацию всех роботов

Опции

HashMan

Topic Starter сообщение

23.4.2007, 7:56; Ответить: HashMan

Сообщение #1

Новичок

Группа: Viewer
Сообщений: 6
Регистрация: 22.4.2007
Из: Саратова
Поблагодарили: 0 раз
Репутация:

Скажите пожалуйста, что надо прописать в robots.txt, чтобы зпретить индексацию всех поисковых роботов?

--------------------

Регистрация в закрытой сети каталогов

Ответить с цитированием данного сообщения

ig0r ig0r 23.4.2007, 15:49; Сообщений: 794 Поблагодарили: 276 раз Репутация: 53 Просмотр профиля	23.4.2007, 15:49; Ответить: ig0r Сообщение #2
0.о Группа: Active User Сообщений: 794 Регистрация: 19.4.2007 Из: ДС Поблагодарили: 276 раз Репутация: 53	Возможны два вида ограничений: 1) Файл robots.txt в корневом каталоге сервера позволяет удалить из индекса сервер целиком, отдельные директории сервера и, непосредственно перечисленные отдельные файлы. Семантика директив в файле robots.txt: User-agent: * Disallow: / # Удаляет из индексирования весь сервер целиком или User-agent: * Disallow: /cgi-bin/ # Удаляет из индексирования директорию Disallow: /info/fakeinfo.html # Удаляет из индексирования файл Строка User-agent: указывает, что последующие директивы Disallow: относятся к указанному роботу. Символ * означает, что директивы предназначаются всем роботам. Если робот специфицирован непосредственно, то он рассматривает только предназначающиеся ему директивы, и не учитывает директивы, перечисленные в разделе User-agent: . Для указания директив непосредственно Googlebot, необходимо задать имя робота: User-agent: Googlebot Файл robots.txt может содержать несколько наборов директив, например, для всех роботов () и для некоторох роботов непосредственно, предваряемые соответствующими строками User-agent: *, User-agent: Googlebot, и т.д. Количество последующих директив Disallow: не ограничено, и каждая последующая должна размещаться в новой строке. Каждая директива должна содержать только один путь или имя файла. Перечисления, например, "Disallow: /cgi-bin/ /mydir/" или "Disallow: /cgi-bin/;/mydir/" не поддерживаются. Символ # указывает на начало комментария, и часть строки после этого символа роботом не рассматривается. 2) Мета-Теги, внутри HTML страницы позволяют ограничивать индексирование данной страницы сайта. Мета-Тег добавляется в раздел <HEAD> страницы, и также как и в случае с файлом robots.txt, ограничение может относиться либо ко всем роботам, либо непосредственно к указанному. Теги: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> или <META NAME="WEBALTA" CONTENT="NOINDEX, NOFOLLOW"> запрещают индексировать страницу всем роботам, или только Googlebot, соответственно. Теги: <META NAME="ROBOTS" CONTENT="NOFOLLOW"> или <META NAME="Googlebot" CONTENT="NOFOLLOW"> Разрешают индексировать страницу, но запрещают переходить по внешним ссылкам всем роботам, или только Googlebot, соответственно. Теги: <META NAME="ROBOTS" CONTENT="NOINDEX"> или <META NAME="Googlebot" CONTENT="NOINDEX"> запрещают индексировать страницу, но позволяют переходить по внешним ссылкам всем роботам, или только Googlebot, соответственно. Также, возможно одновременное размещения нескольких Мета-Тегов, ограничивающих индексирование, как для всех роботов, так и для непосредственно указанных. В этом случае, непосредственно указанный робот Googlebot принимает ограничения, как сумму из указанных ему и указанных для всех роботов.

VitVus VitVus 29.4.2007, 13:05; Сообщений: 4 Поблагодарили: 0 раз Репутация: 0 Просмотр профиля	29.4.2007, 13:05; Ответить: VitVus Сообщение #3
Новичок Группа: Viewer Сообщений: 4 Регистрация: 29.4.2007 Поблагодарили: 0 раз Репутация: 0	Как запретить индексацию некоторых страниц Яндекс боту и гугл боту, а другим разрешить, я че то прописывал запрет на яндекс и гугл, указываю каталогу ссылку, он говорит стоит запрет всем роботам...

ig0r ig0r 29.4.2007, 13:29; Сообщений: 794 Поблагодарили: 276 раз Репутация: 53 Просмотр профиля	29.4.2007, 13:29; Ответить: ig0r Сообщение #4
0.о Группа: Active User Сообщений: 794 Регистрация: 19.4.2007 Из: ДС Поблагодарили: 276 раз Репутация: 53	Примерно так: User-agent: Googlebot Disallow: /cgi-bin/ # Удаляет из индексирования директорию Disallow: /info/fakeinfo.html # Удаляет из индексирования файл

Zla Zla 19.5.2007, 21:45; Сообщений: 15 Поблагодарили: 0 раз Репутация: 0 Просмотр профиля	19.5.2007, 21:45; Ответить: Zla Сообщение #5
Новичок Группа: Viewer Сообщений: 15 Регистрация: 19.5.2007 Поблагодарили: 0 раз Репутация: 0	Отличная познавательная инфа. Большне нигде не встречал, чтобы так терпеливо всё объяснили. Спасибо!

tulvit tulvit 1.6.2007, 22:57; Сообщений: 143 Поблагодарили: 2 раза Репутация: 0 Просмотр профиля	1.6.2007, 22:57; Ответить: tulvit Сообщение #6
Участник Группа: User Сообщений: 143 Регистрация: 1.6.2007 Поблагодарили: 2 раза Репутация: 0	Скажите пожалуйста, что надо прописать в robots.txt, чтобы зпретить индексацию всех поисковых роботов? Яндекс вам в помощь! вот нарыл интересный мануал на русском http://robotstxt.org.ru/

BumBah BumBah 1.9.2007, 23:20; Сообщений: 26 Поблагодарили: 0 раз Репутация: -1 Просмотр профиля	1.9.2007, 23:20; Ответить: BumBah Сообщение #7
Новичок Группа: User Сообщений: 26 Регистрация: 29.8.2007 Поблагодарили: 0 раз Репутация: -1	(ig0r @ 29.4.2007, 9:29) Примерно так: User-agent: Googlebot Disallow: /cgi-bin/ # Удаляет из индексирования директорию Disallow: /info/fakeinfo.html # Удаляет из индексирования файл А Гуглу всё это по барабану. Забудьте о robots.txt, изучайте матчасть по htaccess Сообщение отредактировал BumBah - 1.9.2007, 23:22

LEXENUS LEXENUS 16.9.2007, 23:02; Сообщений: 1230 Поблагодарили: 430 раз Репутация: 83 Просмотр профиля	16.9.2007, 23:02; Ответить: LEXENUS Сообщение #8
Старожил Группа: Active User Сообщений: 1230 Регистрация: 24.8.2007 Из: SPb Поблагодарили: 430 раз Репутация: 83	Скажите пожалуйста а как отредактировать фаил robots.txt я его найти немогу сайт на юкосе

Fred Fred 17.9.2007, 2:16; Сообщений: 16 Поблагодарили: 0 раз Репутация: 0 Просмотр профиля	17.9.2007, 2:16; Ответить: Fred Сообщение #9
Новичок Группа: User Сообщений: 16 Регистрация: 15.9.2007 Поблагодарили: 0 раз Репутация: 0	Подскажите пожалуйста еще: как склеить с помощью robots.txt 3 сайта. (2-идентичные 1-идентичен на 95%). Имеет ли вообще значение идентичный на них контент или нет. ------------------------------------------------- Сайт студентов - http://gr823.spb.ru. Мебель - http://tron.spb.ru

Dizman

17.9.2007, 19:22; Ответить: Dizman

Сообщение #10

Новичок

Группа: Viewer
Сообщений: 2
Регистрация: 17.9.2007
Поблагодарили: 0 раз
Репутация:

Скажите пожалуйста а как отредактировать фаил robots.txt я его найти немогу сайт на юкосе

нужно создать вручную в блокноте и залить на сервер.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой

или обратитесь к любому из модераторов.

« Предыдущая тема · Поисковая оптимизация (SEO) · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Похожие темы

Тема	Ответов	Автор	Просмотров	Последний ответ
В Совфеде рассказали о возможной с 1 марта 2024 года блокировке всех VPN-сервисов	30	Room	5157	17.3.2024, 18:43 автор: Rebex
CapMonster Cloud - Автоматическое распознавание всех видов капч	20	nuaru_	6075	18.1.2024, 15:30 автор: nuaru_
Secretsline VPN - скорость до 100 мбит/c. Без логов. Для всех платформ.	2	Secrets_Line	2560	30.3.2022, 12:49 автор: EvilGomel
ClickDealer - Офферы во всех вертикалях и ГЕО. Своя дейтинг смартлинка.	79	ClickDealer	27110	9.2.2022, 11:45 автор: ClickDealer
Списки всех зарегистрированных доменов с указанными NS адресами	11	phosphoruss	8706	4.11.2021, 21:07 автор: phosphoruss

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 25.4.2024, 8:46

Дизайн