X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

6 страниц V  < 1 2 3 4 5 6 >
Открыть тему
Тема закрыта
> Давайте блокировать ботов в robots.txt
Cott
Cott
Topic Starter сообщение 2.3.2021, 23:59; Ответить: Cott
Сообщение #12


Цитата(WGN @ 2.3.2021, 22:09) *
Так плохих ботов bad bot надо в htceess блокировать чтобы уж наверняка.

Мне с роботсом проще иметь дело, пусть все блоки будут в одном месте.
Да меня несильно данный вопрос напрягает, просто сегодня по настроению вспомнил.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
MetalMessiah
MetalMessiah
сообщение 3.3.2021, 1:41; Ответить: MetalMessiah
Сообщение #13


ТС, объясните мне, для чего блокировать китайский поисковик Baidu или чешский Seznam?
Какой смысл блокировать Teleport Pro, когда этот раритет не подключится ни к одному современному серверу по https из-за несовместимого набора шифров? (а если нет - в настройках проги есть поле для ввода произвольного User-Agent).

Кроме ботов, которых вы перечислили, можно насчитать еще десяток если не сотню всяких бомжей, лазящих по нашим с вами мусорникам :D
Намного хуже когда вас посещает какой-нибудь YandexBot, но IP адрес не принадлежит компании Яндекс. Вот их сначала попробуйте заблокировать, это довольно интересная задачка на ночь.


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Cott
Cott
Topic Starter сообщение 3.3.2021, 2:04; Ответить: Cott
Сообщение #14


Цитата(MetalMessiah @ 3.3.2021, 1:41) *
ТС, объясните мне, для чего блокировать китайский поисковик Baidu или чешский Seznam?
Какой смысл блокировать Teleport Pro, когда этот раритет не подключится ни к одному современному серверу по https из-за несовместимого набора шифров? (а если нет - в настройках проги есть поле для ввода произвольного User-Agent).

Кроме ботов, которых вы перечислили, можно насчитать еще десяток если не сотню всяких бомжей, лазящих по нашим с вами мусорникам :D
Намного хуже когда вас посещает какой-нибудь YandexBot, но IP адрес не принадлежит компании Яндекс. Вот их сначала попробуйте заблокировать, это довольно интересная задачка на ночь.

Мне китайские и чешские поисковики не уперлись. Весь нормальный европейский люд юзает Гугль, по Ru Яндекс и еще немного типа Бинга и тд. У меня локальные клиентские сайты, расположенные далеко от Китая.

Просто и ясно.

ЗЫ Кстати, список почти полностью взят с роботса Wildberries (а там далеко не дураки)

Сообщение отредактировал Cott - 3.3.2021, 2:11
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
WGN
WGN
сообщение 3.3.2021, 20:51; Ответить: WGN
Сообщение #15


Cott,
Дело личное конечно, но высказал мнение))).


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Вентилятор
Вентилятор
сообщение 3.3.2021, 21:44; Ответить: Вентилятор
Сообщение #16


бессмысленная затея. такое на уровне веб-сервера весь нормальный люд блокирует, а не в роботсе


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Cott
Cott
Topic Starter сообщение 3.3.2021, 23:52; Ответить: Cott
Сообщение #17


Цитата(Вентилятор @ 3.3.2021, 21:44) *
бессмысленная затея. такое на уровне веб-сервера весь нормальный люд блокирует, а не в роботсе

Пример блокировки приведите.
В Wilberries не нормальный люд?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Madm
Madm
сообщение 4.3.2021, 0:00; Ответить: Madm
Сообщение #18


Это можно сравнить с объявлением на двери подъезда "наркоманам вход воспрещен!" :rjunimagu:

Не все боты обращают внимание на roots.txt, только культруные :) Так что лучше все таки им 403 отдавать, с помощью .htaccess, или еще на уровне Nginx рубить.

Но смех смехом, а мысль поделиться списком плохих ботов дельная, вот мой :

SetEnvIfNoCase User-Agent JS-Kit bad_bot
SetEnvIfNoCase User-Agent PostRank bad_bot
SetEnvIfNoCase User-Agent Python-urllib bad_bot
SetEnvIfNoCase User-Agent UnwindFetchor bad_bot
SetEnvIfNoCase User-Agent facebookexternalhit bad_bot
SetEnvIfNoCase User-Agent TweetmemeBot bad_bot
SetEnvIfNoCase User-Agent Butterfly bad_bot
SetEnvIfNoCase User-Agent MFE_expand bad_bot
SetEnvIfNoCase User-Agent Java bad_bot
SetEnvIfNoCase User-Agent Summify bad_bot
SetEnvIfNoCase User-Agent MetaURI bad_bot
SetEnvIfNoCase User-Agent FlipboardProxy bad_bot
SetEnvIfNoCase User-Agent ScribdReader bad_bot
SetEnvIfNoCase User-Agent RockMelt bad_bot
SetEnvIfNoCase User-Agent InAGist bad_bot
SetEnvIfNoCase User-Agent NING bad_bot
SetEnvIfNoCase User-Agent TweetedTimes bad_bot
SetEnvIfNoCase User-Agent PaperLiBot bad_bot
SetEnvIfNoCase User-Agent Library bad_bot
SetEnvIfNoCase User-Agent Ezooms bad_bot
SetEnvIfNoCase User-Agent strawberryj bad_bot
SetEnvIfNoCase User-Agent Scooper bad_bot
SetEnvIfNoCase User-Agent Ahrefs bad_bot
SetEnvIfNoCase User-Agent Spider bad_bot
SetEnvIfNoCase User-Agent None bad_bot
SetEnvIfNoCase User-Agent EventMachine bad_bot
SetEnvIfNoCase User-Agent aiHitBot bad_bot
SetEnvIfNoCase User-Agent SolomonoBot bad_bot
SetEnvIfNoCase User-Agent SearchBot bad_bot
SetEnvIfNoCase User-Agent Wget bad_bot
SetEnvIfNoCase User-Agent Crawler bad_bot
SetEnvIfNoCase User-Agent bingbot bad_bot
SetEnvIfNoCase User-Agent Semrush bad_bot
SetEnvIfNoCase User-Agent MJ12 bad_bot
SetEnvIfNoCase User-Agent Mail.RU_Bot bad_bot


--------------------
Услуги администрирования и технической поддержки Linux https://www.madmin.online


Поблагодарили: (2)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Cott
Cott
Topic Starter сообщение 4.3.2021, 0:25; Ответить: Cott
Сообщение #19


Madm, спасибо за дельный ответ. :)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Trumper
Trumper
сообщение 4.3.2021, 0:49; Ответить: Trumper
Сообщение #20


Цитата(Cott @ 3.3.2021, 23:52) *
В Wilberries не нормальный люд?


Сколько у них страниц на сайте, в курсе? )
смотря на каких уровнях
если речь про их админа\сеошника - всякое может быть, не обязательно он прав )
ну это все полемика

по факту же реально тут скорее не
Цитата(Madm @ 4.3.2021, 0:00) *
"наркоманам вход воспрещен!"


А вполне очевидное объявление.
И у многих наверняка закрыто на уровне сервера.


Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Cott
Cott
Topic Starter сообщение 4.3.2021, 1:35; Ответить: Cott
Сообщение #21


Суть темы не как пинать ботов или не пинать, а пополнять список ненужного ботного шлака, шатающегося по сети.
Пока что только Madm ответил по делу, содержательно и со смыслом.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
6 страниц V  < 1 2 3 4 5 6 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Давайте обсудим качество in-page push трафика
0 Boymaster 617 16.4.2024, 22:47
автор: Boymaster
Открытая тема (нет новых ответов) <Braga/> Создание Telegram-ботов, web-приложений, крипто-бирж, сайтов.
2 newbraga 1789 10.3.2024, 22:04
автор: newbraga
Горячая тема (нет новых ответов) В каких тизерных сетях меньше ботов?
37 Boymaster 8483 24.1.2024, 22:13
автор: Boymaster
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыВК: Реальные/целевые подписчики. Оплата за вступивших. Без ботов. Гарантия. Скидки! Тест за отзыв.
96 VilD 68634 17.3.2022, 2:37
автор: Hydra
Открытая тема (нет новых ответов) Разработка ботов под любую рутину. Разгрузи свой график!
1 basmeister 1278 19.12.2020, 13:35
автор: basmeister


 



RSS Текстовая версия Сейчас: 23.4.2024, 23:47
Дизайн