Помощник
|
Грабер, Воруют контент. |
genjnat
|
Сообщение
#1
|
||
|
|
||
|
|||
Danko |
11.10.2009, 19:59;
Ответить: Danko
Сообщение
#2
|
|
Примерно так собираю статистику когда надо. Но отбиваться так не пробовал. Но посути должно работать. Удачи. Ненавижу когда контент воруют - сам никогда не юзаю контент без изменений, а вот некоторым это в кайф...
ВСТАВЛЯЕТСЯ В ШАБЛОН В сам index.php .!!! Надеюсь понятно, что надо сделать if($_SERVER['REMOTE_ADDR']=="10.10.10.10") { //содержимое index.php шаблона } else { echo "Бот иди в Анус :) "; } Чуть не забыл, бот может грабить именно RRS потоки. Так что стоит заставить WP выводить не полные новости в ленту новостей. Сообщение отредактировал Danko - 11.10.2009, 20:07 |
|
|
genjnat
|
Сообщение
#3
|
|
ВСТАВЛЯЕТСЯ В ШАБЛОН В сам index.php .!!! Надеюсь понятно, что надо сделать if($_SERVER['REMOTE_ADDR']=="10.10.10.10") Чуть не забыл, бот может грабить именно RRS потоки. Так что стоит заставить WP выводить не полные новости в ленту новостей.{ //содержимое index.php шаблона } else { echo "Бот иди в Анус :) "; } Не совсем, разжуйте, если не сложно. В ррс отдаю только краткое описание. А подскажите пожалуста, если работает грабер, то ссылки находящиеся в статье, код контекстной рекламы и т.д., должны сохранится как есть, или грабер может это чистить? Сейчас посмотрел исходный код страниц на сате - воре, все вычещено. Сообщение отредактировал genjnat - 11.10.2009, 20:14 |
|
|
Danko |
11.10.2009, 20:28;
Ответить: Danko
Сообщение
#4
|
|
Для каждого сайта можно написать или подстроить под него свой парсер. Мой например не надо подстраивать он все сам делает, правда не 100% результат, но 85-90% имею.
Что именно не понятно? |
|
|
genjnat
|
Сообщение
#5
|
|
Для каждого сайта можно написать или подстроить под него свой парсер. Мой например не надо подстраивать он все сам делает, правда не 100% результат, но 85-90% имею. Что именно не понятно? Я должен просто скопировать этот код, и вставить его в index.php ? вот мой index.php <?php /** * Front to the WordPress application. This file doesn't do anything, but loads * wp-blog-header.php which does and tells WordPress to load the theme. * * @package WordPress */ /** * Tells WordPress to load the WordPress theme and output it. * * @var bool */ define('WP_USE_THEMES', true); /** Loads the WordPress Environment and Template */ require('./wp-blog-header.php'); ?> Куда именно вставить? Сообщение отредактировал genjnat - 11.10.2009, 20:35 |
|
|
larstas |
11.10.2009, 20:38;
Ответить: larstas
Сообщение
#6
|
|
Danko, Т.е. если Ваш айпишник не 10.10.10.10, то Вы бот! Идеальное решение! Супер! и посетителей и яшо-гуглоботов отшить с сайта.
genjnat, код в принципе почти норм. НО! Вставьте в индексную .php страницу Вашего сайта в самом верху после <?php строку if($_SERVER['REMOTE_ADDR']=="IP_BOTA") die("Вам здесь не место"); Заменив IP_BOTA на айпишник, с которого парсят. Еще вариант - прямо через .htaccess: order allow,deny deny from 1.1.1.1 allow from all 1.1.1.1 - снова заменяем на айпишник парсящего Однако незадача: возможно парсят Вас через проксю или с динамического айпишника из дома (как у моего провайдера, например). Тогда уж вы вряд ли сможете остановить человека Сообщение отредактировал larstas - 11.10.2009, 20:39 -------------------- |
|
|
Danko |
11.10.2009, 20:42;
Ответить: Danko
Сообщение
#7
|
|
larstas - верно можно и так. а про 10.10.10.10 - это для примера - видно что айпишник, думаю можно догадаться что вместо примера надо поставить пайпи с которого парсят. Если прсят с динамических айпи и при этом парсер не маскируется под браузеры - можно залочить и с помощью других параметров. Но если бот - каждый раз меняет и это, будет намного сложнее... если вообще возможно.
|
|
|
larstas |
11.10.2009, 20:44;
Ответить: larstas
Сообщение
#8
|
|
Danko, я имел в виду вот эту часть вашего кода:
if($_SERVER['REMOTE_ADDR']=="10.10.10.10") { //содержимое index.php шаблона } Так мы ОТКРЫВАЕМ КОНТЕНТ только для этого ИПа )))) -------------------- |
|
|
genjnat
|
Сообщение
#9
|
|
Danko, Т.е. если Ваш айпишник не 10.10.10.10, то Вы бот! Идеальное решение! Супер! и посетителей и яшо-гуглоботов отшить с сайта. genjnat, код в принципе почти норм. НО! Вставьте в индексную .php страницу Вашего сайта в самом верху после <?php строку if($_SERVER['REMOTE_ADDR']=="IP_BOTA") die("Вам здесь не место"); Заменив IP_BOTA на айпишник, с которого парсят. Еще вариант - прямо через .htaccess: order allow,deny deny from 1.1.1.1 allow from all 1.1.1.1 - снова заменяем на айпишник парсящего Однако незадача: возможно парсят Вас через проксю или с динамического айпишника из дома (как у моего провайдера, например). Тогда уж вы вряд ли сможете остановить человека Спасибо, сейчас так и сделаю. Но есть проблемма, на моем сайте до 200 посетителей в день, да и ботов тьма, т.е. по логам определить айпи очень трудно. Правильно ли я сделаю, если для определения айпи, вот этот сайт _http://www.leebuild.ru/ забью сюда Сообщение отредактировал genjnat - 11.10.2009, 20:59 |
|
|
larstas |
11.10.2009, 20:59;
Ответить: larstas
Сообщение
#10
|
|
Ну, думаю, можно попробовать воткнуть именно айпишник 78.109.17.107
-------------------- |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Грабер погоды импорт прогноза так сказать |
12 | n0lik | 4973 | 26.7.2009, 20:09 автор: Profytball |
Текстовая версия | Сейчас: 26.4.2024, 6:27 |