X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Паразиты-спамеры повышают процент отказов — советы?, По каким алгоритмам отсеять паразитов?
Ultrastalker
Ultrastalker
Topic Starter сообщение 16.12.2018, 1:57; Ответить: Ultrastalker
Сообщение #1


Крайне нужен совет знактоков.

Вкратце, ситуация следующая: спамерские боты повадились отправлять в комменты к записям блога всяческую дрянь. Разумеется, элементарный тест Тьюринга (5 крупных, слегка кривоватых цифр на белом фоне) эта саранча обойти не в состоянии, поэтому их комменты даже до БД не добираются.

Однако, проблема заключается в том, что визиты ботов прилежно фиксируются Яндекс-Метрикой и существенно повышают процент отказов сайта (а соответственно — и качество его контента с точки зрения ПС). Комбинации IP-адресов, устройств и типов браузеров в заголовках варьируются в широком диапазоне, попытки выловить по ним наиболее злостных представителей поганой фауны не увенчались успехом (вероятно, зомби-компы и подмена большинства параметров при отправке запроса, так что способ ненадёжен).

В настоящее время запустил модуль сбора статистики по комбинации «реферер — протокол POST» для всех попыток отправки комментариев (это серверные параметры, и насколько я помню, их подменить не так просто), посмотрим, каковы будут результаты (UPD: вполне грамотно и предсказуемо — как я и ожидал, — в первой фазе попытки отправки спама в комменты следует GET-визит на целевую страницу с формой для комментирования, а во второй — отправка внешне валидного POST-запроса с «местным» реферером, только происходит всё это за доли секунды).

Был бы искренне благодарен знатокам (или тем, кто уже сталкивался с вышеописанной проблемой) за совет — по каким критериям детектить саранчу, чтобы вместе с водой ненароком не выплеснуть и ребёнка (ну, к примеру, поисковых пауков?)

Заранее спасибо.

Сообщение отредактировал Ultrastalker - 16.12.2018, 2:10


--------------------
Счастье для всех, даром, и пусть никто не уйдёт обиженным!
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ekvador
ekvador
сообщение 16.12.2018, 3:28; Ответить: ekvador
Сообщение #2


выводить по клику и ждать появления формы
Развернуть/Свернуть

Код
set_time_limit(0);

$sleep = 5;
if(!isset($_POST['get_form_comment'])) {
    ?>
    <form method="post" action="">
        <input type="submit" name="get_form_comment" value="Комментировать">
    </form>
    <?php
} else {
    sleep($sleep);
    ?>
    <form method="post" action="">
        <textarea name="text_comment">text_comment</textarea>
        <input type="submit" name="add_comment" value="Отправить">
    </form>
    <?php
}



Сообщение отредактировал ekvador - 16.12.2018, 3:33


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Clause
Clause
сообщение 21.12.2018, 21:58; Ответить: Clause
Сообщение #3


Цитата(Ultrastalker @ 16.12.2018, 1:57) *
существенно повышают процент отказов сайта (а соответственно — и качество его контента с точки зрения ПС).

Всегда думал что на качество контента с точки зрения ПС влияет процент отказов из поиска...
Прямые заходы и отказы ПС не учитывают?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Ultrastalker
Ultrastalker
Topic Starter сообщение 12.1.2019, 2:56; Ответить: Ultrastalker
Сообщение #4


Цитата
Прямые заходы и отказы ПС не учитывают?


ПС — не знаю, а вот Метрика — запросто. В чём, собственно, и была проблема.

Была — потому что пришлось немного поколдовать над формой отправки комментариев: в частности, встроенную в код страниц POST-форму убрать и выводить только по AJAX-запросу при нажатии клавиши «Добавить комментарий». От варианта с оператором SLEEP пришлось по здравом размышлении отказаться, так как не обладая доступом к серверным механизмам, Метрика воспринимала бы его работу просто как очень долгую загрузку страницы, а скорость загрузки страниц, насколько мне известно — один из ключевых факторов качества сайта. И да, в результате колдовства уровень отказов при прямых заходах начал постепенно снижаться — возможно, потихоньку отваливаются боты-автопостеры.


--------------------
Счастье для всех, даром, и пусть никто не уйдёт обиженным!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Iga
Iga
сообщение 13.1.2019, 21:47; Ответить: Iga
Сообщение #5


У меня похожие опасения по поводу метрики и точки зрения ПС.
Но ситуация немного другая, прямых заходов 20-40 в день, из них ~ 50-80% отказов. Вебвизор показывает вход, шавеление мышкой(каждый раз разное), ожидание, завершение посещения.
Блочить по ip не вариант, каждый раз всё разное. ХЗ что за напасть такая.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Ultrastalker
Ultrastalker
Topic Starter сообщение 14.1.2019, 2:41; Ответить: Ultrastalker
Сообщение #6


Iga, рекомендую попробовать следующий подход. Разберём по шагам, чтобы отследить логику.

Что будет, если переход на сайт был из выдачи Яндекса, а Метрика при этом то есть на страницах, то её нет? В лучшем случае — «у вас нестабильно работает сайт», в худшем — «ага, манипуляция аналитикой! попался!» Падение поведенческого фактора, понижение ранжирования.

Ok. А если переход прямой, без рефа? А вот тут уже интереснее. Того, кто отправил на сайт (выдача), в цепочке уже нет. Осталось ликвидировать того, кто примет данного гостя (Метрику). Раз зашёл не из выдачи — пусть Метрика про него ничего не знает. Как? Да элементарно: если empty($_SERVER['HTTP_REFERER']) — код Метрики из «приёмной» страницы (т. н. песочницы) долой, и смотрим, что будет делать посетитель. Хочет мышью потыркать — пусть тыркается в песочнице без Метрики. Нам-то на кой ляд эту пустую буффонаду аналитике демонстрировать? Осмысленно ищет инфу или сервис — пусть тыркает по ссылке, что размещена в песочнице (а хорошо бы ещё ссылочка была какой-нибудь особенной, чтобы её боты не вылавливали — ну скажем, формируется с помощью JS, и ещё лучше динамическая позиция — «Галерея» то на первом месте, то на третьем, то в пяти пикселах от верха страницы, то в пятидесяти, и плюс всё время с разным отступом).

Причина «пустых» визитов? Возможно, фактор-диверсия: а вот давай-ка мы ему сейчас поведенческий до плинтуса срежем! Бред? Сколько угодно: если ты паранойик — это ещё не значит, что за тобой не следят. Плюс неуёмных стрелков из пушки по воробьям сейчас как собак нерезаных, больше же им заняться нечем кроме как.

Результат модификации? Возможно, отсеивание «пустых» визитов, точнее, их отсечение от Метрики: режьте фактор хоть до посинения, Метрике ваш балаган по барабану — она его всё равно не видит, ПС со своей выдачей про ваши фортели также не в курсе.

Даже не идея. Просто размышление вслух.
Может, даже себе впоследствии реализую.

Сообщение отредактировал Ultrastalker - 14.1.2019, 2:45


--------------------
Счастье для всех, даром, и пусть никто не уйдёт обиженным!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Iga
Iga
сообщение 14.1.2019, 11:53; Ответить: Iga
Сообщение #7


Цитата(Ultrastalker @ 14.1.2019, 2:41) *
пусть тыркает по ссылке

Вот отсюда подробнее.

Я вышеизложенное как понял - На вывод кода метрики ставим условие - если HTTP_REFERER пусто, то не показываем код. Теперь если идёт "прямой заход", то в метрике он отображаться не будет.

Для чего нужны какие-то ссылки хитрые? Если у нас этот "прямой заход" сидит мышкой шевелит, то мы про него и не узнаем, а если он совершил переход через меню на другую страницу сайта, то мы увидим внутренний переход, верно же мыслю?


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Ultrastalker
Ultrastalker
Topic Starter сообщение 14.1.2019, 17:10; Ответить: Ultrastalker
Сообщение #8


Iga, вы-то верно мыслите, а вот я — увы, нет. Про спайдеров ПС забыл, они-то тоже производят прямые визиты, и вот как с ними быть, как их отсечь от фактор-диверсантов, пока не готов сказать. Надо поразмыслить немного...


--------------------
Счастье для всех, даром, и пусть никто не уйдёт обиженным!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Iga
Iga
сообщение 14.1.2019, 21:54; Ответить: Iga
Сообщение #9


Цитата(Ultrastalker @ 14.1.2019, 17:10) *
Про спайдеров ПС забыл

Что это за звери?


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Ultrastalker
Ultrastalker
Topic Starter сообщение 14.1.2019, 22:08; Ответить: Ultrastalker
Сообщение #10


Iga, к примеру, роботы Яндекса. Собирают информацию о сайте для дальнейшего включения в индекс.


--------------------
Счастье для всех, даром, и пусть никто не уйдёт обиженным!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Какой % отказов нормален для сайта?
14 Aloof 3384 23.4.2024, 13:50
автор: Vmir
Горячая тема (нет новых ответов) Дайте советы по направлениям для заработка
38 Suagaring 4825 16.1.2024, 12:16
автор: Antarez
Открытая тема (нет новых ответов) Мультивертикальная партнерская сеть MyLead дает советы по продвижению
0 MyLead 1171 19.12.2022, 20:25
автор: MyLead
Открытая тема (нет новых ответов) Привет, нужен кто-то для оплаты через Paypal за процент
сраный paypal ограничил счёт и все никак не верифицирует
0 coremission 1298 2.10.2019, 13:58
автор: coremission
Открытая тема (нет новых ответов) Качественный SEO-аудит Вашего сайта. Рекомендации, советы по сайту.
2 dimapwt 3521 29.11.2018, 5:51
автор: vitosbaltos


 



RSS Текстовая версия Сейчас: 25.4.2024, 20:27
Дизайн