Помощник
|
Страницы выпадают из индексации |
Kelebrin
|
Сообщение
#1
|
||
|
|
||
|
|||
Dante_sf |
26.10.2015, 12:39;
Ответить: Dante_sf
Сообщение
#2
|
|
Описанная вами проблема наблюдается по всему рунету, кроме сайтов, которые имеют частое обновление (СМИ, форумы и пр.).
Не так давно Яндекс выкатил новый алгоритм (о нем можно почитать здесь, просто офигенная статья о принципе работы самого алгоритма лежит тут). Если лень и нужно вкратце: индексирование новых документов сейчас происходит по какой-то квоте, дабы не создать большую нагрузку на обработчика, который и перемешивает сайты, определяя их качество/релевантность по поведенческой модели. Если совсем кратко: зачем индексировать новые документы, когда уже проиндексированные еще не получили оценку пользователя, как таковую. К тому же, нахождение страницы в индексе быстробота никак не гарантирует нахождение ее там постоянно. |
|
|
Kelebrin
|
Сообщение
#3
|
|
Спасибо, со статьями обязательно ознакомлюсь.
А есть какой-то рецепт, как с этим бороться? |
|
|
Dante_sf |
26.10.2015, 16:50;
Ответить: Dante_sf
Сообщение
#4
|
|
|
|
|
leshii_sf |
30.10.2015, 3:18;
Ответить: leshii_sf
Сообщение
#5
|
|
зачем индексировать новые документы, когда уже проиндексированные еще не получили оценку пользователя, как таковую. Так ведь полнота индекса - один из ключевых параметров как таковой. Даже в самых простых расчетах tf/idf это знаменатель, от которого никуда не деться. Уменьшая ее можно получить неадекватные оценки текстовой релевантности (а имея базу в 10^9 страниц здесь и 6-8 знаки после запятой еще значащие.) я пока не нашел рабочего способа/сервиса. Сервис, который сможет адекватно управлять поведенческими в данном случае я плохо представляю Развернуть/Свернуть
увижу здесь ссылку на мовебо/юзерклик - забаню без предупреждения
разве что платформа типа яндекс.атом. просто офигенная статья о принципе работы самого алгоритма лежит тут). если и правда платон говорил о чем-то подобном, то у нас f{q;a;z}=[вот-та-формула] q- запрос a- страница сайта z - позиция И для ее максимизации единственный хоть как-то управляемый с нашей стороны параметр - nj, т.е. минимизация числа кликов по сайту. Что-то чушь получается. |
|
|
Dante_sf |
30.10.2015, 19:57;
Ответить: Dante_sf
Сообщение
#6
|
|
Так ведь полнота индекса - один из ключевых параметров как таковой. Все верно. Но когда у нас, к примеру, много документов, которые почти одинаково отвечают на запросы пользователя? Один из аспектов многорукого бандита как раз заключается в том, чтобы оценить уже имеющиеся документы на живой выдаче (100 документов должны получить живые оценки релевантности/качества). А для точности/полноты у Яндекса, видимо, много документов, раз он пошел на такой рискованный шаг - ухудшить качество в краткосрочной перспективе, с целью получить больше оценок. Сервис, который сможет адекватно управлять поведенческими в данном случае я плохо представляю Не, не, я про сервис индексации. Сейчас большая трабла с загоном страниц в индекс. Что-то чушь получается. Вначале - да. Насколько я понял сам принцип работы самого алгоритма: q - запрос a - документ/страница z - позиция Чтобы собрать оценки, надо что-то типа тоого Qpos (где у нас как-раз получается пара *документ/запрос) Qk@1 (примерное обозначение скликивание документа по запросу) = Rel(A)Qpos (?) (здесь может быть какое-то число, которое задано для прохождения кворума документа). Минусы - нужно постоянно перемешивать выдачу по большому кол-ву запросов+применять бандита априори (например, нам ведь не нужно оценивать каждый документ по каждому запросу постоянно, но есть так же вероятность получить некачественные оценки - плохой документ, спам и пр.) Но идея интересная, и то, что Яндекс имеет в сухом остатке от редкого индекса, дает возможность получить более точные данные на выходе, в итоге. Это я примерно так понял:) |
|
|
leshii_sf |
4.11.2015, 16:22;
Ответить: leshii_sf
Сообщение
#7
|
|
Чтобы собрать оценки, надо что-то типа тоого Qpos (где у нас как-раз получается пара *документ/запрос) Qk@1 (примерное обозначение скликивание документа по запросу) = Rel(A)Qpos (?) (здесь может быть какое-то число, которое задано для прохождения кворума документа). это понятно. Ты говоришь о том, как алгоритму оценить качество выдачи. А я о том, что нам с этим алгоритмом делать. Даже в твоей формуле получается все равно нужно уменьшать Qk@1 - т.е. скликивание. --- добавлено: Nov 4, 2015 12:27 PM --- И да, я понимаю, что это бред и так делать не нужно. Но тогда только остается смириться и ждать. :) |
|
|
melihovgv_sf |
5.11.2015, 14:35;
Ответить: melihovgv_sf
Сообщение
#8
|
|
|
Описанная вами проблема наблюдается по всему рунету, кроме сайтов, которые имеют частое обновление (СМИ, форумы и пр.). Не так давно Яндекс выкатил новый алгоритм (о нем можно почитать здесь, просто офигенная статья о принципе работы самого алгоритма лежит тут). Это алгоритм наблюдал с середины 2014 до ввода Минусинска в действии. Но он был не в таких масштабах. И он даже порой выручал. И да, я понимаю, что это бред и так делать не нужно. Но тогда только остается смириться и ждать. :) Понять и простить)) Но в большинстве своем на данном этапе развития в Яндексе правят менеджеры, а не хорошие технари! И суть всех действий, напугать владельцев сайтов в нестабильности органической выдачи. И предположим, что всех зовут в Директ. Но парадокс в том, что и с директа трафик не конвентируемый идет, хотя до 14 сентября все было ок.
|
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Нужно ли закрывать ненужные страницы тегом noindex, follow? | 8 | noviktamw | 2835 | 2.3.2024, 12:53 автор: toplinks |
|
По какому принципу работают ускорители индексации сайта? | 5 | Lifelove | 1585 | 29.1.2024, 9:50 автор: Skyworker |
|
Вытащить страницы из кэша Яндекса | 2 | VostrVL | 1915 | 11.1.2024, 23:07 автор: ЛаврионСергеевич |
|
Сервис индексации- ферма голодных гуглоботов сожрет ваши ссылки Удобный сервис индексации ссылок в телеграм боте |
12 | FastIndex | 2447 | 5.1.2024, 16:36 автор: malamut |
|
Услуга по индексации страниц в Google | 9 | FUTP | 3693 | 12.4.2023, 21:31 автор: Magicclickpartners |
Текстовая версия | Сейчас: 29.3.2024, 17:33 |