Внимание! Нижеприведённая статья является лишь одним из возможных вариантов работы основных поисковых систем. Все возможные совпадения случайны.
Данная статья является лишь субъективным мнением автора.
Все приведённые ниже цифры в формулах являются лишь примером и не могут совпадать с действительностью.
Проштудировав весь РуНет я так и не нашёл ни одной статью хоть сколько-нибудь пытавшейся объяснить алгоритмы ранжирования современных поисковых систем. Тогда мне стало непонятно как же могут новички без опыта начать что-то “продвигать” не зная основных принципов. И решил это дело поправить.
Писать буду коротко, т.к. по этой теме можно легко написать и целую дисертацию. Все сложные формулы опустим и в примерах будем рассматривать только дискретные значения тех или иных величин Если кому-то будут непонятны какие-либо термины – я всегда готов ответить на своём форуме на Ваши вопросы.
Все необоснованные выкрики, что это баян или неверное понимание, я буду удалять без предупреждения, а автора банить. Я буду рассматривать только обоснованные негодования. Спамеры, флудеры и псевдоумники пусть обсуждают “псевдоАПы” на других ресурсах.
Итак.
Основная мысль всех поисковых систем работает на методе рекомендаций. Здесь всё как и в жизни: если Тебя рекомендуют – значит Ты действительно чего-то стоишь. А если рекомендаций много, и все они истекают уже от профессионалов – то ты и сам зачисляешься к ним в ряды.
Очевидно, что при обращении к поисковой системе (далее ПС) с каким-либо запросом вы получаете элементарное упорядоченное множество страниц по некому внутреннему рейтингу. Но вот как вычисляется этот рейтинг? В этом и состоит основная тайна за которую многие готовы отдать миллионы.
В сети бытует мнение, что у Яндекса упорядочивание идёт по ВИЦ (взвешенный индекс цитирования). Это ошибочное мнение. И даже сам (лично мной очень уважаемый!) Александр Садовский на одном из известных форумах опровёрг эту гипотезу. Но влияние толпы оказывает на личность огромный эффект и 90% веб мастеров по прежнему верят в эту догму.
А в реальность всё не так.
Рейтинг (далее пометим его просто R), с помощью которого и упорядочивается выдача, составляется из многих факторов. Их все можно условно разделить на 3 категории:
1) Внутренние факторы
2) Внешние факторы.
3) Коррелирующие факторы.
Давайте подробно теперь рассмотрим как они работают.
Внутренние факторы.
Все моменты которые поисковые системы учитывают в внутренних факторах уже знают, наверное, все. Это плотность вхождения слов, обрамление различными тэгами, заголовки и т.д.
Подсчёт этого злополучного R начинается с внутренних факторов. Просто составляется “семантическая карта страницы” и высчитываются нужные характеристики.
Давайте разберём на примере как это происходит.
Предположим, что есть у нас страничка со следующим html кодом:
<h1>Ластики</h1>
<p>МЫ производим самые лучшие <b>резиновые ластики</b> на свете. Только у нас самый широкий выбор <b>розовых и синих ластиков</b>. Только наши синие ластики стирают даже <i>чернила</i>!!!</p>
Title страницы:
<title>Лучшие розовые и синие ластики</title>
ПС сначала подсчитывает количество вхождения всех слов в страницу игнорируя стоп-слова.
Т.е. пройдясь по этому списку он получит следующую карту:
слово “ластики” встречается 3 раза, “синие” встречаются 2 раза, а остальные (производим, резиновые, свете, широкий, выбор, розовых, синих, ластиков, стирают, чернила, розовые) – по одному.
Далее ПС используя свои дополнительные модули, распознающие морфологию, приводит все слова к номинативам, инфинитивам и т.д.
В итоге на втором этапе получаем:
----------------------------------------------------------------------------------------------------------------------
Ластик – 4 вхождения
Синий – 3
Розовый – 2
Производить, резиновый, свет, широкий, выбор, стирать, чернила – 1.
----------------------------------------------------------------------------------------------------------------------
Дальше подключается ещё один модуль, который учитывает гипертекстовую разметку. Конечно у каждой ПС свои параметры и формулы, но чтобы понятно было как это работает введу свои.
Пусть текст обрамлённый в тэги <b>, <strong>, <i> считается текстом содержащим основные ключевые слова страницы и их “вес” в документе в два раза больше чем обычный. А слова содержащиеся в title и заголовках 1-го уровня – в три раза.
В итоге получаем следующую “семантическую карту” с соответствующими весами в документе:
----------------------------------------------------------------------------------------------------------------------
Ластик – 10
Синий – 6
Розовый – 5
Резиновый – 2
Чернила – 2
Производить – 1
Свет – 1
Широкий – 1
Выбор – 1
Стирать – 1.
----------------------------------------------------------------------------------------------------------------------
Возможно у каких-то ПС ещё добавляется что-то, но сама суть анализа внутренних фактора НЕИЗМЕННА!
А теперь маленький сюрприз: везде написано, что идеальная плотность вхождения ключевых слов 5-7%. Все считаю общее вхождение ключевых слов и делят на общее количество. Некоторые даже стоп слова откидывают. А считать надо ВЕСА по алгоритму представленному выше (только коэффициенты немного другие
).
http://gooya.ru/content/view/33/2/
Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
|