X   Сообщение сайта
(Сообщение закроется через 2 секунды)





Здравствуйте, гость ( Вход | Регистрация )


Комментарий к странице
Для эффективного продвижения и раскрутки сайта крайне важна уникальность контента, однако, алгоритм определения данного критерия для разных поисковиков отличается. Как показывает практика, уникальность контента достигается с помощью рерайтов исходного текста, но при этом необходимо заменить синонимом в среднем одно из десяти слов.

 
Добавить ответ в эту темуОткрыть тему
> Уникальность контента
grach5
сообщение 27.11.2008, 9:24; Ответить: grach5
Сообщение #1


Оптимизатор
******

Группа: Активный пользователь
Сообщений: 914
Регистрация: 16.7.2008
Пользователь №: 3000
Спасибо сказали: 96 раз(а)




Репутация:   24  


Раньше проверял методом шинглов и Dcfinde'ом, но потом заметил что если на каждые 10 слов заменить по одному слову - то текст покажется уникальным, хотя на самом деле это не так. Так как же яндекс определяет уникальность?

Собственно вот нашел фразу якобы принадлежащую Илье Сагаловичу: (возможно кто то точно может сказать реально ли это отрывок из его статьи и где можно почитать полную версию?)
Цитата
Чтобы у читателя не создалось впечатление, что информационный поиск исключительно западная наука, упомяну про альтернативный алгоритм определения почти-дубликатов, придуманный и воплощенный у нас в Яндексе [ilyinsky]. В нем используется тот факт, что большинство поисковых систем уже обладают индексом в виде инвертированного файла (или инвертированным индексом) и этот факт удобно использовать в процедуре нахождения почти-дубликатов.
источник.
http://www.ebanners.ru/viewtopic.php?t=664


Инвертированный файл (inverted file, инверсный файл, инвертированный индекс, инвертированный список) - индекс поисковой системы, в котором перечислены слова коллекции документов, а для каждого слова перечислены все места, в которых оно встретилось.

Условно говоря берется текст, вынимаются из него слова, определяется какое количество раз в данном тексте встречается определенное слово и помечается где оно конкретно находится в тексте (просьба к специалистам поправить меня)



Если в двух документах находится примерно одинаковые слова с примерно одинаковой частотой - то эти документы считаются одинаковыми или берутся на учет и подвергаются дополнительным проверкам.
Всякие предлоги и тд скорее всего не учитываются.

Возможно кто-то точно знает как яндекс определяет уникальность текстов?

P.S. Если я заново изобретаю велосипед, киньте плиз ссылку на устройство этого велосипеда.

Сообщение отредактировал grach5 - 27.11.2008, 9:26
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
it-pomoshnik
сообщение 29.12.2008, 1:14; Ответить: it-pomoshnik
Сообщение #2


SEO дедушка :)
*******

Группа: Модераторы
Сообщений: 1058
Регистрация: 10.11.2008
Из: Москва, Переделкино
Пользователь №: 5950
Спасибо сказали: 469 раз(а)




Репутация:   61  


Яндекс умеет читать и думать - это факт :)
Я анализировал, как он может определять уникальность.
Смысл анализа таков:
За основу берется "3" объекта: "строка", "предложение", "весь текст".
К каждому из этих объектов Яндекс подходит по разному. В строке выискивает одинаковые слова, словосочетания, варианты написания слов (падежи, число и т.д.). Также по строке выискивает целиком или куски разных предложений, отрывки фраз и т.п. Потом то, что нашел по предложениям и строкам применяет ко всему тексту и ищет в интернет похожее.
Даже если поменять все слова местами, половину убрать и поменять склонения у некоторых существительных, то он все равно найдет 2-3 совпадающих словосочетания, и текст уже не будет уникальным.
Я как-то экспереминтировал - много чего перепробовал, бесполезно.
Вывод: лучше писать самому с нуля.


--------------------
ProTrafv2.com - Лидирующая партнёрка по выкупу Iframe, BodyClick трафика!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
shtrih
сообщение 29.12.2008, 1:40; Ответить: shtrih
Сообщение #3


Гуру
*****

Группа: Пользователь
Сообщений: 432
Регистрация: 2.4.2008
Из: Питер
Пользователь №: 1559
Спасибо сказали: 19 раз(а)




Репутация:   5  


Если я напишу полную бессмыслицу, Яков Карпеич поймёт, что это бред? или охотно проглотит?
В прошлом месеце был случай... сайт слетел, я скан книги делал, так я не правил его... а так пихал на сЦайт, с помарками. Но всё уник! Так Плотон ответил мне :

Платон
"После анализа и классификации страниц Вашего сайта наши алгоритмы приняли
решение не включать его в поиск. Это может быть вызвано неуникальностью
информации, использованием поискового спама или тем, что многие страницы сайта
созданы автоматически и не предназначены для чтения пользователями."

Я
бред! все статьи уникальны, все страницы читаемы и спама нет! каждое описание к фильму уникально... вы помоему и не смотрели ничего! наводит на грустные мысли...


Платон
"Не нужно грустных мыслей, все зависит только от Вас. Развивайте сайт, делайте
его более удобным и интересным. Мы со своей стороны стараемся делать все для
того, чтобы пользователи всегда могли найти актуальную и точную информацию.
Основной критерий не наши алгоритмы, а пользователи. Именно от интереса и
удобства для пользователей зависит позиция сайта."

Я досих пор не понял почему мой сайт слетел... может вы подскажите?
mikmik . ru

Сообщение отредактировал shtrih - 29.12.2008, 1:44
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
it-pomoshnik
сообщение 29.12.2008, 2:01; Ответить: it-pomoshnik
Сообщение #4


SEO дедушка :)
*******

Группа: Модераторы
Сообщений: 1058
Регистрация: 10.11.2008
Из: Москва, Переделкино
Пользователь №: 5950
Спасибо сказали: 469 раз(а)




Репутация:   61  


Подсказать может только Платон :)
Свою точку зрения он уже высказал.
Я посмотрел сайт.
Нормальный контент, все читаемо...
Может просто таких сайтов в Рунете много или просто у Платона настроение было плохое.
Ему надо было бутыль пивка подогнать, он бы расслабился, повеселел :rolleyes:


--------------------
ProTrafv2.com - Лидирующая партнёрка по выкупу Iframe, BodyClick трафика!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
lousx
сообщение 29.12.2008, 2:17; Ответить: lousx
Сообщение #5


Бывалый
****

Группа: Пользователь
Сообщений: 234
Регистрация: 23.12.2008
Пользователь №: 9022
Спасибо сказали: 20 раз(а)




Репутация:   -7  


shtrih, скан книги говорите? Разве вам не известно, что это нарушение авторских прав, кот. карается законом?
Делайте вывод.
it-pomoshnik, да вы гений! Каким же это анализом вы пришли к такому выводу?
Цитата
За основу берется "3" объекта: "строка", "предложение", "весь текст".
К каждому из этих объектов Яндекс подходит по разному. В строке выискивает одинаковые слова, словосочетания, варианты написания слов (падежи, число и т.д.). Также по строке выискивает целиком или куски разных предложений, отрывки фраз и т.п. Потом то, что нашел по предложениям и строкам применяет ко всему тексту и ищет в интернет похожее.
Даже если поменять все слова местами, половину убрать и поменять склонения у некоторых существительных, то он все равно найдет 2-3 совпадающих словосочетания, и текст уже не будет уникальным.

Расписано все до тютильки
Может к вам в руки попали исходники поискового движка? :mellow:

Сообщение отредактировал lousx - 29.12.2008, 2:20


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
centurion
сообщение 29.12.2008, 4:14; Ответить: centurion
Сообщение #6


SEO герой
********

Группа: Старшие модераторы
Сообщений: 2725
Регистрация: 10.12.2007
Из: aceweb
Пользователь №: 569
Спасибо сказали: 1110 раз(а)




Репутация:   275  


Цитата
Возможно кто-то точно знает как яндекс определяет уникальность текстов?

Вы издеваетесь? :lol:
Это алгоритм, он известен узкому кругу. Если его знать на 100%, то деньги лопатой грести можно было бы.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
lousx
сообщение 29.12.2008, 9:28; Ответить: lousx
Сообщение #7


Бывалый
****

Группа: Пользователь
Сообщений: 234
Регистрация: 23.12.2008
Пользователь №: 9022
Спасибо сказали: 20 раз(а)




Репутация:   -7  


it-pomoshnik отличился и определил алгоритм определения уникальности текстов. Респект ^_^

Сообщение отредактировал lousx - 29.12.2008, 9:43


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
it-pomoshnik
сообщение 29.12.2008, 10:23; Ответить: it-pomoshnik
Сообщение #8


SEO дедушка :)
*******

Группа: Модераторы
Сообщений: 1058
Регистрация: 10.11.2008
Из: Москва, Переделкино
Пользователь №: 5950
Спасибо сказали: 469 раз(а)




Репутация:   61  


Наверняка я ничего не знаю. Это всего лишь мои предположения, основанные на длительном эксперименте.
Просто я любопытный и люблю эксперименты.
Эксперемент по уникальности текста я веду с марта 2008 года, когда ко мне обратился за помощью один человек, сайт которого загнали в БАН как раз из-за не уникальности его контента.
А объектов на самом деле - 4.
Есть еще один фактор, влияющий на уникальность, но я пока не могу понять - какой. :(

Сообщение отредактировал it-pomoshnik - 29.12.2008, 10:24


--------------------
ProTrafv2.com - Лидирующая партнёрка по выкупу Iframe, BodyClick трафика!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
lousx
сообщение 29.12.2008, 13:37; Ответить: lousx
Сообщение #9


Бывалый
****

Группа: Пользователь
Сообщений: 234
Регистрация: 23.12.2008
Пользователь №: 9022
Спасибо сказали: 20 раз(а)




Репутация:   -7  


it-pomoshnik, сначала вц сказали, что
Цитата
Яндекс умеет читать и думать - это факт

Теперь вы говорите, что
Цитата
Это всего лишь мои предположения

С этого и надо было начинать. Будьте внимательнее в своих формулировках, а то тем самым вводите людей в заблуждение.
На счет эксперемента.
Цитата
Есть еще один фактор, влияющий на уникальность, но я пока не могу понять - какой.

Это очень интересно. Если вы сможете определить этот фактор, то вашему эксперементу цены не будет...сами понимаете почему ;)


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Быстрый ответДобавить ответ в эту темуОткрыть тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

> Объявления


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Дубликат контента в рамках одного сайта
3 b0rman 70 Сегодня, 19:04
автор: SeoKar
Открытая тема (нет новых ответов) Очень нужна работа по изготовлению контента
7 CRASTY 240 Вчера, 15:47
автор: abbalux
Горячая тема (нет новых ответов) Продажа уникального контента
до $0.04 за 1000 знаков
101 sunseeker7 7574 Вчера, 8:08
автор: MrLia
Горячая тема (нет новых ответов) Продажа уникального контента для ваших сателлитов!
Отличное качество, низкие цены!
174 iXenus 12338 30.8.2010, 15:13
автор: iXenus
Открытая тема (нет новых ответов) Пачка контента, тематика "авто"
2 terra 105 30.8.2010, 12:18
автор: terra


 



RSS Текстовая версия Сейчас: 2.9.2010, 20:47
Дизайн