X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V   1 2 3 4 5 >
Открыть тему
Тема закрыта
> Анализатор текстовой релевантности
seo2z
seo2z
Topic Starter сообщение 25.10.2010, 21:16; Ответить: seo2z
Сообщение #1


Поисковая оптимизация
******

Группа: Active User
Сообщений: 2373
Регистрация: 9.12.2008
Из: Санкт-Петербург
Поблагодарили: 1253 раза
Репутация:   173  


Хватит тусить в оффтопике и дайджестах форума... Давайте затронем, что ни на есть SEO тему - текстовая релевантность.

Сразу к делу:
Сейчас проводится ряд аналитических работ и исследований в сторону оценки текстовой релевантности, корреляций метрик и отношение их к позициям ТОП'а.
Хотелось бы, конечно, выводить циферку текстовой релевантности. Понятно, что при неконкурентных запросах кривая в графике от ТОП-1 до ТОП-30 (к примеру) должна быть убывающая. При более конкурентных запросах, будут учитываться ссылочные веса и другие факторы.

Понятное дело, что математиков тут нет, но хотелось бы обсудить факторы.

1 инструмент - Пассажеметр
Прикрепленное изображение

разбивает документ на пассажи, считает релевантные.
Вопрос: как скореллировать метрики вхождений запроса в релевантные пассажи в общую формулу?

2 инструмент - Кучность и тошнота

Прикрепленное изображение

Вопрос: как считать кучность вхождений, дальность, веса дальностей?

На данный момент формулы уже имеются, но хотелось бы послушать мнение народа, может кому-нибудь в голову придёт более здравая (простая) мысль. Хотелось бы пообщаться на тему ваших и моих исследований в этой области.

P.S. Это лишь 2 модуля из общей серии, которая будет включать целый комплекс. Этот комплекс разрабатывается для нас, для сеошников.

Сообщение отредактировал seo2z - 25.10.2010, 21:37


--------------------


Поблагодарили: (5)
16
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 25.10.2010, 22:26; Ответить: webpavilion
Сообщение #2


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


правильно сформулированный вопрос - треть от правильного ответа.

Прикрепленное изображение


я правильно понял, что вы в первом вопросе спросили? вы уверены что величина случайная?
второй попроще но тоже требует корректной формулировки.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Globaldota
Globaldota
сообщение 25.10.2010, 22:54; Ответить: Globaldota
Сообщение #3


Бывалый
****

Группа: User
Сообщений: 470
Регистрация: 11.9.2009
Из: Москва
Поблагодарили: 225 раз
Репутация:   28  


Стоит ли отдельно учитывать все виды вхождения ключевого слова / сочетания? Мне кажется, это только усложнит задачу, а результат окажется похожим (с погрешностью, которой можно пренебречь smile.gif).

Сообщение отредактировал Globaldota - 25.10.2010, 22:57


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 25.10.2010, 23:12; Ответить: seo2z
Сообщение #4


Поисковая оптимизация
******

Группа: Active User
Сообщений: 2373
Регистрация: 9.12.2008
Из: Санкт-Петербург
Поблагодарили: 1253 раза
Репутация:   173  


я правильно понял, что вы в первом вопросе спросили? вы уверены что величина случайная?

по первому вопросу:
какие веса придавать таким метрикам, как релевантные пассажи (и на более глубоком уровне - веса вхождений запроса в эти пассажи) разных форм, относительно простых пассажей? И как провести корреляцию, которая бы соединяла формулу учёта весов разных пассажей в конкретную цифру. Как то так, может сложно объясняю...

второй попроще но тоже требует корректной формулировки.

какую мерку сделать для учёта кучности. Например, каким весом будут обладать дубли запроса в соседних пассажах? И такой же вопрос: каким весом будут обладать дубли запроса в первом и последнем пассажах?

Стоит ли отдельно учитывать все виды вхождения ключевого слова / сочетания?

вопрос на уровне: да ладно, чё там, чисты и морфологические можно учитывать, остальные трудно считать - в топку. У яндекса свои семантические технологии, которые учитывают даже не вхождения, а более глубокие вещи (типа связок). Так что стоит.

Мне кажется, это только усложнит задачу, а результат окажется похожим (с погрешностью, которой можно пренебречь smile.gif).

почему усложнит? всё считается на уровне автомата. Для этого собственно и придумывались модули. Что вы имеете в виду, говоря "результат окажется похожим"? уже сейчас по нашим данным образовываются кривые релевантности, убывающие от ТОП-1 к ТОП-* (при прочих равных или вычете примерных весов ссылочных, доменных и статических факторов)

Сообщение отредактировал seo2z - 25.10.2010, 23:13


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 25.10.2010, 23:19; Ответить: webpavilion
Сообщение #5


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


seo2z, что мне будет за ответы на ваши вопросы?


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 25.10.2010, 23:23; Ответить: seo2z
Сообщение #6


Поисковая оптимизация
******

Группа: Active User
Сообщений: 2373
Регистрация: 9.12.2008
Из: Санкт-Петербург
Поблагодарили: 1253 раза
Репутация:   173  


seo2z, что мне будет за ответы на ваши вопросы?

планировалось всем, кто примет участие в обсуждении (без пустых слов) - дать льготный доступ к инструментам аналитики. Как и написал, инструменты, которые обрабатывают сложные данные и визуализируют в понятной форме - дадут пищу для seo аналитики, которой так не хватает в тяжёлые времена смуты.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Globaldota
Globaldota
сообщение 25.10.2010, 23:56; Ответить: Globaldota
Сообщение #7


Бывалый
****

Группа: User
Сообщений: 470
Регистрация: 11.9.2009
Из: Москва
Поблагодарили: 225 раз
Репутация:   28  


Если посмотреть доклад Яндекса на РОМИПе' 2006 "Алгоритм текстового ранжирования", то у них несколько иной подход к расчету релевантности. Может попытаться рассчитать Score и на выдаче определить приблизительно неизвестные коэффициенты smile.gif ?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 26.10.2010, 0:04; Ответить: webpavilion
Сообщение #8


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


Globaldota, скорее всего после введения матрикснета этот доклад потерял практическую ценность, полезно использовать как учебное пособие, не более.

(seo2z @ 25.10.2010, 23:23) *
дать льготный доступ к инструментам аналитики
Как я понимаю имеется ввиду Inserp, мне он без надобности. По кучности есть наработки. По первому вопросу своим ответом запутали еще больше, завтра посмотрю на свежую голову.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Globaldota
Globaldota
сообщение 26.10.2010, 0:09; Ответить: Globaldota
Сообщение #9


Бывалый
****

Группа: User
Сообщений: 470
Регистрация: 11.9.2009
Из: Москва
Поблагодарили: 225 раз
Репутация:   28  


(webpavilion @ 26.10.2010, 0:04) *
скорее всего после введения матрикснета этот доклад потерял практическую ценность, полезно использовать как учебное пособие, не более.

Матрикснет использует текстовую релевантность как один из факторов ранжирования, не думаю, что они сильно переработали старый алгоритм ТЕКСТОВОГО ранжирования, интегрировав его в матрикснет.

Сообщение отредактировал Globaldota - 26.10.2010, 0:10
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kronos
kronos
сообщение 26.10.2010, 0:20; Ответить: kronos
Сообщение #10


Белый веб-мастер
*******


Группа: Active User
Сообщений: 4703
Регистрация: 10.2.2009
Из: Харьков
Поблагодарили: 2629 раз
Репутация:   327  


(Globaldota @ 25.10.2010, 23:09) *
Матрикснет использует текстовую релевантность как один из факторов ранжирования, не думаю, что они сильно переработали старый алгоритм ТЕКСТОВОГО ранжирования, интегрировав его в матрикснет.

На сколько я понимаю матрикснет на то и матрикснет, что под каждый запрос у него своя формула.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
5 страниц V   1 2 3 4 5 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Анализатор сайтов
1 mforve 1097 12.3.2013, 21:09
автор: mforve
Открытая тема (нет новых ответов) Скрипт анализатор сайта как на pr-cy
Скрипт анализатор сайта как на pr-cy
1 Dinamit87 3081 1.2.2013, 18:52
автор: шахидочка_программист


 



RSS Текстовая версия Сейчас: 11.12.2017, 4:36
Дизайн