Помощник
|
Анализатор текстовой релевантности |
seo2z
|
Сообщение
#1
|
||||
|
|
||||
|
|||||
webpavilion |
25.10.2010, 22:26;
Ответить: webpavilion
Сообщение
#2
|
|
|
правильно сформулированный вопрос - треть от правильного ответа.
я правильно понял, что вы в первом вопросе спросили? вы уверены что величина случайная? второй попроще но тоже требует корректной формулировки. -------------------- Не ведитесь, cамопис это почти всегда плохо! Делаю сайты на Drupal 7.x (очень дорого) |
|
|
||
Globaldota |
25.10.2010, 22:54;
Ответить: Globaldota
Сообщение
#3
|
|
Стоит ли отдельно учитывать все виды вхождения ключевого слова / сочетания? Мне кажется, это только усложнит задачу, а результат окажется похожим (с погрешностью, которой можно пренебречь ).
Сообщение отредактировал Globaldota - 25.10.2010, 22:57 |
|
|
seo2z
|
Сообщение
#4
|
|
я правильно понял, что вы в первом вопросе спросили? вы уверены что величина случайная? по первому вопросу: какие веса придавать таким метрикам, как релевантные пассажи (и на более глубоком уровне - веса вхождений запроса в эти пассажи) разных форм, относительно простых пассажей? И как провести корреляцию, которая бы соединяла формулу учёта весов разных пассажей в конкретную цифру. Как то так, может сложно объясняю... второй попроще но тоже требует корректной формулировки. какую мерку сделать для учёта кучности. Например, каким весом будут обладать дубли запроса в соседних пассажах? И такой же вопрос: каким весом будут обладать дубли запроса в первом и последнем пассажах? Стоит ли отдельно учитывать все виды вхождения ключевого слова / сочетания? вопрос на уровне: да ладно, чё там, чисты и морфологические можно учитывать, остальные трудно считать - в топку. У яндекса свои семантические технологии, которые учитывают даже не вхождения, а более глубокие вещи (типа связок). Так что стоит. Мне кажется, это только усложнит задачу, а результат окажется похожим (с погрешностью, которой можно пренебречь ). почему усложнит? всё считается на уровне автомата. Для этого собственно и придумывались модули. Что вы имеете в виду, говоря "результат окажется похожим"? уже сейчас по нашим данным образовываются кривые релевантности, убывающие от ТОП-1 к ТОП-* (при прочих равных или вычете примерных весов ссылочных, доменных и статических факторов) Сообщение отредактировал seo2z - 25.10.2010, 23:13 -------------------- |
|
|
webpavilion |
25.10.2010, 23:19;
Ответить: webpavilion
Сообщение
#5
|
|
seo2z, что мне будет за ответы на ваши вопросы?
-------------------- Не ведитесь, cамопис это почти всегда плохо! Делаю сайты на Drupal 7.x (очень дорого) |
|
|
seo2z
|
Сообщение
#6
|
|
seo2z, что мне будет за ответы на ваши вопросы? планировалось всем, кто примет участие в обсуждении (без пустых слов) - дать льготный доступ к инструментам аналитики. Как и написал, инструменты, которые обрабатывают сложные данные и визуализируют в понятной форме - дадут пищу для seo аналитики, которой так не хватает в тяжёлые времена смуты. -------------------- |
|
|
Globaldota |
25.10.2010, 23:56;
Ответить: Globaldota
Сообщение
#7
|
|
Если посмотреть доклад Яндекса на РОМИПе' 2006 "Алгоритм текстового ранжирования", то у них несколько иной подход к расчету релевантности. Может попытаться рассчитать Score и на выдаче определить приблизительно неизвестные коэффициенты ?
|
|
|
webpavilion |
26.10.2010, 0:04;
Ответить: webpavilion
Сообщение
#8
|
|
Globaldota, скорее всего после введения матрикснета этот доклад потерял практическую ценность, полезно использовать как учебное пособие, не более.
дать льготный доступ к инструментам аналитики Как я понимаю имеется ввиду Inserp, мне он без надобности. По кучности есть наработки. По первому вопросу своим ответом запутали еще больше, завтра посмотрю на свежую голову.
-------------------- Не ведитесь, cамопис это почти всегда плохо! Делаю сайты на Drupal 7.x (очень дорого) |
|
|
Globaldota |
26.10.2010, 0:09;
Ответить: Globaldota
Сообщение
#9
|
|
скорее всего после введения матрикснета этот доклад потерял практическую ценность, полезно использовать как учебное пособие, не более. Матрикснет использует текстовую релевантность как один из факторов ранжирования, не думаю, что они сильно переработали старый алгоритм ТЕКСТОВОГО ранжирования, интегрировав его в матрикснет. Сообщение отредактировал Globaldota - 26.10.2010, 0:10 |
|
|
kronos |
26.10.2010, 0:20;
Ответить: kronos
Сообщение
#10
|
|
Матрикснет использует текстовую релевантность как один из факторов ранжирования, не думаю, что они сильно переработали старый алгоритм ТЕКСТОВОГО ранжирования, интегрировав его в матрикснет. На сколько я понимаю матрикснет на то и матрикснет, что под каждый запрос у него своя формула. -------------------- |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Проаю свое детище - анализатор сайтов | 0 | Megoydagi | 2267 | 11.4.2020, 3:51 автор: Megoydagi |
|
Анализатор сайтов | 1 | mforve | 2126 | 12.3.2013, 21:09 автор: mforve |
|
Скрипт анализатор сайта как на pr-cy Скрипт анализатор сайта как на pr-cy |
1 | Dinamit87 | 4673 | 1.2.2013, 18:52 автор: шахидочка_программист |
Текстовая версия | Сейчас: 17.4.2024, 23:24 |