X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

5 страниц V  < 1 2 3 4 5 >
Открыть тему
Тема закрыта
> Анализатор текстовой релевантности
webpavilion
webpavilion
сообщение 26.10.2010, 12:42; Ответить: webpavilion
Сообщение #22


(seo2z @ 26.10.2010, 9:18) *
был бы рад пообщаться...
я правильно понял, мне за это общение нечего не будет?


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 26.10.2010, 12:45; Ответить: seo2z
Сообщение #23


я правильно понял, мне за это общение нечего не будет?

если общение сложится полезным, то почему же, будет. Только не ходите вокруг да около, предлагайте цену своей информации


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kakaya_raznica
kakaya_raznica
сообщение 26.10.2010, 12:57; Ответить: kakaya_raznica
Сообщение #24


(seo2z @ 26.10.2010, 12:33) *
вот честно, как пук в лужу...
Вы только картинки конечных модулей из одной линейки видели, это то, что я могу показать на публику, не раскрывая остальных технологий. Второй сриншот - для наших задач считает кучность, чёт не заметил, чтобы миратулс кучность и дальности считал...
В этой теме мы не инструменты обсуждаем, а факторы, как их считать и как придавать вес. Ясный пень, что топ пассажеметром нет смысла анализировать, ради голых цифр, я по-моему это и не предлагаю

А что это за фактор такой, кучность? Зачем пытаться считать факторы, которые дополняют релевантность (если я правильно понял смысл кучности), гораздо выгоднее и нужнее пытаться считать самые весомы факторы. А они рассчитываются по формуле bm25 (ну или ее модификациям).
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 26.10.2010, 13:02; Ответить: seo2z
Сообщение #25


А что это за фактор такой, кучность?

это группа, а не конкретный фактор
Зачем пытаться считать факторы, которые дополняют релевантность (если я правильно понял смысл кучности), гораздо выгоднее и нужнее пытаться считать самые весомы факторы.

слушаю
А они рассчитываются по формуле bm25 (ну или ее модификациям).

bm25 рассчитать проще пареной репы, и скажу вам, что это не самый весомый фактор


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kakaya_raznica
kakaya_raznica
сообщение 26.10.2010, 13:03; Ответить: kakaya_raznica
Сообщение #26


(seo2z @ 26.10.2010, 12:37) *
подскажите, какие снимаете вы, давайте пообсуждаем

Я бы рад снимать, только, пока, не хватает ресурсов и времени. Мне довольно интересными показались доклады с РОМИПа. По тем формулам можно гораздо более точную формулу построить, только вот там данных не хватает.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 26.10.2010, 13:05; Ответить: seo2z
Сообщение #27


Я бы рад снимать, только, пока, не хватает ресурсов и времени. Мне довольно интересными показались доклады с РОМИПа. По тем формулам можно гораздо более точную формулу построить, только вот там данных не хватает.

доклады с РОМИПа изучаются, и более того, там и про кучность есть


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 26.10.2010, 13:32; Ответить: webpavilion
Сообщение #28


(seo2z @ 26.10.2010, 13:05) *
доклады с РОМИПа изучаются, и более того, там и про кучность есть

на основе работы Сафронова (РОМИП-09) о кучности реализовывал в коде (php5-ООП) алгоритмы расчета только вместо BM25 использовал BM11. пробовал строить формулу с учетом не ближайших а нескольких (3 и 5) вхождений. результаты интересные но в практических целях трудно применимые. ребята из hh молодцы, на великом и могучем это единственная стать о "Proximity Scoring"

(seo2z @ 26.10.2010, 12:45) *
если общение сложится полезным, то почему же, будет. Только не ходите вокруг да около, предлагайте цену своей информации
материально я вполне обеспечен, морального удовлетворения от общения на не интересную мне на данный момент тему не получу. меняться вроде как не на что. желаю удачи в поиске ответов.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kakaya_raznica
kakaya_raznica
сообщение 26.10.2010, 13:46; Ответить: kakaya_raznica
Сообщение #29


(seo2z @ 26.10.2010, 13:02) *
bm25 рассчитать проще пареной репы, и скажу вам, что это не самый весомый фактор

На сколько я знаю в bm25 есть такое значение как, допустим средняя длина документа коллекции (как ее рассчитывать), плюс он отдельно применяется для заголовков, текста, возможно, для кусков текста и прочее. А еще вес слова запроса в данной коллекции будет применяться там по-любому. Как это все обсчитывать? Кучность - это вы про доклад Сафронова?

(webpavilion @ 26.10.2010, 13:32) *
ребята из hh молодцы, на великом и могучем это единственная стать о "Proximity Scoring"

Конечно молодцы, теперь Сафронов от имени Яндекса доклады пишет smile.gif
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seo2z
seo2z
Topic Starter сообщение 26.10.2010, 13:48; Ответить: seo2z
Сообщение #30


Как это все обсчитывать?

правильно мыслите, вот ответ на этот вопрос мы и хотим реализовать.
Кучность - это вы про доклад Сафронова?

не только, он его доклад попадает под исследования.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kakaya_raznica
kakaya_raznica
сообщение 26.10.2010, 13:52; Ответить: kakaya_raznica
Сообщение #31


(seo2z @ 26.10.2010, 13:48) *
правильно мыслите, вот ответ на этот вопрос мы и хотим реализовать.

Пока, я склоняюсь к мысли, что надо делать свое, а не пытаться побороть Яндекс. И не палить эту тему)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
5 страниц V  < 1 2 3 4 5 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Проаю свое детище - анализатор сайтов
0 Megoydagi 2272 11.4.2020, 3:51
автор: Megoydagi
Открытая тема (нет новых ответов) Анализатор сайтов
1 mforve 2129 12.3.2013, 21:09
автор: mforve
Открытая тема (нет новых ответов) Скрипт анализатор сайта как на pr-cy
Скрипт анализатор сайта как на pr-cy
1 Dinamit87 4683 1.2.2013, 18:52
автор: шахидочка_программист


 



RSS Текстовая версия Сейчас: 26.4.2024, 6:39
Дизайн