X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Синонимайзер и закон Ципф кто кого?
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:35; Ответить: webpavilion
Сообщение #1


Наверное многие в рунете уверены в том что по закону Ципфа яндекс в легкую определяет синонимизированный текст и благодаря этому борется с ГС. Так ли это на самом деле?

Посмотреть результаты эксперимента.



Сообщение отредактировал webpavilion - 10.10.2010, 11:35


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Live_and_Die
Live_and_Die
сообщение 10.10.2010, 11:44; Ответить: Live_and_Die
Сообщение #2


Хорошему синонимайзингу жизнь ?
Смотрел на графики и ничего не понял biggrin.gif
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Room
Room
сообщение 10.10.2010, 11:50; Ответить: Room
Сообщение #3


huh.gif Непонятно.


--------------------
Место в подписи свободно и сдается в аренду
Место в подписи свободно и сдается в аренду
Прогон по 4 млн. сайтов - тысячи обратных ссылок!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:51; Ответить: webpavilion
Сообщение #4


(Live_and_Die @ 10.10.2010, 11:44) *
Хорошему синонимайзингу жизнь ?
Скорее не хорошему а умному и хитрому, любой алгоритм можно обмануть.

(Live_and_Die @ 10.10.2010, 11:44) *
Смотрел на графики и ничего не понял biggrin.gif
(Room @ 10.10.2010, 11:50) *
huh.gif Непонятно.


почитайте вводную статью (в начале статьи ссылка на нее), если что то конкретное не понятно спрашивайте, постараюсь объяснить.

Сообщение отредактировал webpavilion - 10.10.2010, 11:58


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:09; Ответить: genjnat
Сообщение #5


Вот здесь неочень понял - слово|один из|случайных|синонимов
Жду анализа частотности слов.
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:20; Ответить: webpavilion
Сообщение #6


(genjnat @ 10.10.2010, 12:09) *
Вот здесь неочень понял - слово|один из|случайных|синонимов

словарь выглядит вот так:
лжете|врете|клевещете|обманываете|брешете|?
?очиняете
пожизненно|навсегда|вечно|навечно|на всю жизнь|бессрочно|насовсем

и т.д. в группе А замена была лжете->врете, пожизненно->навсегда в группе Б лжете->(врете|клевещете|обманываете|брешете|сочи
няете) слово выбиралось случайное.

(genjnat @ 10.10.2010, 12:09) *
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.

(genjnat @ 10.10.2010, 12:09) *
Жду анализа частотности слов.
очень медленно работает ~10К слов в час, старые результаты не сохранились к сожалению.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:31; Ответить: genjnat
Сообщение #7


(webpavilion @ 10.10.2010, 11:20) *
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.


Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
Было бы здорово наглядно увидеть, до какой степени следует менять структуру, чтоб получить и в этом смысле уникальный материал.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:36; Ответить: webpavilion
Сообщение #8


(genjnat @ 10.10.2010, 12:31) *
Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:48; Ответить: genjnat
Сообщение #9


(webpavilion @ 10.10.2010, 11:36) *
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.

Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 14:36; Ответить: webpavilion
Сообщение #10


(genjnat @ 10.10.2010, 12:48) *
Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.
Потому, что пробовал реализовать что-то подобное. Напишу статью на эту тему.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Кто где хранит файлы? И какой объем?
просто интересно
22 mark2013 2642 15.4.2024, 8:08
автор: Room
Горячая тема (нет новых ответов) LITE.HOST - хостинг для тех, кто любит не переплачивать
74 akkyoh 30857 6.4.2024, 19:41
автор: Kseniya_Klimova
Открытая тема (нет новых ответов) Пишет кто отзывы на сайт в янднекс с разных аккаунтах
1 TenDemon_rs 1172 22.3.2024, 13:18
автор: writer80
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыКто и зачем покупает картинки обезьян по $200 тысяч?
NFT
167 metvekot 27408 6.3.2024, 21:58
автор: Boymaster
Открытая тема (нет новых ответов) Тизерная сеть Visitweb - кто покупает здесь трафик?
3 Boymaster 1351 29.2.2024, 10:24
автор: Skyworker


 



RSS Текстовая версия Сейчас: 18.4.2024, 21:29
Дизайн