X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Синонимайзер и закон Ципф кто кого?
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:35; Ответить: webpavilion
Сообщение #1


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


Наверное многие в рунете уверены в том что по закону Ципфа яндекс в легкую определяет синонимизированный текст и благодаря этому борется с ГС. Так ли это на самом деле?

Посмотреть результаты эксперимента.



Сообщение отредактировал webpavilion - 10.10.2010, 11:35


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Live_and_Die
Live_and_Die
сообщение 10.10.2010, 11:44; Ответить: Live_and_Die
Сообщение #2


† Thℜash Met∀
******


Группа: Active User
Сообщений: 1302
Регистрация: 21.9.2009
Из: ΜAℜŠ
Поблагодарили: 1037 раз
Репутация:   146  


Хорошему синонимайзингу жизнь ?
Смотрел на графики и ничего не понял biggrin.gif


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Room
Room
сообщение 10.10.2010, 11:50; Ответить: Room
Сообщение #3


Топовый постер
*******


Группа: Active User
Сообщений: 8221
Регистрация: 11.4.2009
Поблагодарили: 2008 раз
Репутация:   435  


huh.gif Непонятно.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:51; Ответить: webpavilion
Сообщение #4


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(Live_and_Die @ 10.10.2010, 11:44) *
Хорошему синонимайзингу жизнь ?
Скорее не хорошему а умному и хитрому, любой алгоритм можно обмануть.

(Live_and_Die @ 10.10.2010, 11:44) *
Смотрел на графики и ничего не понял biggrin.gif
(Room @ 10.10.2010, 11:50) *
huh.gif Непонятно.


почитайте вводную статью (в начале статьи ссылка на нее), если что то конкретное не понятно спрашивайте, постараюсь объяснить.

Сообщение отредактировал webpavilion - 10.10.2010, 11:58


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:09; Ответить: genjnat
Сообщение #5


Старожил
******

Группа: Active User
Сообщений: 2330
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1037 раз
Репутация:   115  


Вот здесь неочень понял - слово|один из|случайных|синонимов
Жду анализа частотности слов.
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:20; Ответить: webpavilion
Сообщение #6


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:09) *
Вот здесь неочень понял - слово|один из|случайных|синонимов

словарь выглядит вот так:
лжете|врете|клевещете|обманываете|брешете|?
?очиняете
пожизненно|навсегда|вечно|навечно|на всю жизнь|бессрочно|насовсем

и т.д. в группе А замена была лжете->врете, пожизненно->навсегда в группе Б лжете->(врете|клевещете|обманываете|брешете|сочи
няете) слово выбиралось случайное.

(genjnat @ 10.10.2010, 12:09) *
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.

(genjnat @ 10.10.2010, 12:09) *
Жду анализа частотности слов.
очень медленно работает ~10К слов в час, старые результаты не сохранились к сожалению.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:31; Ответить: genjnat
Сообщение #7


Старожил
******

Группа: Active User
Сообщений: 2330
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1037 раз
Репутация:   115  


(webpavilion @ 10.10.2010, 11:20) *
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.


Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
Было бы здорово наглядно увидеть, до какой степени следует менять структуру, чтоб получить и в этом смысле уникальный материал.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:36; Ответить: webpavilion
Сообщение #8


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:31) *
Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:48; Ответить: genjnat
Сообщение #9


Старожил
******

Группа: Active User
Сообщений: 2330
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1037 раз
Репутация:   115  


(webpavilion @ 10.10.2010, 11:36) *
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.

Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 14:36; Ответить: webpavilion
Сообщение #10


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:48) *
Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.
Потому, что пробовал реализовать что-то подобное. Напишу статью на эту тему.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Кто накрутит живых пользователей в Фейсбук?
только живые
6 nazar2292 1002 5.5.2018, 20:58
автор: koldovsky
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыКто и что читает?
Любимые и не только, книги.
300 Levels 36459 26.4.2018, 23:41
автор: Saturn1984
Открытая тема (нет новых ответов) Вопрос к тем, кто зарабатывает на недвижимости?
Как заработать на недвижке.?
15 Dross 2739 26.4.2018, 18:26
автор: megachange
Горячая тема (нет новых ответов) 10 бесплатных сервисов Google для бизнеса, о которых мало кто слышал
36 jack 11133 17.4.2018, 22:49
автор: dedicat
Открытая тема (нет новых ответов) Есть кто с Брянской области?
нужно сравнить цены на топливо
8 EvilGomel 472 13.4.2018, 21:26
автор: ВераЩ


 



RSS Текстовая версия Сейчас: 21.5.2018, 9:59
Дизайн