X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Синонимайзер и закон Ципф кто кого?
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:35; Ответить: webpavilion
Сообщение #1


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


Наверное многие в рунете уверены в том что по закону Ципфа яндекс в легкую определяет синонимизированный текст и благодаря этому борется с ГС. Так ли это на самом деле?

Посмотреть результаты эксперимента.



Сообщение отредактировал webpavilion - 10.10.2010, 11:35


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Live_and_Die
Live_and_Die
сообщение 10.10.2010, 11:44; Ответить: Live_and_Die
Сообщение #2


† Thℜash Met∀l †
******


Группа: Active User
Сообщений: 1301
Регистрация: 21.9.2009
Из: ΜAℜŠ
Поблагодарили: 1037 раз
Репутация:   146  


Хорошему синонимайзингу жизнь ?
Смотрел на графики и ничего не понял biggrin.gif


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Room
Room
сообщение 10.10.2010, 11:50; Ответить: Room
Сообщение #3


Топовый постер
*******


Группа: Active User
Сообщений: 8091
Регистрация: 11.4.2009
Из: Восточная Cибирь, Красноярский край
Поблагодарили: 1990 раз
Репутация:   431  


huh.gif Непонятно.


--------------------
Комплексное продвижение (прогон) сайтов ру и en
Умножаем срок оплаты на два! Получи бонусом до 3-х лет хостинга или VPS!
Cтрочка свободна и сдается в аренду
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 11:51; Ответить: webpavilion
Сообщение #4


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(Live_and_Die @ 10.10.2010, 11:44) *
Хорошему синонимайзингу жизнь ?
Скорее не хорошему а умному и хитрому, любой алгоритм можно обмануть.

(Live_and_Die @ 10.10.2010, 11:44) *
Смотрел на графики и ничего не понял biggrin.gif
(Room @ 10.10.2010, 11:50) *
huh.gif Непонятно.


почитайте вводную статью (в начале статьи ссылка на нее), если что то конкретное не понятно спрашивайте, постараюсь объяснить.

Сообщение отредактировал webpavilion - 10.10.2010, 11:58


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:09; Ответить: genjnat
Сообщение #5


Старожил
******

Группа: Active User
Сообщений: 2276
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1025 раз
Репутация:   114  


Вот здесь неочень понял - слово|один из|случайных|синонимов
Жду анализа частотности слов.
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:20; Ответить: webpavilion
Сообщение #6


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:09) *
Вот здесь неочень понял - слово|один из|случайных|синонимов

словарь выглядит вот так:
лжете|врете|клевещете|обманываете|брешете|?
?очиняете
пожизненно|навсегда|вечно|навечно|на всю жизнь|бессрочно|насовсем

и т.д. в группе А замена была лжете->врете, пожизненно->навсегда в группе Б лжете->(врете|клевещете|обманываете|брешете|сочи
няете) слово выбиралось случайное.

(genjnat @ 10.10.2010, 12:09) *
Еще более интересным был бы анализ определения синонемизированных тестов на основе сопоставления с оригиналом по структуре материала (длинна предложений и их структура, обзаццы, знаки препинания и т.д.).
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.

(genjnat @ 10.10.2010, 12:09) *
Жду анализа частотности слов.
очень медленно работает ~10К слов в час, старые результаты не сохранились к сожалению.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:31; Ответить: genjnat
Сообщение #7


Старожил
******

Группа: Active User
Сообщений: 2276
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1025 раз
Репутация:   114  


(webpavilion @ 10.10.2010, 11:20) *
разница не велика, предложения чуть длиннее (на 5-10%) абзацы и знаки препинания остаются на своих местах.


Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
Было бы здорово наглядно увидеть, до какой степени следует менять структуру, чтоб получить и в этом смысле уникальный материал.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 12:36; Ответить: webpavilion
Сообщение #8


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:31) *
Можно предположить, что по этой метрике синонимизированный текст и палится.
По крайней мере, это самый простой и верный способ.
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
genjnat
genjnat
сообщение 10.10.2010, 12:48; Ответить: genjnat
Сообщение #9


Старожил
******

Группа: Active User
Сообщений: 2276
Регистрация: 29.10.2008
Из: Одесса
Поблагодарили: 1025 раз
Репутация:   114  


(webpavilion @ 10.10.2010, 11:36) *
вовсе не по этой. предложенный вами параметр не является показателем естественности, он зависит большей частью от автора текста.

Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
Topic Starter сообщение 10.10.2010, 14:36; Ответить: webpavilion
Сообщение #10


сеошник на пенсии
*******

Группа: Active User
Сообщений: 2726
Регистрация: 28.4.2009
Из: МО
Поблагодарили: 1659 раз
Репутация:   171  


(genjnat @ 10.10.2010, 12:48) *
Зависит от автора оригинального текста, а человек или программа синонимизируящая его в большинстве случаев этот параметр оставляет неизменной.
И как мне кажется составить алгоритм анализа текста на какойто математической основе проще.
Я не настаиваю, просто интересно почему вы отвергаете такое предположение.
Потому, что пробовал реализовать что-то подобное. Напишу статью на эту тему.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Оцените сайт на рыболовную тематику. Все кто любят критиковать прошу сюда.
3 alexandrrr 415 Вчера, 23:28
автор: alexandrrr
Открытая тема (нет новых ответов) Facebook палит прокси. Кто как решает эту проблему?
28 Twickbot 3626 Вчера, 20:26
автор: galikfor
Открытая тема (нет новых ответов) 10 бесплатных сервисов Google для бизнеса, о которых мало кто слышал
18 jack 5934 Вчера, 12:29
автор: Akeeloq
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыКто и что читает?
Любимые и не только, книги.
251 Levels 31175 11.12.2017, 16:47
автор: Catherine_Molli
Открытая тема (нет новых ответов) Кто продвигает сайт в яндексе массовой закупкой ссылок?
13 aleggator 1925 8.12.2017, 4:19
автор: KvadroJ


 



RSS Текстовая версия Сейчас: 15.12.2017, 23:34
Дизайн