X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> Достоверные методы уникализации контента, Теория и практика по уникализации контента в глазах ПС
DrMax
DrMax
Topic Starter сообщение 26.11.2010, 22:53; Ответить: DrMax
Сообщение #1


Участник
***

Группа: User
Сообщений: 175
Регистрация: 30.5.2009
Из: Москва
Поблагодарили: 54 раза
Репутация:   8  


Доброго дня. Хотелось бы поделится с Вами статьей, написанной специально для пользователей maultalk.
Речь пойдет о способах преобразования неуникального контента в уникальный. Статья состоит из теоретической и практической части, в которой я делюсь собственными наработками.

Теоретическая часть.

Как известно, существует несколько методов уникализации контента. На сегодняшний день основными методами являются:

1. Ручной, полуавтоматический и автоматический рерайт.

1.1. Рерайт ручками, при наличии у товарища рерайтера развитого словарного запаса, воображения и хорошего литературного стиля является наилучшим методом уникализации и, по сути, ничем не отличается от изложений, которые мы все писали в школе. Достоинством ручного рерайта является высочайшее качество текста, а недостатками огромные трудозатраты

1.2. Полуавтоматический рерайт осуществляется при помощи специального софта, который подсказывает товарищу рерайтеру тот или иной словооборот, при этом наличие словарного запаса у него (рерайтера) может быть невелико. Примером такой программы может выступать всем нам известный MS Word со встроенным тезарусом, который можно вызвать нажав правую кнопку мыши на слове к которому можно подобрать синоним.
В идеале такие программы должны иметь сверхзаточенный тезарус по тематике рерайта и удобный (быстрый) диалог по выбору/замене синонимов. Требований к таким программам можно предъявить очень много, но в итоге качество отрерайченного контента не сильно уступает ручному рерайту, а скорость работы возрастает вдвое – втрое.

1.3. Под автоматическим рерайтом имеется в виду перефразирование и синонимизация программными продуктами, переводы с одного языка на другой и т.д.
Качество контента на выходе сильно зависит от технологий синонимайзера (морфология, связи в предложениях и т.д.), развитости, качества и тематичности баз или корпусов словоформ. Имеющиеся на рынке синонимайзеры значительно уступают по качеству выходного контента даже полуавтоматическому рерайтеру по ряду причин: нетематичности баз, нерелевантности замены и т.д.


2. Сжатие текста

Контент можно достаточно хорошо синонимизировать, выполнив его сжатие (реферирование). Для этого возможно автоматическими методами выделить наиболее значимую часть текста, отбросив при этом несущественную часть. Возвращаясь к вышеупомянутому MS Word, необходимо отметить, что такая возможность (создание реферата из текста) в нем встроена.
Качество выходного текста сильно зависит от двух вещей: языка текста и применяемых методов анализа ключевых слов и связей. Как показывает практика, тот же Word приемлимо справляется с английским текстом, но с русским у него значительные трудности.


3. Разворачивание текста

Под этим методом подразумевается тематическое разбавление текста не несущими смысловой нагрузки оборотами, раскрытием сокращений, переводу цифр в строки, одной системы измерений в другую (метры в сантиметры, литры в галлоны или миллилитры), денежных средств (рубли в доллары по курсу ЦБ) и т.д.
Данная методика хорошо работает на технических текстах, а на литературных текстах приобретает иной смысловой оттенок, чем у автора. Некий прообраз мутатора текста и примеры я набросал на блоге LIPF.RU, кому интересно – посмотрите.
Как правило, текст не теряет осмысленности, но, при этом, в глазах Поисковых Систем (ПС) он становится более-менее уникальным.

4. Перемешивание текста (мешап)
Под мешапом (машапом) имеется в ввиду оперирование (перестановка) разными абзацами или предложениями текста в произвольном порядке для придания уникальности в глазах ПС. Этим приемом любят пользоваться дорвейщики, но в умелых руках это просто находка для уникализации контента. Читабельность текста зависит от того как перемешивается текст, откуда берется текст, от релевантного сочетания кусков текста и многих других факторов. В практической части я приведу пример такой технологии.


Все остальные методы уникализации контента так или иначе попадают под первые четыре или сочетают в себе несколько составляющих.

Перейдем теперь к практике

Практическая часть

Я использую сочетание нескольких технологий.

Автоматический рерайт
Для сателлитов, которые предназначены поддерживать основной сайт и двигать те или иные запросы у меня припасены собранные руками тематические базы словосочетаний с морфологией. Так, к примеру, моя строительная база содержит сейчас свыше 50 тыс словосочетаний и словоформ. При сборе собственных баз, главное - выдерживать строгую тематичность базы и не ленится ее пополнять и заменять неудачные словоформы.

Однако, какова бы не была база, для сохранения читабельности контента, нельзя ее использовать для нерелевантных замен (т.е. менять слова и словосочетания, если не уверен в правильности замены). Поэтому для дополнительной уникализации я использую 2-х ступенчатую систему мешапа.

Этап № 1 мешапа
Были собраны тематические базы определений и терминов с их расшифровкой. Далее эти расшифровки определений подмешиваются в текст, заключаясь в спец класс CSS, который показывает определение только при наведении мыши на термин.
С точки зрения пользователя, пояснение специфических терминов – является дополнительным преимуществом при использовании сайта, при этом страница сайта не загромождена ничем лишним. С точки зрения поисковых систем – контент становится более уникальным. Такие красивые тултипчики, собственно, крайне радуют посетителей сайта, если они применяются к месту.


Второй этап мешапа довольно прост, но вносит весомый вклад в униализацию контента.

Этап № 2 мешапа
Силами CMS вывожу по абзацу от 2-3 статей релевантной текущей. Например в WordPress это легко сделать плагином Simple Tags. Таким образом контент с точки зрения ПС становится опять таки более уникальным.

Умелое и разумное сочетание приведенных выше методов приводят к его достаточной уникализации с точки зрения ПС. Срок жизни этой технологии – почти 5 лет. Все операции по уникализации выполняются на полном автомате.

В особо одиозных случаях я используя ПиМорф удаляю незначащие прилагательные и выполняю разворачивание текста. Но это выполняю нечасто, ибо не особо необходимо, ибо методика работает на 100% даже при использовании любого неуникального контента.

Собственно все эти функции сейчас реализованы в Content Monster II, который заточен не только на верстку под разные там CMS, а сколько на умелую работу с контентом. Полюбопытствуйте на оффсайте.

На этом заканчиваю краткую статью по способам уникализации контента.
Жду критику, одобрения и предложений по совершенствованию.


--------------------
Сео измышлизмы на drmax.su.
-7
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Пуховой
Пуховой
сообщение 26.11.2010, 23:26; Ответить: Пуховой
Сообщение #2


Новичок
*******


Группа: Banned
Сообщений: 3674
Регистрация: 8.10.2007
Поблагодарили: 877 раз
Репутация:   251  


Собственно все эти функции сейчас реализованы в Content Monster II, который заточен не только на верстку под разные там CMS, а сколько на умелую работу с контентом. Полюбопытствуйте на оффсайте.

Вот только из-за этого вся статья выглядит как пустой бездоказательный треп, направленный на пиар программы.


Поблагодарили: (4)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arvinoff
Arvinoff
сообщение 27.11.2010, 19:28; Ответить: Arvinoff
Сообщение #3


Бывалый
****

Группа: User
Сообщений: 353
Регистрация: 24.4.2010
Поблагодарили: 77 раз
Репутация:   7  


Программу не юзал
Но скажу одно
Любые манипуляции с текстом для получения уникальности используя для этого софт - не оправдывает себя. Это все гов....
Халявы не бывает, а если и бывает то не в промышленных маштабах. И к тому же не только поисковые системы не любят сгенерированный контент (за это кстати часто банят или страницы выпадают с индекса) а и сами оптимизаторы которые покупают сслки с таких гов... страниц. Так что лучше заниматься качественны наполнением сайта и не думать про плохой исход вашей кампании.
Я к примеру выбираю копирайтинг или ручной рерайт зарубежных статей. В принципе это одно и тоже!!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Nikolas_Sharp
Nikolas_Sharp
сообщение 27.11.2010, 21:07; Ответить: Nikolas_Sharp
Сообщение #4


Частый гость
**

Группа: User
Сообщений: 92
Регистрация: 7.3.2010
Из: Киев
Поблагодарили: 34 раза
Репутация:   -1  


(Arvinoff @ 27.11.2010, 18:28) *
Халявы не бывает, а если и бывает то не в промышленных маштабах.
Тоже никогда не применяю машинных методов к текстам, но так как давно читаю блог автора статьи, да и у самого есть сайты, прекрасно сидящие на обычном копипасте, то вполне верю, что описанными методиками автор производит полууникальные тексты в промышленных масштабах, то есть халява все же бывает, и даже в промышленных масштабах smile.gif .


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
This-is-it
This-is-it
сообщение 27.11.2010, 21:23; Ответить: This-is-it
Сообщение #5


Новичок
*

Группа: User
Сообщений: 19
Регистрация: 27.11.2010
Поблагодарили: 0 раз
Репутация:   2  


а как насчет частотного анализа?
подмешать слова можно, но используется ли при этом естественная частота встречаемости слов в языке?

иначе палится будет на раз
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Bambr
Bambr
сообщение 28.11.2010, 10:39; Ответить: Bambr
Сообщение #6


Участник
***


Группа: User
Сообщений: 199
Регистрация: 22.5.2010
Поблагодарили: 30 раз
Репутация:   10  


Копипаст жил, жив и будет жить smile.gif)) Надо просто уметь его готовить.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
AndreyCH
AndreyCH
сообщение 29.11.2010, 19:56; Ответить: AndreyCH
Сообщение #7


Новичок
*


Группа: User
Сообщений: 20
Регистрация: 19.11.2010
Поблагодарили: 0 раз
Репутация:   0  


(Bambr @ 28.11.2010, 9:39) *
Копипаст жил, жив и будет жить smile.gif)) Надо просто уметь его готовить.

Безспорно. Точно так же контент, который создал сам, при прочих равных, будет всегда лучше.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Bambr
Bambr
сообщение 29.11.2010, 21:32; Ответить: Bambr
Сообщение #8


Участник
***


Группа: User
Сообщений: 199
Регистрация: 22.5.2010
Поблагодарили: 30 раз
Репутация:   10  


(AndreyCH @ 29.11.2010, 18:56) *
Безспорно. Точно так же контент, который создал сам, при прочих равных, будет всегда лучше.


Спасибо, Кэп! ))


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
MBM
MBM
сообщение 1.12.2010, 16:57; Ответить: MBM
Сообщение #9


Бывалый
****

Группа: User
Сообщений: 451
Регистрация: 27.9.2010
Из: Kieff
Поблагодарили: 121 раз
Репутация:   10  


Вот из такого и рождается полчище ГС smile.gif


--------------------
Кто-то делает зло, кто-то делает добро, а Я придумываю для этого упаковку.
Founder & CEO at Imagination Crafters
Follow @1ncom1ng and have a huge growth (:
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Delarante
Delarante
сообщение 1.12.2010, 19:59; Ответить: Delarante
Сообщение #10


Новичок
*

Группа: User
Сообщений: 16
Регистрация: 8.12.2008
Из: UA
Поблагодарили: 4 раза
Репутация:   0  


Машинная уникализация намного хуже чем простой, банальный копипаст.

Сообщение отредактировал Delarante - 1.12.2010, 20:00


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
168 Forbidden 103015 4.12.2017, 13:55
автор: AParser_Support
Открытая тема (нет новых ответов) Нужен парсер контента
Уважаемые знатоки, требуется ваш совет или рекомендация.
4 m1h3y 1041 20.11.2017, 6:56
автор: Strellok
Открытая тема (нет новых ответов) Вакансия, удаленный руководитель отдела контента 25 т. руб + премии
0 Geronimo 389 15.11.2017, 19:19
автор: Geronimo
Открытая тема (нет новых ответов) Монетизация не товарного контента
4 alexmain1107 1465 30.10.2017, 17:44
автор: romann
Открытая тема (нет новых ответов) Аудит контента и SEO стратегия обрезки
0 DrMax 444 27.10.2017, 11:22
автор: DrMax


 



RSS Текстовая версия Сейчас: 13.12.2017, 17:18
Дизайн