X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Достоверные методы уникализации контента, Теория и практика по уникализации контента в глазах ПС
DrMax
DrMax
Topic Starter сообщение 26.11.2010, 22:53; Ответить: DrMax
Сообщение #1


Доброго дня. Хотелось бы поделится с Вами статьей, написанной специально для пользователей maultalk.
Речь пойдет о способах преобразования неуникального контента в уникальный. Статья состоит из теоретической и практической части, в которой я делюсь собственными наработками.

Теоретическая часть.

Как известно, существует несколько методов уникализации контента. На сегодняшний день основными методами являются:

1. Ручной, полуавтоматический и автоматический рерайт.

1.1. Рерайт ручками, при наличии у товарища рерайтера развитого словарного запаса, воображения и хорошего литературного стиля является наилучшим методом уникализации и, по сути, ничем не отличается от изложений, которые мы все писали в школе. Достоинством ручного рерайта является высочайшее качество текста, а недостатками огромные трудозатраты

1.2. Полуавтоматический рерайт осуществляется при помощи специального софта, который подсказывает товарищу рерайтеру тот или иной словооборот, при этом наличие словарного запаса у него (рерайтера) может быть невелико. Примером такой программы может выступать всем нам известный MS Word со встроенным тезарусом, который можно вызвать нажав правую кнопку мыши на слове к которому можно подобрать синоним.
В идеале такие программы должны иметь сверхзаточенный тезарус по тематике рерайта и удобный (быстрый) диалог по выбору/замене синонимов. Требований к таким программам можно предъявить очень много, но в итоге качество отрерайченного контента не сильно уступает ручному рерайту, а скорость работы возрастает вдвое – втрое.

1.3. Под автоматическим рерайтом имеется в виду перефразирование и синонимизация программными продуктами, переводы с одного языка на другой и т.д.
Качество контента на выходе сильно зависит от технологий синонимайзера (морфология, связи в предложениях и т.д.), развитости, качества и тематичности баз или корпусов словоформ. Имеющиеся на рынке синонимайзеры значительно уступают по качеству выходного контента даже полуавтоматическому рерайтеру по ряду причин: нетематичности баз, нерелевантности замены и т.д.


2. Сжатие текста

Контент можно достаточно хорошо синонимизировать, выполнив его сжатие (реферирование). Для этого возможно автоматическими методами выделить наиболее значимую часть текста, отбросив при этом несущественную часть. Возвращаясь к вышеупомянутому MS Word, необходимо отметить, что такая возможность (создание реферата из текста) в нем встроена.
Качество выходного текста сильно зависит от двух вещей: языка текста и применяемых методов анализа ключевых слов и связей. Как показывает практика, тот же Word приемлимо справляется с английским текстом, но с русским у него значительные трудности.


3. Разворачивание текста

Под этим методом подразумевается тематическое разбавление текста не несущими смысловой нагрузки оборотами, раскрытием сокращений, переводу цифр в строки, одной системы измерений в другую (метры в сантиметры, литры в галлоны или миллилитры), денежных средств (рубли в доллары по курсу ЦБ) и т.д.
Данная методика хорошо работает на технических текстах, а на литературных текстах приобретает иной смысловой оттенок, чем у автора. Некий прообраз мутатора текста и примеры я набросал на блоге LIPF.RU, кому интересно – посмотрите.
Как правило, текст не теряет осмысленности, но, при этом, в глазах Поисковых Систем (ПС) он становится более-менее уникальным.

4. Перемешивание текста (мешап)
Под мешапом (машапом) имеется в ввиду оперирование (перестановка) разными абзацами или предложениями текста в произвольном порядке для придания уникальности в глазах ПС. Этим приемом любят пользоваться дорвейщики, но в умелых руках это просто находка для уникализации контента. Читабельность текста зависит от того как перемешивается текст, откуда берется текст, от релевантного сочетания кусков текста и многих других факторов. В практической части я приведу пример такой технологии.


Все остальные методы уникализации контента так или иначе попадают под первые четыре или сочетают в себе несколько составляющих.

Перейдем теперь к практике

Практическая часть

Я использую сочетание нескольких технологий.

Автоматический рерайт
Для сателлитов, которые предназначены поддерживать основной сайт и двигать те или иные запросы у меня припасены собранные руками тематические базы словосочетаний с морфологией. Так, к примеру, моя строительная база содержит сейчас свыше 50 тыс словосочетаний и словоформ. При сборе собственных баз, главное - выдерживать строгую тематичность базы и не ленится ее пополнять и заменять неудачные словоформы.

Однако, какова бы не была база, для сохранения читабельности контента, нельзя ее использовать для нерелевантных замен (т.е. менять слова и словосочетания, если не уверен в правильности замены). Поэтому для дополнительной уникализации я использую 2-х ступенчатую систему мешапа.

Этап № 1 мешапа
Были собраны тематические базы определений и терминов с их расшифровкой. Далее эти расшифровки определений подмешиваются в текст, заключаясь в спец класс CSS, который показывает определение только при наведении мыши на термин.
С точки зрения пользователя, пояснение специфических терминов – является дополнительным преимуществом при использовании сайта, при этом страница сайта не загромождена ничем лишним. С точки зрения поисковых систем – контент становится более уникальным. Такие красивые тултипчики, собственно, крайне радуют посетителей сайта, если они применяются к месту.


Второй этап мешапа довольно прост, но вносит весомый вклад в униализацию контента.

Этап № 2 мешапа
Силами CMS вывожу по абзацу от 2-3 статей релевантной текущей. Например в WordPress это легко сделать плагином Simple Tags. Таким образом контент с точки зрения ПС становится опять таки более уникальным.

Умелое и разумное сочетание приведенных выше методов приводят к его достаточной уникализации с точки зрения ПС. Срок жизни этой технологии – почти 5 лет. Все операции по уникализации выполняются на полном автомате.

В особо одиозных случаях я используя ПиМорф удаляю незначащие прилагательные и выполняю разворачивание текста. Но это выполняю нечасто, ибо не особо необходимо, ибо методика работает на 100% даже при использовании любого неуникального контента.

Собственно все эти функции сейчас реализованы в Content Monster II, который заточен не только на верстку под разные там CMS, а сколько на умелую работу с контентом. Полюбопытствуйте на оффсайте.

На этом заканчиваю краткую статью по способам уникализации контента.
Жду критику, одобрения и предложений по совершенствованию.


--------------------
Сео измышлизмы на drmax.su.
-7
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Пуховой
Пуховой
сообщение 26.11.2010, 23:26; Ответить: Пуховой
Сообщение #2


Собственно все эти функции сейчас реализованы в Content Monster II, который заточен не только на верстку под разные там CMS, а сколько на умелую работу с контентом. Полюбопытствуйте на оффсайте.

Вот только из-за этого вся статья выглядит как пустой бездоказательный треп, направленный на пиар программы.


Поблагодарили: (4)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arvinoff
Arvinoff
сообщение 27.11.2010, 19:28; Ответить: Arvinoff
Сообщение #3


Программу не юзал
Но скажу одно
Любые манипуляции с текстом для получения уникальности используя для этого софт - не оправдывает себя. Это все гов....
Халявы не бывает, а если и бывает то не в промышленных маштабах. И к тому же не только поисковые системы не любят сгенерированный контент (за это кстати часто банят или страницы выпадают с индекса) а и сами оптимизаторы которые покупают сслки с таких гов... страниц. Так что лучше заниматься качественны наполнением сайта и не думать про плохой исход вашей кампании.
Я к примеру выбираю копирайтинг или ручной рерайт зарубежных статей. В принципе это одно и тоже!!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Nikolas_Sharp
Nikolas_Sharp
сообщение 27.11.2010, 21:07; Ответить: Nikolas_Sharp
Сообщение #4


(Arvinoff @ 27.11.2010, 18:28) *
Халявы не бывает, а если и бывает то не в промышленных маштабах.
Тоже никогда не применяю машинных методов к текстам, но так как давно читаю блог автора статьи, да и у самого есть сайты, прекрасно сидящие на обычном копипасте, то вполне верю, что описанными методиками автор производит полууникальные тексты в промышленных масштабах, то есть халява все же бывает, и даже в промышленных масштабах smile.gif .


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
This-is-it
This-is-it
сообщение 27.11.2010, 21:23; Ответить: This-is-it
Сообщение #5


а как насчет частотного анализа?
подмешать слова можно, но используется ли при этом естественная частота встречаемости слов в языке?

иначе палится будет на раз
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Bambr
Bambr
сообщение 28.11.2010, 10:39; Ответить: Bambr
Сообщение #6


Копипаст жил, жив и будет жить smile.gif)) Надо просто уметь его готовить.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
AndreyCH
AndreyCH
сообщение 29.11.2010, 19:56; Ответить: AndreyCH
Сообщение #7


(Bambr @ 28.11.2010, 9:39) *
Копипаст жил, жив и будет жить smile.gif)) Надо просто уметь его готовить.

Безспорно. Точно так же контент, который создал сам, при прочих равных, будет всегда лучше.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Bambr
Bambr
сообщение 29.11.2010, 21:32; Ответить: Bambr
Сообщение #8


(AndreyCH @ 29.11.2010, 18:56) *
Безспорно. Точно так же контент, который создал сам, при прочих равных, будет всегда лучше.


Спасибо, Кэп! ))


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
MBM
MBM
сообщение 1.12.2010, 16:57; Ответить: MBM
Сообщение #9


Вот из такого и рождается полчище ГС smile.gif


--------------------
Кто-то делает зло, кто-то делает добро, а Я придумываю для этого упаковку.
Founder & CEO at Imagination Crafters
Follow @1ncom1ng and have a huge growth (:
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Delarante
Delarante
сообщение 1.12.2010, 19:59; Ответить: Delarante
Сообщение #10


Машинная уникализация намного хуже чем простой, банальный копипаст.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.


Сообщение отредактировал Delarante - 1.12.2010, 20:00


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
354 Forbidden 279380 Вчера, 16:05
автор: AParser_Support
Открытая тема (нет новых ответов) Дайте бесплатного контента! :)
2 Tia2 999 22.12.2023, 18:53
автор: zyzy
Горячая тема (нет новых ответов) Занимаюсь добычей качественного контента из Вебархива. Опыт уже более трех лет
Предоставляю только качественный, читабельный контент.
62 kuz999 38111 27.7.2023, 13:55
автор: kuz999
Открытая тема (нет новых ответов) Ищу помощника (SEO, сбор информации, размещение контента на сайтах, рутина)
0 rokot 831 8.2.2023, 18:35
автор: rokot
Открытая тема (нет новых ответов) Плагин для Wordpress. Вывод контента в зависимости от страны пользователя.
8 neuch 2299 19.9.2022, 7:51
автор: neuch


 



RSS Текстовая версия Сейчас: 23.4.2024, 13:42
Дизайн