X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Добавить ответ в эту тему
> WebArchiveMaster - парсер Вебархива, Добыча контента из ВебАрхива
footashes
footashes
Topic Starter сообщение 3.10.2017, 16:04; Ответить: footashes
Сообщение #1




WebArchiveMaster - программа парсинга контента из ВебАрхива. Программа полностью автоматизирована и позволяет разгрузить своё время на 90%. Программа работает в связке с PHP скриптом, который можно поставить на любой хостинг или использовать Open Server - https://ospanel.io (рекомендуется).

Напишу из своего опыта, почему лучше парсить текст, а не готовый сайт со скриптами, фото, css и т.д, хотя, казалось бы - получить готовый сайт, забросить его на хостинг и получать профит, потом спарсить ещё десять и получать в десять раз больше профита. Очень жаль, но будет совсем не так.

1. Вы спарсили готовый сайт, и нарисовалась первая проблема - нулевая уникальность текста. Такой сайт, скорее всего, не войдет даже в индекс.
2. Адаптивный шаблон. Многие сайты находятся в Вебархиве не один год и заточены под СЕО своего года. Сейчас все поменялось, огромное количество трафика идет со смартфонов и планшетов. Шаблоны старых сайтов под это не приспособлены, а значит, вам придется вручную или за деньги переносить текста с перелинковкой на новый сайт. Это тоже самое, что сделать сайт с нуля.
3. Ключевые слова. Крайне мало текстов используют ключевые слова на уровне 2017 года либо вовсе их не используют - НК, НЧ, СНЧ -хвосты: такие текста никогда не поднимутся выше десятой страницы. Также используются выделения ключей, что в наше время неприемлемо.
4. Сюрпризы в виде шифрованных ссылок, переадресаций, поисковый спам.
5. Дропы. Если вы думаете, что имеет смысл восстановить сайт на его же дропе, вы играете с огнем. На моей памяти, из 30-40 дропов выстреливал, дай бог, один-два. Оставьте дропы дорвейщикам, для них использование дропов целесообразно - жестко проспамить, получить (или не получить) какой-то профит и выбросить его. 99% всех дропов под фильтрами ПС - это может быть и поисковый спам, и обмен комментариями и ещё 1000 причин. Потратите кучу времени, денег для переноса на CMS и оплату хостинга и получите только потерю времени. С восстановлением сайтов и получение какого-то профита с них вы опоздали примерно на 5-6 лет.

На данное время единственно верная стратегия, которую я вывел и использую - покупка 1-2-3 летнего сайта на Телдери, заполнение его уникальным контентом из Вебархива с внедрением ключей и использованием цитат, подзаголовков и прочего СЕО (смотрите выдачу, какие сайты в первой десятке и почему). Такой сайт имеет траст и доверие ПС, и ему прощается то, за что сайт меньше 6-12 месяцев просто выбросят из поиска.

Либо вы продаете пачку уникальных статей на СЕО форумах - покупатель должен знать, что текст из Вебархива, чтобы использовать его как можно быстрее - не вы одни ищете текста.

Можно продавать на биржах текста, но на свой страх и риск, там есть много тонкостей и в любой момент ваш аккаунт могут забанить.

Ссылка на тему на Зеннолабе - http://zennolab.com/discussion/threads/web...ebarxiva.40540/
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Telnor
Telnor
сообщение 3.10.2017, 16:52; Ответить: Telnor
Сообщение #2


footashes, первым за отзыв или со скидкой не будет :)?


--------------------
Продаются сайты с доходом, недорого
Сдам место в подписи, или обменяю на хостинг
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
footashes
footashes
Topic Starter сообщение 3.10.2017, 16:58; Ответить: footashes
Сообщение #3


Цитата(Telnor @ 3.10.2017, 16:52) *
footashes, первым за отзыв или со скидкой не будет :)?

WebArchiveMaster +Black Widow Spider=500 рублей. Могу дать скидку 200 рублей. Прошу учесть, что это шаблоны для Зеннопостер. Кому нужно, можете писать на footashes@gmail.com.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Telnor
Telnor
сообщение 3.10.2017, 17:05; Ответить: Telnor
Сообщение #4


Цитата(footashes @ 3.10.2017, 15:58) *
Прошу учесть, что это шаблоны для Зеннопостер.

А без него WebArchiveMaster не работает?
Цитата(footashes @ 3.10.2017, 15:58) *
Могу дать скидку 200 рублей.

Бронирую скидку.


--------------------
Продаются сайты с доходом, недорого
Сдам место в подписи, или обменяю на хостинг
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
footashes
footashes
Topic Starter сообщение 3.10.2017, 17:19; Ответить: footashes
Сообщение #5


Telnor,
Нет, это не самостоятельная программа, а шаблон для программы Зеннопостер. Шаблон открыт для редактирования и вы можете изучить его.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Telnor
Telnor
сообщение 3.10.2017, 17:23; Ответить: Telnor
Сообщение #6


footashes, а сам Зеннопостер сколько стоит?


--------------------
Продаются сайты с доходом, недорого
Сдам место в подписи, или обменяю на хостинг
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
footashes
footashes
Topic Starter сообщение 4.10.2017, 6:57; Ответить: footashes
Сообщение #7


Через пару дней открываю сервер распознавания текстовых капч на базе XEvil Ultra (Google Recaptcha2 через несколько недель). Безлимитное распознавание более 4600+ видов капч. Поддерживаемые типы изображений перечислены в данном списке: https://yadi.sk/d/-QKQsZ933MWy9L

Программа практически полностью заменяет такие сервисы, как AntiGate (Anti-Captcha), RuCaptcha, DeCaptcher и другие. При этом, существенно их превосходит по скорости распознавания (в 10 раз и более).

Можно подключать любой сео-софт, где требуется ввод текстовой капчи - кей коллектор, антиплагиат и т.д. Для каждого даю тест на час, чтобы было понятно, устраивает его этот сервис или нужная программа не работает с этим сервером.

Хотелось бы узнать - какая цена в месяц вас бы устроила? Пишите свои предложения на obrnadzorgov@yandex.ru, чтобы не засорять ЛС.

Да, какой бы ни была цена (а она будет небольшой), покупателям WebArchiveMasters скидка 50%.

Сообщение отредактировал footashes - 4.10.2017, 6:58


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
footashes
footashes
Topic Starter сообщение 5.10.2017, 22:43; Ответить: footashes
Сообщение #8


Через пару дней открываю сервер распознавания текстовых капч на базе XEvil Ultra (Google Recaptcha2 через несколько недель). Безлимитное распознавание более 4600+ видов капч. Поддерживаемые типы изображений перечислены в данном списке: https://yadi.sk/d/-QKQsZ933MWy9L

Программа практически полностью заменяет такие сервисы, как AntiGate (Anti-Captcha), RuCaptcha, DeCaptcher и другие. При этом, существенно их превосходит по скорости распознавания (в 10 раз и более).

Можно подключать любой сео-софт, где требуется ввод текстовой капчи - кей коллектор, антиплагиат и т.д. Для каждого даю тест на час, чтобы было понятно, устраивает его этот сервис или нужная программа не работает с этим сервером. Хотелось бы узнать - какая цена в месяц вас бы устроила?

Да, какой бы ни была цена (а она будет небольшой), покупателям WebArchiveMasters скидка 50%.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
footashes
footashes
Topic Starter сообщение 25.10.2017, 22:02; Ответить: footashes
Сообщение #9


Обновление WebArchiveMaster - парсера Вебархива.

1. Устранена проблема с Config.сfg - теперь задаваемое количество минимальных символов отрабатывает корректно.
2. Добавлен новый файл конфигурации - Kategory.сfg, который отвечает за исключение анонсов статей. Как правило, работает только со стандартными CMS и отсекает около 60% ненужных коротких анонсов. Но за счет чистки ненужных данных снижена скорость. По умолчанию в Kategory.сfg стоит цифра "1", что означает включение, вы можете отключить чистку категорий и ускорить парсинг, поставив "0". Можно при работающем проекте менять значения.
3. Теперь все данные сохраняются в одну папку, без "www"
4. Отрегулирован PHP скрипт, но мусор все равно будет цеплять - если текст небольшой, а данных на странице много (комментарии, рекламные слоганы, которые бывают больше текста), то неизбежно бесшаблонный парсер захватит их. Если текст чистый более-менее, то всё ненужное отсечётся.
5. Новый файл конфигурации - Zapros.сfg. Он отвечает за проверку доменов на работоспособность - если домен работает, то он не проверяется, а берется следующий из списка. По умолчанию стоит цифра "1", если вы считаете, что теряется слишком много доменов, которые отвечают на запрос, что работают, а в действительности отключены и припаркованы (сервер не отдаёт ошибки), то можете поставить "0" и домены проверяться не будут. Но возрастает вероятность парсинга заведомо неуникальных текстов.

http://zennolab.com/discussion/threads/web...va.40540/page-5
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
freeax
freeax
сообщение 24.9.2018, 12:02; Ответить: freeax
Сообщение #10


Цитата(footashes @ 5.10.2017, 22:43) *
Через пару дней открываю сервер распознавания текстовых капч на базе XEvil Ultra (Google Recaptcha2 через несколько недель).


Скажите адрес сервера
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Добавить ответ в эту тему
Быстрый ответ
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
375 Forbidden 293752 6.11.2024, 13:18
автор: AParser_Support
Открытая тема (нет новых ответов) Парсер поисковой выдачи Яндекс под БАС
11 Kentavr009 3501 1.11.2024, 13:13
автор: Photographer360
Горячая тема (нет новых ответов) Восстановление сайтов из Вебархива в HTML или на Wordpress.
45 freeax 36787 12.9.2024, 16:19
автор: SpaceEx
Открытая тема (нет новых ответов) Требуется написать PHP парсер для сайта
0 slavalist 1615 19.6.2024, 17:35
автор: slavalist
Горячая тема (нет новых ответов) Занимаюсь добычей качественного контента из Вебархива. Опыт уже более трех лет
Предоставляю только качественный, читабельный контент.
62 kuz999 39408 27.7.2023, 13:55
автор: kuz999


 



RSS Текстовая версия Сейчас: 11.11.2024, 0:49
Дизайн