Привет всем, это снова я, Пуховой)
Хотелось бы запалить еще одну темку для новичков, а именно - создание базы каталогов для авто- и ручной регистрации вашего сайта.
Я думаю, многие догадались, о чем пойдет речь - о парсинге. Многие задаються целью - поднять тИЦ своему сайту. Именно поэтому мы будем рассматривать только ПС Яндекс. тИЦ сайта напрямую зависит от количества и качества ссылающихся на него сайтов, в народе принято называть их - бэк-линками, либо бэками, либо обратками.
Итак, я расскажу вам об очень хитром способе - о парсинге бэков. Делаеться это очень просто. Все что вам нужно - это неплохая база сайтов с ненулевыми, либо нулевыми параметрами. Зачем - станет понятно позднее. Берете эту базу, убираете из нее все лишнее, то есть - должны остаться только голые имена доменов без www, http:// и прочего. Выглядит это примерно так: "imya.ru" "maxix.com" "puhovoi.ru" Список этих сайтов мы благополучно сохраняем в текстовый файл. Объясню, зачем нам это нужно. Мы с вами, дорогие друзья, будем парсить бэки, либо упоминания этих сайтов в ПС, дабы получить удачный список индексируемых каталогов, белых или "серых". Для парсинга я выбрал программу AGRESS parser, которую удачно закрепил в аттаче. Прежде чем начинать ею пользоваться, доформируем нашу базу, назовем ее "База запросов". Для этого, после каждого имени домена мы добавляем "каталог" (что еще можно добавить - мозгуйте, друзья :-) ). То есть на выходе у вас должен быть готовый файл, с примерно следущим содержанием: "imya.ru" "каталог" "maxix.com" "каталог" "puhovoi.ru" "каталог" Сделали файл? Маладцы) Идем далее. Запускаем агресс, и добавляем этот файл в запросы, предварительно выбрав в списке поисковиков "Yandex.txt".
Дальше - запускаем сам парсер, и смотрим, как у нас на чистом листе появляються страницы с упоминанием того или иного сайта. В 90% случаев - это каталоги.
После сбора информации, необходимо её отчистить, для этого подойдет allsubmitter. сохраните напарсенную базу, затем добавьте её в чистый оллсаб в ту или иную категорию. При импорте - не снимайте ни одной галки, таким образом у нас выйдет уникальная база без повторений.
Что же делать дальше?
А дальше, дорогие друзья, нам предстоит отфильтровать нашу с вами новоявленную базу от не каталогов и всякой чуши. Как это делать - думаю каждый додумаеться сам. Хотя бы задать начальный фильтр - %каталог% в названии, и проверять каждый. далее - сообразите. Затем проходите всю базу вручную - и на выходе у вас - самая актуальная база каталогов, что только есть.
*Из личного опыта. Таким образом получилось напарсить порядка 1500 индексируемых, белых каталога, и еще сотни две мусора. Дерзайте!
Вечно ваш, пуховой. Кому помогло - от спасибы ниаткажусь)
|
|