X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Парсинг внутренних ссылок
FLASH92
FLASH92
Topic Starter сообщение 4.1.2011, 17:23; Ответить: FLASH92
Сообщение #1


Всем привет, возникла необходимость отпарсить все внутренние ссылки сайта и + заголовок. Собственно может кто видел такой бесплатный софт, или ктото сможет отпарсить через свою прогу?


--------------------
Балатируюсь в президенты
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
digwnews
digwnews
сообщение 4.1.2011, 20:20; Ответить: digwnews
Сообщение #2


То есть нужно только получить внутренние урлы и заголовки на этих страницах?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
WebAction
WebAction
сообщение 4.1.2011, 20:23; Ответить: WebAction
Сообщение #3


Xenu's Link Sleuth. Ссылку думаю найдете сами.


--------------------
--тут может быть ваша реклама--
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FLASH92
FLASH92
Topic Starter сообщение 4.1.2011, 20:27; Ответить: FLASH92
Сообщение #4


(digwnews @ 5.1.2011, 1:20) *
То есть нужно только получить внутренние урлы и заголовки на этих страницах?

Да нужно получить все внутренние ссылки + заголовок, ну чтобы картинвную ссылку составила прога с анкором. Например < a href="ya.ru">Поисковая система яндекс</a> и вот все ссылки которые есть у яндекса таким образом собирал, но это коречно не для яндекса надо а для моего сайта.


--------------------
Балатируюсь в президенты
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FjuZ
FjuZ
сообщение 4.1.2011, 23:01; Ответить: FjuZ
Сообщение #5


preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches);


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FLASH92
FLASH92
Topic Starter сообщение 5.1.2011, 4:20; Ответить: FLASH92
Сообщение #6


(FjuZ @ 5.1.2011, 4:01) *
preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches);

Я в пхп нуб, но...вот этот код обойдет все страницы моего сайта? и сделает урл с анкором?


--------------------
Балатируюсь в президенты
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FjuZ
FjuZ
сообщение 5.1.2011, 4:33; Ответить: FjuZ
Сообщение #7


$url="http://site.ru/";
$text=file_get_contents($url);
preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches);
print_r($matches)

вот этот обойдет

ах, нет, не все страницы. только страница которая в переменной. можеш создать массив со страницами с которых нужно парсить и пропустить регулярку по нему.

Сообщение отредактировал FjuZ - 5.1.2011, 4:34


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Добрый_Тролль
Добрый_Тролль
сообщение 5.1.2011, 4:37; Ответить: Добрый_Тролль
Сообщение #8


Тебе нужен урл и ТАЙТЛ внутренних страниц?
Скинь в ЛС. Попробую спарсить.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
dan1
dan1
сообщение 5.1.2011, 13:41; Ответить: dan1
Сообщение #9


Fluz спасибо за регулярку, теперь ведь можно сделать рекурсивную функцию, которая будет принимать найденный на странице урл, вот и получится парсинг всех внутренних ссылок.
Для определения тайтлов, можно использовать эту регулярку:
if (preg_match('|<title.*?>(.*)</title>|sei', $str, $arr)) $title = $arr[1];
   else $title='';


Сообщение отредактировал dan1 - 5.1.2011, 13:45
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FLASH92
FLASH92
Topic Starter сообщение 5.1.2011, 15:10; Ответить: FLASH92
Сообщение #10


А может ктонить составит из этого лего целый код? чтобы дал домен скрипту, он обходит все страницы сайта и вытаскивает внутренняки с тайтлом в активную ссылку?

Сообщение отредактировал FLASH92 - 5.1.2011, 15:10


--------------------
Балатируюсь в президенты
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыБыстрая индексация страниц сайта и обратных ссылок - 2Index
39 2Index 6740 22.4.2024, 16:16
автор: 2Index
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыGogetTop.net - сервис аренды ссылок с сети PBN адалт тьюбо
1 Crimean 1444 11.4.2024, 10:05
автор: Crimean
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыТрафик в Телеграм (рассылка, инвайт, парсинг)
9 gelt 2858 8.4.2024, 15:28
автор: gelt
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыРучное размещение вечных ссылок и статей на хороших площадках
Опыт 10 лет!
420 leonidukg 274824 8.4.2024, 12:06
автор: leonidukg
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыКрауд-маркетинг. Ручное размещение ссылок под бурж с гарантией
24 seolink.orders 12935 2.4.2024, 17:23
автор: seolink.orders


 



RSS Текстовая версия Сейчас: 25.4.2024, 11:21
Дизайн