Помощник
|
Парсинг внутренних ссылок |
FLASH92
|
Сообщение
#1
|
||
|
|
||
|
|||
digwnews |
4.1.2011, 20:20;
Ответить: digwnews
Сообщение
#2
|
|
То есть нужно только получить внутренние урлы и заголовки на этих страницах?
|
|
|
WebAction |
4.1.2011, 20:23;
Ответить: WebAction
Сообщение
#3
|
|
Xenu's Link Sleuth. Ссылку думаю найдете сами.
-------------------- |
|
|
FLASH92
|
Сообщение
#4
|
|
То есть нужно только получить внутренние урлы и заголовки на этих страницах? Да нужно получить все внутренние ссылки + заголовок, ну чтобы картинвную ссылку составила прога с анкором. Например < a href="ya.ru">Поисковая система яндекс</a> и вот все ссылки которые есть у яндекса таким образом собирал, но это коречно не для яндекса надо а для моего сайта. -------------------- |
|
|
FjuZ |
4.1.2011, 23:01;
Ответить: FjuZ
Сообщение
#5
|
|
preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches);
-------------------- |
|
|
FLASH92
|
Сообщение
#6
|
|
preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches); Я в пхп нуб, но...вот этот код обойдет все страницы моего сайта? и сделает урл с анкором? -------------------- |
|
|
FjuZ |
5.1.2011, 4:33;
Ответить: FjuZ
Сообщение
#7
|
|
$url="http://site.ru/"; $text=file_get_contents($url); preg_match_all('%<a .*?href="/.*".*?>.*</a>%', $text, $matches); print_r($matches) вот этот обойдет ах, нет, не все страницы. только страница которая в переменной. можеш создать массив со страницами с которых нужно парсить и пропустить регулярку по нему. Сообщение отредактировал FjuZ - 5.1.2011, 4:34 -------------------- |
|
|
Добрый_Тролль |
5.1.2011, 4:37;
Ответить: Добрый_Тролль
Сообщение
#8
|
|
Тебе нужен урл и ТАЙТЛ внутренних страниц?
Скинь в ЛС. Попробую спарсить. |
|
|
dan1 |
5.1.2011, 13:41;
Ответить: dan1
Сообщение
#9
|
|
Fluz спасибо за регулярку, теперь ведь можно сделать рекурсивную функцию, которая будет принимать найденный на странице урл, вот и получится парсинг всех внутренних ссылок.
Для определения тайтлов, можно использовать эту регулярку: if (preg_match('|<title.*?>(.*)</title>|sei', $str, $arr)) $title = $arr[1];
else $title=''; Сообщение отредактировал dan1 - 5.1.2011, 13:45 |
|
|
FLASH92
|
Сообщение
#10
|
|
А может ктонить составит из этого лего целый код? чтобы дал домен скрипту, он обходит все страницы сайта и вытаскивает внутренняки с тайтлом в активную ссылку?
Сообщение отредактировал FLASH92 - 5.1.2011, 15:10 -------------------- |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Быстрая индексация страниц сайта и обратных ссылок - 2Index | 39 | 2Index | 6740 | 22.4.2024, 16:16 автор: 2Index |
|
GogetTop.net - сервис аренды ссылок с сети PBN адалт тьюбо | 1 | Crimean | 1444 | 11.4.2024, 10:05 автор: Crimean |
|
Трафик в Телеграм (рассылка, инвайт, парсинг) | 9 | gelt | 2858 | 8.4.2024, 15:28 автор: gelt |
|
Ручное размещение вечных ссылок и статей на хороших площадках Опыт 10 лет! |
420 | leonidukg | 274824 | 8.4.2024, 12:06 автор: leonidukg |
|
Крауд-маркетинг. Ручное размещение ссылок под бурж с гарантией | 24 | seolink.orders | 12935 | 2.4.2024, 17:23 автор: seolink.orders |
Текстовая версия | Сейчас: 25.4.2024, 11:21 |