X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Парсер NewsRu.Com
ParavoZ
ParavoZ
Topic Starter сообщение 3.8.2010, 17:11; Ответить: ParavoZ
Сообщение #1


Запускаем на сервере, и все нормалян парсит.

<?php
$vip = file_get_contents("http://newsru.com/arch/02aug2010/sport/index.html"); // ставим ссылку, такого же вида как в примере 
$n = preg_match_all('!<td width="100%"><a href=(.*) class="headcolumn">!i', $vip, $result);
if($n)
{
for($a=0;$a<$n;$a++)
{
$page = file_get_contents("http://newsru.com".$result[1][$a]);

$regex = preg_match_all('!<h1 class="mainhead">(.*)</h1></td></tr>.*<div class="maintext">.*</a></div>.*<p>(.*)<p style="clear: both">!isU', $page, $itog);
if($regex)
{

echo $itog[1][0].'<br>';
$itog[2][0] = preg_replace("!<a.*>!sU", " " , $itog[2][0]);
$itog[2][0] = preg_replace("!</a>!sU", " " , $itog[2][0]);
echo $itog[2][0].'<br>';
};
};

};
?>





после парсинга все выделяем и вставляем в нашу текстовку

Можно парсить интересующие тематические разделы там

p.s. что хотите видеть далее?)




p.s. скоро будет кое что еще немного революшн.

Сообщение отредактировал ParavoZ - 3.8.2010, 17:12


Поблагодарили: (5)
4
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Fallup
Fallup
сообщение 3.8.2010, 17:45; Ответить: Fallup
Сообщение #2


На наших глазах происходит роджение злобного пэхэпэ кодера. Причем схватки все чаще и чаще. Эко тебя увлекло smile.gif


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ParavoZ
ParavoZ
Topic Starter сообщение 3.8.2010, 17:53; Ответить: ParavoZ
Сообщение #3


На наших глазах происходит роджение злобного пэхэпэ кодера. Причем схватки все чаще и чаще. Эко тебя увлекло

Cобственно говоря я недавно начал, и меня трудно назвать кодером)
Но уже написал генератор MFS под одну CMS, и пишу дорген под нее же)

Сообщение отредактировал ParavoZ - 3.8.2010, 17:54
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
simpliex
simpliex
сообщение 3.8.2010, 18:08; Ответить: simpliex
Сообщение #4


Пасиб за парсеры. Буду использовать, а можете кое какие доработки сделать, под меня smile.gif? Скину в ЛС их, если можно.


--------------------
Осторожно! Должник.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ParavoZ
ParavoZ
Topic Starter сообщение 3.8.2010, 18:20; Ответить: ParavoZ
Сообщение #5


simpliex, пишите.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Tornado
Tornado
сообщение 3.8.2010, 18:31; Ответить: Tornado
Сообщение #6


Уважаемый ТС. Огромное спасибо за персер. стал разбирать код, только кое что не понял.... если не трудно обьясните функцию некоторых элементов_

!<td width="100%"><a href=(.*) class="headcolumn">!i Почему в конце и в начале чтоит восклицательный знак?

(.*)-Где можно прочитать про это ?

!sU- а что это выполняет...

Огромное спасибо заранее!

Сообщение отредактировал Tornado - 3.8.2010, 18:32


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ParavoZ
ParavoZ
Topic Starter сообщение 3.8.2010, 18:40; Ответить: ParavoZ
Сообщение #7


Торнадо, я написал вам в Л.С. дабы не засорять топик, все таки топик не про пхп)

Сообщение отредактировал ParavoZ - 3.8.2010, 18:42
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Tornado
Tornado
сообщение 3.8.2010, 18:46; Ответить: Tornado
Сообщение #8


(ParavoZ @ 3.8.2010, 17:40) *
Торнадо, я написал вам в Л.С. дабы не засорять топик, все таки топик не про пхп)

Огромное спасибо за информацию.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Cttr
Cttr
сообщение 3.8.2010, 18:51; Ответить: Cttr
Сообщение #9


Паровоз, dry.gif с записью в файлы поработай, вообще цены не будет.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
WebAction
WebAction
сообщение 3.8.2010, 19:29; Ответить: WebAction
Сообщение #10


ParavoZ молоток. Как оказалось полезный, а главное рабочий код)

Еще можно сделать, что бы парсило все по выбранному разделу, но это уже посложнее wink.gif



Для создания отдельного файла для каждой новости:

<?php
set_time_limit(0);

$vip = file_get_contents("http://newsru.com/arch/02aug2010/sport/index.html"); // ставим ссылку, такого же вида как в примере
$n = preg_match_all('/<td width="100%"><a href=(.*) class="headcolumn">/i', $vip, $result);
if($n)
{
for($a = 0; $a < $n; $a++)
{
    $name = $result[1][$a];
    $arr = explode("/", $name);
    $l = strlen($arr[4]);
    $t = explode(".", $arr[4]);
    $title = $arr[3]."_".$t[0];
    
$f = fopen("$title.txt", "a");
$page = file_get_contents("http://newsru.com".$result[1][$a]);

$regex = preg_match_all('/<h1 class="mainhead">(.*)<\/h1><\/td><\/tr>.*<div class="maintext">.*<\/a><\/div>.*<p>(.*)<p style="clear: both">/isU', $page, $itog);
if($regex)
{

fwrite($f, $itog[1][0].'<br>');
$itog[2][0] = preg_replace("/<a.*>/sU", " " , $itog[2][0]);
$itog[2][0] = preg_replace("/<\/a>/sU", " " , $itog[2][0]);
fwrite($f, $itog[2][0].'<br>');
fclose($f);
}
}

}
?>



А для сохранения в один файл всех новостей:

<?php
set_time_limit(0);

$link = "http://newsru.com/arch/02aug2010/sport/index.html"; // ставим ссылку, такого же вида как в примере
$vip = file_get_contents($link);
$n = preg_match_all('/<td width="100%"><a href=(.*) class="headcolumn">/i', $vip, $result);
if($n)
{
    $arr = explode("/", $link);
    $title = $arr[4]."_".$arr[5];
    
$f = fopen("$title.txt", "a");
for($a = 0; $a < $n; $a++)
{    
$page = file_get_contents("http://newsru.com".$result[1][$a]);

$regex = preg_match_all('/<h1 class="mainhead">(.*)<\/h1><\/td><\/tr>.*<div class="maintext">.*<\/a><\/div>.*<p>(.*)<p style="clear: both">/isU', $page, $itog);
if($regex)
{

fwrite($f, $itog[1][0].'<br>');
$itog[2][0] = preg_replace("/<a.*>/sU", " " , $itog[2][0]);
$itog[2][0] = preg_replace("/<\/a>/sU", " " , $itog[2][0]);
fwrite($f, $itog[2][0].'<br>');
}
}
fclose($f);

}
?>


Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.


--------------------
--тут может быть ваша реклама--


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
352 Forbidden 278245 21.3.2024, 14:38
автор: AParser_Support
Открытая тема (нет новых ответов) Бесплатный парсер бот в Телеграм - [Parser Pro]
5 Parser_Pro 3311 27.1.2024, 16:12
автор: Parser_Pro
Открытая тема (нет новых ответов) WebArchiveMaster - парсер Вебархива
Добыча контента из ВебАрхива
16 footashes 12241 23.11.2022, 16:36
автор: kuz999
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлы⚡ AvitoSmart - быстрый парсер новых объявлений на Авито на запросах
Представляю парсер для [b]Zennoposter[/b]'a или [b]Zennobox[/b]
0 akcium 1250 19.11.2022, 13:05
автор: akcium
Открытая тема (нет новых ответов) Tubes Clip One - парсер тубов
21 xoopw 20775 16.4.2021, 17:30
автор: xoopw


 



RSS Текстовая версия Сейчас: 29.3.2024, 12:22
Дизайн