Помощник
|
Парсер NewsRu.Com |
ParavoZ
|
Сообщение
#1
|
||
|
|
||
|
|||
Fallup |
3.8.2010, 17:45;
Ответить: Fallup
Сообщение
#2
|
|
На наших глазах происходит роджение злобного пэхэпэ кодера. Причем схватки все чаще и чаще. Эко тебя увлекло
-------------------- |
|
|
ParavoZ
|
Сообщение
#3
|
|
На наших глазах происходит роджение злобного пэхэпэ кодера. Причем схватки все чаще и чаще. Эко тебя увлекло Cобственно говоря я недавно начал, и меня трудно назвать кодером) Но уже написал генератор MFS под одну CMS, и пишу дорген под нее же) Сообщение отредактировал ParavoZ - 3.8.2010, 17:54 |
|
|
simpliex |
3.8.2010, 18:08;
Ответить: simpliex
Сообщение
#4
|
|
Пасиб за парсеры. Буду использовать, а можете кое какие доработки сделать, под меня ? Скину в ЛС их, если можно.
-------------------- |
|
|
ParavoZ
|
Сообщение
#5
|
|
simpliex, пишите.
|
|
|
Tornado |
3.8.2010, 18:31;
Ответить: Tornado
Сообщение
#6
|
|
Уважаемый ТС. Огромное спасибо за персер. стал разбирать код, только кое что не понял.... если не трудно обьясните функцию некоторых элементов_
!<td width="100%"><a href=(.*) class="headcolumn">!i Почему в конце и в начале чтоит восклицательный знак? (.*)-Где можно прочитать про это ? !sU- а что это выполняет... Огромное спасибо заранее! Сообщение отредактировал Tornado - 3.8.2010, 18:32 -------------------- |
|
|
ParavoZ
|
Сообщение
#7
|
|
Торнадо, я написал вам в Л.С. дабы не засорять топик, все таки топик не про пхп)
Сообщение отредактировал ParavoZ - 3.8.2010, 18:42 |
|
|
Tornado |
3.8.2010, 18:46;
Ответить: Tornado
Сообщение
#8
|
|
Торнадо, я написал вам в Л.С. дабы не засорять топик, все таки топик не про пхп) Огромное спасибо за информацию. -------------------- |
|
|
Cttr |
3.8.2010, 18:51;
Ответить: Cttr
Сообщение
#9
|
|
Паровоз, с записью в файлы поработай, вообще цены не будет.
|
|
|
WebAction |
3.8.2010, 19:29;
Ответить: WebAction
Сообщение
#10
|
|
|
ParavoZ молоток. Как оказалось полезный, а главное рабочий код)
Еще можно сделать, что бы парсило все по выбранному разделу, но это уже посложнее Для создания отдельного файла для каждой новости: <?php set_time_limit(0); $vip = file_get_contents("http://newsru.com/arch/02aug2010/sport/index.html"); // ставим ссылку, такого же вида как в примере $n = preg_match_all('/<td width="100%"><a href=(.*) class="headcolumn">/i', $vip, $result); if($n) { for($a = 0; $a < $n; $a++) { $name = $result[1][$a]; $arr = explode("/", $name); $l = strlen($arr[4]); $t = explode(".", $arr[4]); $title = $arr[3]."_".$t[0]; $f = fopen("$title.txt", "a"); $page = file_get_contents("http://newsru.com".$result[1][$a]); $regex = preg_match_all('/<h1 class="mainhead">(.*)<\/h1><\/td><\/tr>.*<div class="maintext">.*<\/a><\/div>.*<p>(.*)<p style="clear: both">/isU', $page, $itog); if($regex) { fwrite($f, $itog[1][0].'<br>'); $itog[2][0] = preg_replace("/<a.*>/sU", " " , $itog[2][0]); $itog[2][0] = preg_replace("/<\/a>/sU", " " , $itog[2][0]); fwrite($f, $itog[2][0].'<br>'); fclose($f); } } } ?> А для сохранения в один файл всех новостей: <?php set_time_limit(0); $link = "http://newsru.com/arch/02aug2010/sport/index.html"; // ставим ссылку, такого же вида как в примере $vip = file_get_contents($link); $n = preg_match_all('/<td width="100%"><a href=(.*) class="headcolumn">/i', $vip, $result); if($n) { $arr = explode("/", $link); $title = $arr[4]."_".$arr[5]; $f = fopen("$title.txt", "a"); for($a = 0; $a < $n; $a++) { $page = file_get_contents("http://newsru.com".$result[1][$a]); $regex = preg_match_all('/<h1 class="mainhead">(.*)<\/h1><\/td><\/tr>.*<div class="maintext">.*<\/a><\/div>.*<p>(.*)<p style="clear: both">/isU', $page, $itog); if($regex) { fwrite($f, $itog[1][0].'<br>'); $itog[2][0] = preg_replace("/<a.*>/sU", " " , $itog[2][0]); $itog[2][0] = preg_replace("/<\/a>/sU", " " , $itog[2][0]); fwrite($f, $itog[2][0].'<br>'); } } fclose($f); } ?>
-------------------- |
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров. | 352 | Forbidden | 278245 | 21.3.2024, 14:38 автор: AParser_Support |
|
Бесплатный парсер бот в Телеграм - [Parser Pro] | 5 | Parser_Pro | 3311 | 27.1.2024, 16:12 автор: Parser_Pro |
|
WebArchiveMaster - парсер Вебархива Добыча контента из ВебАрхива |
16 | footashes | 12241 | 23.11.2022, 16:36 автор: kuz999 |
|
⚡ AvitoSmart - быстрый парсер новых объявлений на Авито на запросах Представляю парсер для [b]Zennoposter[/b]'a или [b]Zennobox[/b] |
0 | akcium | 1250 | 19.11.2022, 13:05 автор: akcium |
|
Tubes Clip One - парсер тубов | 21 | xoopw | 20775 | 16.4.2021, 17:30 автор: xoopw |
Текстовая версия | Сейчас: 29.3.2024, 12:22 |