Помощник
|
Парсер Lenta.Ru, основанный на регулярных выражениях. |
garik1331 |
16.3.2011, 22:45;
Ответить: garik1331
Сообщение
#32
|
|
Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь
|
|
|
ParavoZ
|
Сообщение
#33
|
|
Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь Ну нуб ничегонезнающий и не пробующий разумеется не разбереться |
|
|
frion-seo |
20.3.2011, 19:59;
Ответить: frion-seo
Сообщение
#34
|
|
ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх
-------------------- |
|
|
WebAction |
20.3.2011, 20:07;
Ответить: WebAction
Сообщение
#35
|
|
frion-seo сделаем Еще пожелания?
Можно сделать что б через textkit разбивать возможно было статьи, для дальнейшей его публикации?! А можно конкретнее? -------------------- |
|
|
mvchansas |
20.3.2011, 20:47;
Ответить: mvchansas
Сообщение
#36
|
|
rion-seo - ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх WebAction - rion-seo сделаем Еще пожелания? было бы очень классно. Жду с нетерпением. Сообщение отредактировал mvchansas - 20.3.2011, 20:49 -------------------- |
|
|
FjuZ |
20.3.2011, 23:20;
Ответить: FjuZ
Сообщение
#37
|
|
<?php ini_set ('max_execution_time', 0); $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; foreach($urls as $url) { $vip = file_get_contents ($url); $n = preg_match_all ('!<span class=title><a href=(.*)>.*</a></span></p>!i', $vip, $result); if ($n) { for($a=0; $a < $n; $a++) { $page = file_get_contents("http://lenta.ru".$result[1][$a]); $page = preg_replace ("!<a.*>!isU", ' ', $page); $page = str_replace ('</a>', ' ', $page); $regex = preg_match_all('!<H2>(.*)</H2>.*</TABLE>(.*)<P class=links>!isU', $page, $itog, PREG_SET_ORDER); if ($regex) { $html .= '<h2>' . $itog[0][1] . "</h2>\n"; $html .= str_replace ('<p>', '', $itog[0][2]) . "\n"; } } // php5 file_put_contents (date ('H-i') . '.html', $html); } } ?> Вот, сделал на скорую руку $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; т.е. в таком формате на новой строке адрес. -------------------- |
|
|
mvchansas |
21.3.2011, 1:03;
Ответить: mvchansas
Сообщение
#38
|
|
Частично он
жаль только что не каждая новость в отдельный текстовый файл как раньше было. -------------------- |
|
|
FjuZ |
21.3.2011, 9:09;
Ответить: FjuZ
Сообщение
#39
|
|
<?php ini_set ('max_execution_time', 0); $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; foreach($urls as $url) { $vip = file_get_contents ($url); $n = preg_match_all ('!<span class=title><a href=(.*)>.*</a></span></p>!i', $vip, $result); if ($n) { for($a=0; $a < $n; $a++) { $page = file_get_contents("http://lenta.ru".$result[1][$a]); $page = preg_replace ("!<a.*>!isU", ' ', $page); $page = str_replace ('</a>', ' ', $page); $regex = preg_match_all('!<H2>(.*)</H2>.*</TABLE>(.*)<P class=links>!isU', $page, $itog, PREG_SET_ORDER); if ($regex) { $html .= '<h2>' . $itog[0][1] . "</h2>\n"; $html .= str_replace ('<p>', '', $itog[0][2]) . "\n"; } } // php5 $xd=rand(1,100000); file_put_contents (date ('H-i') .'-'.$xd.'.html', $html); } } ?> так каждая в отдельный файл -------------------- |
|
|
frion-seo |
21.3.2011, 13:04;
Ответить: frion-seo
Сообщение
#40
|
|
FjuZ , а форму для ввода можно сделать? а то каждый раз править приходится ффайлик...
-------------------- |
|
|
mvchansas |
22.3.2011, 0:47;
Ответить: mvchansas
Сообщение
#41
|
|
нужно немного изменить данный парсер за умеренную плату, просьба отписаться кто может в ЛС.
-------------------- |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров. | 353 | Forbidden | 279287 | 11.4.2024, 17:07 автор: AParser_Support |
|
Бесплатный парсер бот в Телеграм - [Parser Pro] | 5 | Parser_Pro | 3350 | 27.1.2024, 16:12 автор: Parser_Pro |
|
WebArchiveMaster - парсер Вебархива Добыча контента из ВебАрхива |
16 | footashes | 12309 | 23.11.2022, 16:36 автор: kuz999 |
|
⚡ AvitoSmart - быстрый парсер новых объявлений на Авито на запросах Представляю парсер для [b]Zennoposter[/b]'a или [b]Zennobox[/b] |
0 | akcium | 1266 | 19.11.2022, 13:05 автор: akcium |
|
Tubes Clip One - парсер тубов | 21 | xoopw | 20838 | 16.4.2021, 17:30 автор: xoopw |
Текстовая версия | Сейчас: 20.4.2024, 8:57 |