Парсер Lenta.Ru - SEO форум MaulTalk.com

Сообщение сайта

(Сообщение закроется через 3 секунды)

Здравствуйте, гость (

| Вход | Регистрация )

SEO форум MaulTalk.com > Поисковая оптимизация > Поисковая оптимизация (SEO) > Черные методы SEO

5 страниц

< 1 2 3 4 5 >

Парсер Lenta.Ru, основанный на регулярных выражениях.

Опции

ParavoZ

Topic Starter

1.8.2010, 0:08; Ответить: ParavoZ

Сообщение #31

Группа: Active User
Сообщений: 2522
Регистрация: 5.1.2009
Поблагодарили: 1340 раз
Репутация:

167

<?php
$vip = file_get_contents("http://lenta.ru/news/2010/07/30/"); //
$n = preg_match_all('!<span class=title><a href=(.*)>.*</a></span></p>!i', $vip, $result);
if($n)
{
for($a=0;$a<$n;$a++)
{
$page = file_get_contents("http://lenta.ru".$result[1][$a]);
$page = preg_replace("!<a.*>!sU", " " , $page);
$page = preg_replace("!</a>!sU", " " , $page);
$regex = preg_match_all('!<H2>(.*)</H2>.*</TABLE>(.*)<P class=links>!isU', $page, $itog);
if($regex)
{

echo $itog[1][0].'<br>';
echo $itog[2][0].'<br>';
};
};

};
?>

с 1 парсинга - примерно 178 килобайт текстовки качественного новостного копипаста, который не парсился особо ранее.

Что нужно менять в скрипте:

$vip = file_get_contents("http://lenta.ru/news/2010/07/30/"); //

меняем урл http://lenta.ru/news/2010/07/30/ на страницы вида

http://lenta.ru/news/2010/07/15/ - парсим все новости 15 числа.

http://lenta.ru/sport/2010/07/28/ - парсим все новости спортивного раздела за 28 июля.

и так далее.

use.

Поблагодарили: (8)

evilzipik, frion-seo, medved112, N1cE, Romanuk, Rustamus, Tornado, valeros

Ответить с цитированием данного сообщения

garik1331 garik1331 16.3.2011, 22:45; Сообщений: 519 Поблагодарили: 45 раз Репутация: 4 Просмотр профиля	16.3.2011, 22:45; Ответить: garik1331 Сообщение #32
Завсегдатай Группа: Banned Сообщений: 519 Регистрация: 24.9.2009 Поблагодарили: 45 раз Репутация: 4	Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь

ParavoZ Topic Starter ParavoZTopic Starter 19.3.2011, 14:41; Сообщений: 2522 Поблагодарили: 1340 раз Репутация: 167 Просмотр профиля	Topic Starter 19.3.2011, 14:41; Ответить: ParavoZ Сообщение #33
G Группа: Active User Сообщений: 2522 Регистрация: 5.1.2009 Поблагодарили: 1340 раз Репутация: 167	Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь Ну нуб ничегонезнающий и не пробующий разумеется не разбереться

frion-seo frion-seo 20.3.2011, 19:59; Сообщений: 760 Поблагодарили: 188 раз Репутация: 68 Просмотр профиля	20.3.2011, 19:59; Ответить: frion-seo Сообщение #34
Завсегдатай Группа: Active User Сообщений: 760 Регистрация: 16.9.2010 Поблагодарили: 188 раз Репутация: 68	ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх -------------------- Автоматизация вашего бизнеса. Вы отдыхаете - бот вкалывает! для гугла

WebAction WebAction 20.3.2011, 20:07; Сообщений: 3120 Поблагодарили: 2904 раза Репутация: 270 Просмотр профиля	20.3.2011, 20:07; Ответить: WebAction Сообщение #35
Топовый постер Группа: Super Moderator Сообщений: 3120 Регистрация: 18.11.2009 Поблагодарили: 2904 раза Репутация: 270	frion-seo сделаем Еще пожелания? (REGNET @ 5.9.2010, 8:54) Можно сделать что б через textkit разбивать возможно было статьи, для дальнейшей его публикации?! А можно конкретнее? -------------------- --тут может быть ваша реклама-- Поблагодарили: (1) frion-seo

mvchansas mvchansas 20.3.2011, 20:47; Сообщений: 1589 Поблагодарили: 397 раз Репутация: 75 Просмотр профиля	20.3.2011, 20:47; Ответить: mvchansas Сообщение #36
В контенте сила... Группа: Active User Сообщений: 1589 Регистрация: 11.5.2009 Из: Харьков Поблагодарили: 397 раз Репутация: 75	rion-seo - ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх WebAction - rion-seo сделаем Еще пожелания? было бы очень классно. Жду с нетерпением. Сообщение отредактировал mvchansas - 20.3.2011, 20:49 -------------------- Prodvizhenie.ua - продвижение и контекстная реклама. Опыт с 2009

FjuZ FjuZ 20.3.2011, 23:20; Сообщений: 1551 Поблагодарили: 605 раз Репутация: 79 Просмотр профиля	20.3.2011, 23:20; Ответить: FjuZ Сообщение #37
6931fb Группа: Active User Сообщений: 1551 Регистрация: 3.2.2009 Из: UA Поблагодарили: 605 раз Репутация: 79	<?php ini_set ('max_execution_time', 0); $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; foreach($urls as $url) { $vip = file_get_contents ($url); $n = preg_match_all ('!<span class=title><a href=(.)>.</a></span></p>!i', $vip, $result); if ($n) { for($a=0; $a < $n; $a++) { $page = file_get_contents("http://lenta.ru".$result[1][$a]); $page = preg_replace ("!<a.>!isU", ' ', $page); $page = str_replace ('</a>', ' ', $page); $regex = preg_match_all('!<H2>(.)</H2>.</TABLE>(.)<P class=links>!isU', $page, $itog, PREG_SET_ORDER); if ($regex) { $html .= '<h2>' . $itog[0][1] . "</h2>\n"; $html .= str_replace ('<p>', '', $itog[0][2]) . "\n"; } } // php5 file_put_contents (date ('H-i') . '.html', $html); } } ?> Вот, сделал на скорую руку $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; т.е. в таком формате на новой строке адрес. -------------------- уехал в отпуск, приехал - уже 600$ Поблагодарили: (1) mvchansas

mvchansas mvchansas 21.3.2011, 1:03; Сообщений: 1589 Поблагодарили: 397 раз Репутация: 75 Просмотр профиля	21.3.2011, 1:03; Ответить: mvchansas Сообщение #38
В контенте сила... Группа: Active User Сообщений: 1589 Регистрация: 11.5.2009 Из: Харьков Поблагодарили: 397 раз Репутация: 75	Частично он жаль только что не каждая новость в отдельный текстовый файл как раньше было. -------------------- Prodvizhenie.ua - продвижение и контекстная реклама. Опыт с 2009

FjuZ FjuZ 21.3.2011, 9:09; Сообщений: 1551 Поблагодарили: 605 раз Репутация: 79 Просмотр профиля	21.3.2011, 9:09; Ответить: FjuZ Сообщение #39
6931fb Группа: Active User Сообщений: 1551 Регистрация: 3.2.2009 Из: UA Поблагодарили: 605 раз Репутация: 79	<?php ini_set ('max_execution_time', 0); $urls[]='http://lenta.ru/news/2010/07/30/'; $urls[]='http://lenta.ru/news/2010/07/29/'; foreach($urls as $url) { $vip = file_get_contents ($url); $n = preg_match_all ('!<span class=title><a href=(.)>.</a></span></p>!i', $vip, $result); if ($n) { for($a=0; $a < $n; $a++) { $page = file_get_contents("http://lenta.ru".$result[1][$a]); $page = preg_replace ("!<a.>!isU", ' ', $page); $page = str_replace ('</a>', ' ', $page); $regex = preg_match_all('!<H2>(.)</H2>.</TABLE>(.)<P class=links>!isU', $page, $itog, PREG_SET_ORDER); if ($regex) { $html .= '<h2>' . $itog[0][1] . "</h2>\n"; $html .= str_replace ('<p>', '', $itog[0][2]) . "\n"; } } // php5 $xd=rand(1,100000); file_put_contents (date ('H-i') .'-'.$xd.'.html', $html); } } ?> так каждая в отдельный файл -------------------- уехал в отпуск, приехал - уже 600$ Поблагодарили: (2) frion-seo, mvchansas

frion-seo frion-seo 21.3.2011, 13:04; Сообщений: 760 Поблагодарили: 188 раз Репутация: 68 Просмотр профиля	21.3.2011, 13:04; Ответить: frion-seo Сообщение #40
Завсегдатай Группа: Active User Сообщений: 760 Регистрация: 16.9.2010 Поблагодарили: 188 раз Репутация: 68	FjuZ , а форму для ввода можно сделать? а то каждый раз править приходится ффайлик... -------------------- Автоматизация вашего бизнеса. Вы отдыхаете - бот вкалывает! для гугла

mvchansas mvchansas 22.3.2011, 0:47; Сообщений: 1589 Поблагодарили: 397 раз Репутация: 75 Просмотр профиля	22.3.2011, 0:47; Ответить: mvchansas Сообщение #41
В контенте сила... Группа: Active User Сообщений: 1589 Регистрация: 11.5.2009 Из: Харьков Поблагодарили: 397 раз Репутация: 75	нужно немного изменить данный парсер за умеренную плату, просьба отписаться кто может в ЛС. -------------------- Prodvizhenie.ua - продвижение и контекстная реклама. Опыт с 2009

« Предыдущая тема · Черные методы SEO · Следующая тема »

5 страниц

< 1 2 3 4 5 >

4 чел. читают эту тему (гостей: 4, скрытых пользователей: 0)

Пользователей: 0

Похожие темы

Тема	Ответов	Автор	Просмотров	Последний ответ
A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.	353	Forbidden	279287	11.4.2024, 17:07 автор: AParser_Support
Бесплатный парсер бот в Телеграм - [Parser Pro]	5	Parser_Pro	3350	27.1.2024, 16:12 автор: Parser_Pro
WebArchiveMaster - парсер Вебархива Добыча контента из ВебАрхива	16	footashes	12309	23.11.2022, 16:36 автор: kuz999
⚡ AvitoSmart - быстрый парсер новых объявлений на Авито на запросах Представляю парсер для [b]Zennoposter[/b]'a или [b]Zennobox[/b]	0	akcium	1266	19.11.2022, 13:05 автор: akcium
Tubes Clip One - парсер тубов	21	xoopw	20838	16.4.2021, 17:30 автор: xoopw

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 20.4.2024, 8:57

Дизайн