X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

5 страниц V  < 1 2 3 4 5 >
Открыть тему
Тема закрыта
> Парсер Lenta.Ru, основанный на регулярных выражениях.
garik1331
garik1331
сообщение 16.3.2011, 22:45; Ответить: garik1331
Сообщение #32


Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь wink.gif
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ParavoZ
ParavoZ
Topic Starter сообщение 19.3.2011, 14:41; Ответить: ParavoZ
Сообщение #33


Так все понятно что делать и куда вставлять что диву даешься...кинули какие то иероглифы(я про скрипт)и думай что хочешь wink.gif

Ну нуб ничегонезнающий и не пробующий разумеется не разбереться smile.gif
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
frion-seo
frion-seo
сообщение 20.3.2011, 19:59; Ответить: frion-seo
Сообщение #34


ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
WebAction
WebAction
сообщение 20.3.2011, 20:07; Ответить: WebAction
Сообщение #35


frion-seo сделаем wink.gif Еще пожелания?

(REGNET @ 5.9.2010, 8:54) *
Можно сделать что б через textkit разбивать возможно было статьи, для дальнейшей его публикации?!


А можно конкретнее?


--------------------
--тут может быть ваша реклама--


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mvchansas
mvchansas
сообщение 20.3.2011, 20:47; Ответить: mvchansas
Сообщение #36


rion-seo - ParavoZ, спс огромное за скриптик, вот бы еще урл туда пачкой можно было загружать ээххх
WebAction - rion-seo сделаем Еще пожелания?


было бы очень классно. happy.gif
Жду с нетерпением.

Сообщение отредактировал mvchansas - 20.3.2011, 20:49


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FjuZ
FjuZ
сообщение 20.3.2011, 23:20; Ответить: FjuZ
Сообщение #37


<?php

    ini_set ('max_execution_time', 0);
$urls[]='http://lenta.ru/news/2010/07/30/';
$urls[]='http://lenta.ru/news/2010/07/29/';  
foreach($urls as $url) {
    
        $vip = file_get_contents ($url);
        $n = preg_match_all ('!<span class=title><a href=(.*)>.*</a></span></p>!i', $vip, $result);
        
        if ($n)    {
            for($a=0; $a < $n; $a++) {
                $page = file_get_contents("http://lenta.ru".$result[1][$a]);
                $page = preg_replace ("!<a.*>!isU", ' ', $page);
                $page = str_replace ('</a>', ' ', $page);
                $regex = preg_match_all('!<H2>(.*)</H2>.*</TABLE>(.*)<P class=links>!isU', $page, $itog, PREG_SET_ORDER);
                
                if ($regex) {                    
                    $html .= '<h2>' . $itog[0][1] . "</h2>\n";
                    $html .= str_replace ('<p>', '', $itog[0][2]) . "\n";
                }

            }
            
            // php5
            file_put_contents (date ('H-i') . '.html', $html);
        }
        

    }

?>

Вот, сделал на скорую руку
$urls[]='http://lenta.ru/news/2010/07/30/';
$urls[]='http://lenta.ru/news/2010/07/29/';
т.е. в таком формате на новой строке адрес.


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mvchansas
mvchansas
сообщение 21.3.2011, 1:03; Ответить: mvchansas
Сообщение #38


Частично он mellow.gif
жаль только что не каждая новость в отдельный текстовый файл как раньше было.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
FjuZ
FjuZ
сообщение 21.3.2011, 9:09; Ответить: FjuZ
Сообщение #39


<?php

    ini_set ('max_execution_time', 0);
$urls[]='http://lenta.ru/news/2010/07/30/';
$urls[]='http://lenta.ru/news/2010/07/29/';  
foreach($urls as $url) {
    
        $vip = file_get_contents ($url);
        $n = preg_match_all ('!<span class=title><a href=(.*)>.*</a></span></p>!i', $vip, $result);
        
        if ($n)    {
            for($a=0; $a < $n; $a++) {
                $page = file_get_contents("http://lenta.ru".$result[1][$a]);
                $page = preg_replace ("!<a.*>!isU", ' ', $page);
                $page = str_replace ('</a>', ' ', $page);
                $regex = preg_match_all('!<H2>(.*)</H2>.*</TABLE>(.*)<P class=links>!isU', $page, $itog, PREG_SET_ORDER);
                
                if ($regex) {                    
                    $html .= '<h2>' . $itog[0][1] . "</h2>\n";
                    $html .= str_replace ('<p>', '', $itog[0][2]) . "\n";
                }

            }
            
            // php5
           $xd=rand(1,100000);
            file_put_contents (date ('H-i') .'-'.$xd.'.html', $html);
        }
        

    }

?>

так каждая в отдельный файл


--------------------


Поблагодарили: (2)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
frion-seo
frion-seo
сообщение 21.3.2011, 13:04; Ответить: frion-seo
Сообщение #40


FjuZ , а форму для ввода можно сделать? а то каждый раз править приходится ффайлик...


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mvchansas
mvchansas
сообщение 22.3.2011, 0:47; Ответить: mvchansas
Сообщение #41


нужно немного изменить данный парсер за умеренную плату, просьба отписаться кто может в ЛС.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
5 страниц V  < 1 2 3 4 5 >
Открыть тему
Тема закрыта
4 чел. читают эту тему (гостей: 4, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
353 Forbidden 279287 11.4.2024, 17:07
автор: AParser_Support
Открытая тема (нет новых ответов) Бесплатный парсер бот в Телеграм - [Parser Pro]
5 Parser_Pro 3350 27.1.2024, 16:12
автор: Parser_Pro
Открытая тема (нет новых ответов) WebArchiveMaster - парсер Вебархива
Добыча контента из ВебАрхива
16 footashes 12309 23.11.2022, 16:36
автор: kuz999
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлы⚡ AvitoSmart - быстрый парсер новых объявлений на Авито на запросах
Представляю парсер для [b]Zennoposter[/b]'a или [b]Zennobox[/b]
0 akcium 1266 19.11.2022, 13:05
автор: akcium
Открытая тема (нет новых ответов) Tubes Clip One - парсер тубов
21 xoopw 20838 16.4.2021, 17:30
автор: xoopw


 



RSS Текстовая версия Сейчас: 20.4.2024, 8:57
Дизайн