X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> парсинг текстовки яндекс.весны
ParavoZ
ParavoZ
Topic Starter сообщение 31.7.2010, 1:00; Ответить: ParavoZ
Сообщение #1


G
*******

Группа: Active User
Сообщений: 2522
Регистрация: 5.1.2009
Поблагодарили: 1329 раз
Репутация:   167  


Так скажем, тренеруюсь/обучаюсь кодингу.

Вот если кому нужно - получайте парсинг текстовки яндекс.рефератов.

Можно выбрать сколько грабить рефератов.

Говорят, что яндекс в этих рефератах заменяет русские буквы, на аналогичные западные. Проблема решена

<?php
$skoko = 10; //сколько рефератов граббить
for ($s = 0; $s < $skoko; $s++)
                {
$vip = file_get_contents("http://referats.yandex.ru/geography.xml"); // ссылочка откуда грабить я.рефератики.Категория

$n = preg_match_all('!<h1 style="color:black; margin-left:0;">(.*)</h1>(.*)</div></td>!is', $vip, $result);
$to = "асе";
$from = "ace";
$result[2][0] = strtr($result[2][0],$to,$from);


        echo $result[1][0];
        echo "<br>";
        echo  $result[2][0];
        }
    ?>




текстовка прямо скажем не очень, однако мб кому понадобиться)
з.ы. на досуге попытаюсь написать какие-нибудь парсеры, напишите какие бы вы хотели - попробуем(только не сложные в стиле под мини движок и т.д.)

Сообщение отредактировал ParavoZ - 31.7.2010, 1:03


Поблагодарили: (3)
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
medved112
medved112
сообщение 31.7.2010, 1:13; Ответить: medved112
Сообщение #2


В меру упитанная панда в полном расцвете сил
*******

Группа: Active User
Сообщений: 3182
Регистрация: 17.10.2008
Поблагодарили: 1374 раза
Репутация:   139  


ParavoZ, я не знаю насколько это сложно, сам в кодинге полный ноль, но очень бы не помешал парсер ЖЖ или блогспота. Чтобы парсились посты следующим образом: каждый пост в отдельный txt файл, заголовой поста шел первой строчкой в файле, текст шел начиная со второй строки. Теги, ссылки и т.п. желательно исключать, но это не столь принципиально.

ЗЫ: Возможно не правильно понял фразу
только не сложные в стиле под мини движок и т.д.

Но если нет, то сорри


--------------------
фыр фыр


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ParavoZ
ParavoZ
Topic Starter сообщение 31.7.2010, 1:19; Ответить: ParavoZ
Сообщение #3


G
*******

Группа: Active User
Сообщений: 2522
Регистрация: 5.1.2009
Поблагодарили: 1329 раз
Репутация:   167  


medved112 это на днях сделаем) т.е. тебе как нужно? даешь блог - с него парсятся посты(назвнание и пост),и в отдельный файлик каждый, так?
На завтра моя задача написать парсер качественного копипаста - http://lenta.ru/news/2010/07/30/ с этих страниц по всем ссылкам) Надеюсь это дорвейщикам пригодиться)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
medved112
medved112
сообщение 31.7.2010, 1:24; Ответить: medved112
Сообщение #4


В меру упитанная панда в полном расцвете сил
*******

Группа: Active User
Сообщений: 3182
Регистрация: 17.10.2008
Поблагодарили: 1374 раза
Репутация:   139  


ParavoZ, ну вообще желательно ,чтобы сразу пачку блогов загрузил, например в папку со скриптом txt файл с ссылками на блоги, а на выходе да, каждый пост в отдельный txt файл разбросался, только чтобы название поста шло не в название файла, а в первую строку. Какую из платформ парсить мне не принципиально, только чтобы английские блоги были.

ЗЫ: О, про ленту тоже пригодиться wink.gif

Сообщение отредактировал medved112 - 31.7.2010, 1:25


--------------------
фыр фыр
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kraken
kraken
сообщение 31.7.2010, 6:30; Ответить: kraken
Сообщение #5


Частый гость
**


Группа: User
Сообщений: 56
Регистрация: 22.11.2009
Поблагодарили: 4 раза
Репутация:   -2  


ParavoZ если как ты говоришь что начинающий если возникнут проблемы/вопросы то пиши в асю могу помочь =) АСЯ 757-834


--------------------
Блог уфимского студента
Найди множество текстов песен у меня на сайте
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Romanuk
Romanuk
сообщение 31.7.2010, 10:59; Ответить: Romanuk
Сообщение #6



*****

Группа: Active User
Сообщений: 908
Регистрация: 4.4.2010
Из: Запорожье
Поблагодарили: 408 раз
Репутация:   45  


(ParavoZ @ 31.7.2010, 0:19) *
...написать парсер качественного копипаста lenta.ru/news/2010/07/30...

Хорошая идея для парсера. Воспользовался бы таким.

(medved112 @ 31.7.2010, 0:13) *
...очень бы не помешал парсер ЖЖ или блогспота...

+1 голос за такой парсер.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
hizgil
hizgil
сообщение 21.8.2010, 0:02; Ответить: hizgil
Сообщение #7


Новичок
*

Группа: Viewer
Сообщений: 2
Регистрация: 20.8.2010
Поблагодарили: 0 раз
Репутация:   0  


Вряд ли понадобится, но спасибо!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
poolk
poolk
сообщение 21.8.2010, 15:02; Ответить: poolk
Сообщение #8


Бывалый
****


Группа: User
Сообщений: 399
Регистрация: 10.12.2007
Поблагодарили: 35 раз
Репутация:   8  


(medved112 @ 31.7.2010, 1:13) *
ParavoZ, я не знаю насколько это сложно, сам в кодинге полный ноль, но очень бы не помешал парсер ЖЖ или блогспота. Чтобы парсились посты следующим образом: каждый пост в отдельный txt файл, заголовой поста шел первой строчкой в файле, текст шел начиная со второй строки. Теги, ссылки и т.п. желательно исключать, но это не столь принципиально.

ЗЫ: Возможно не правильно понял фразу

Но если нет, то сорри

под зеброид?)


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Мобильный «Яндекс.Диск» стал безлимитным
13 MissContent 2169 Сегодня, 15:17
автор: wertu
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыБыстрый обмен WMR|WMZ|WMU|WME <=> Яндекс.Деньги <=> QIWI
Вам нужен быстрый, надежный и гарантированный обмен? Вам сюда!
448 Mark29 124150 Сегодня, 15:06
автор: scanread
Открытая тема (нет новых ответов) Как сейчас зарегистрировать Яндекс кошелек за пределами России?
4 metvekot 419 16.12.2017, 19:04
автор: metvekot
Открытая тема (нет новых ответов) «Яндекс.Деньги» отменили комиссию за мобильные переводы
23 Vmir 4057 15.12.2017, 13:24
автор: Smspva
Открытая тема (нет новых ответов) Тренд сайта по сравнению с аналогами, новый параметр в Яндекс Вебмастере
7 0alex1 1511 14.12.2017, 14:03
автор: coremission


 



RSS Текстовая версия Сейчас: 18.12.2017, 23:09
Дизайн