X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Парсер Http://blogs.yandex.ru/
Inviseble_Demon
Inviseble_Demon
Topic Starter сообщение 11.3.2010, 22:22; Ответить: Inviseble_Demon
Сообщение #1


Парсер полного текста из выдачи http://blogs.yandex.ru/





Из настроек


Скрипт выполнени в виде набора функций для работы и 1 итоговой для получения либо масива либо созронения файлов.
Пример вызова


Из функционала.
  • Работа по проксям
  • Наличие задержки после каждого запроса.
  • Возможность сохронения данных в файлы.
  • Возможность получения масива данных без сохронения.
  • Возможность регулирования области поиска.
  • Постоянная смена юзер-агента (более 100 штук..)
  • Данные конвертируются из utf-8 в windows-1251


Пример итоговой работы скрипта при настройках сохронения данных в файл. (для всех запросов сканировалась только 1 страница. для запроса "статья" 10 страниц..)

Скрипт легко встраивается (если у вас есть конечно навыки программирования) в любой открытый скрипт на php.
В принцепи сделать парсинг и ограницение размера статьи к примеру не мение 1000 сим. и можно генерить ГС сателиты доры чего хотите rolleyes.gif

====ICQ#355016572====
Стоимость скрипта: 10$
Первому за отзыв.
Второму за 5$
====================


--------------------
Отзывы: Weblancer.Net Nulled.Ws
4
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
crazyyy
crazyyy
сообщение 11.3.2010, 22:23; Ответить: crazyyy
Сообщение #2


Буду первым)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
nexUS
nexUS
сообщение 11.3.2010, 22:26; Ответить: nexUS
Сообщение #3


отписал в icq
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Inviseble_Demon
Inviseble_Demon
Topic Starter сообщение 11.3.2010, 22:52; Ответить: Inviseble_Demon
Сообщение #4


crazyyy - в личке.
nexUS - ответил, сделка прошла успешно.

Все. акции окончены.
Ждем новых сделок и отзывов.


--------------------
Отзывы: Weblancer.Net Nulled.Ws
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 11.3.2010, 22:54; Ответить: webpavilion
Сообщение #5


CURL? сколько потоков?


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Inviseble_Demon
Inviseble_Demon
Topic Starter сообщение 12.3.2010, 13:05; Ответить: Inviseble_Demon
Сообщение #6


(webpavilion @ 12.3.2010, 0:54) *
CURL? сколько потоков?

Он самый.
Поток 1.
Смысла от многопоточности толком нет.

Скрипт разработан в виде импортируемого кода в проекты.
Если есть желание можно преоброзовать в полноценный скрипт для парсинга с многопоточностью.
Но это только если действительно требуется не 1-3 человекам ))

В виду обстоятельств crazyyy несможет провести тестирование в блажайшее время.
Вакансия первого снова открыта.


--------------------
Отзывы: Weblancer.Net Nulled.Ws
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 13.3.2010, 10:46; Ответить: webpavilion
Сообщение #7


(Inviseble_Demon @ 12.3.2010, 12:05) *
Вакансия первого снова открыта.

готов потестить.

(Inviseble_Demon @ 12.3.2010, 12:05) *
Смысла от многопоточности толком нет.

на основании чего сделаны такие выводы? всегда приятно если что то работает быстрее чем могло бы.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Inviseble_Demon
Inviseble_Demon
Topic Starter сообщение 15.3.2010, 15:33; Ответить: Inviseble_Demon
Сообщение #8


webpavilion
В личке.
От многопоточности толку нет потому как на яше есть огран по колличеству запросов... Все равно нужно делать замедление для того чтобы под бан не попасть именно по этому многопоточность ненужна пока, если её реализовывать то и капку нужно вводить..

Сообщение отредактировал Inviseble_Demon - 15.3.2010, 15:34


--------------------
Отзывы: Weblancer.Net Nulled.Ws
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
webpavilion
webpavilion
сообщение 15.3.2010, 16:15; Ответить: webpavilion
Сообщение #9


Inviseble_Demon, получил - смотрю, вечером отпишу.

(Inviseble_Demon @ 15.3.2010, 14:33) *
От многопоточности толку нет потому...

проксёй пользоваться не кошерно?

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.


--------------------
Не ведитесь, cамопис это почти всегда плохо!

Делаю сайты на Drupal 7.x
(очень дорого)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
353 Forbidden 279230 11.4.2024, 17:07
автор: AParser_Support
Открытая тема (нет новых ответов) Бесплатный парсер бот в Телеграм - [Parser Pro]
5 Parser_Pro 3346 27.1.2024, 16:12
автор: Parser_Pro
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыUXBTC.com - Обменный Центр Bitcoin, BTC-e, Webmoney, PerfectMoney, Privat24, Qiwi, Yandex, OKPAY, Paxum, Payoneer!
BTC, Биткоин, БТС-е, Вебмани (WMZ, WMU, WMR), Приват24, Киви, Окпей.
72 exfin 55587 14.6.2023, 14:43
автор: exfin
Открытая тема (нет новых ответов) WebArchiveMaster - парсер Вебархива
Добыча контента из ВебАрхива
16 footashes 12305 23.11.2022, 16:36
автор: kuz999
Открытая тема (нет новых ответов) Быстрый валидатор email Gmail|Yandex|Mail.ru|Rambler|Yahoo|Hotmail|Live|Msn+ -=GoodMail=- на запросах Zennoposter
шустрый многопоточный валидатор почт на запросах
0 akcium 2007 19.11.2022, 13:17
автор: akcium


 



RSS Текстовая версия Сейчас: 16.4.2024, 13:54
Дизайн