X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> Языки сайта и парсинг страницы
kvins
kvins
Topic Starter сообщение 4.3.2014, 13:40; Ответить: kvins
Сообщение #1


Завсегдатай
*****


Группа: Active User
Сообщений: 750
Регистрация: 7.9.2011
Из: москва
Поблагодарили: 89 раз
Репутация:   7  


Нужно спарсить кусочек с городами тут http://dpd.ru/dpd/otpravka/varianty-...isterminal.do2

Пробовал спарсить часть страницы сайта через file_get_contents

Код:
Код
$url = 'http://dpd.ru/dpd/otpravka/varianty-otpravki/blizhajshij-ofisterminal.do2'; $start = '<div id="main">'; $finish = '</div>'; function parser($url,$start,$finish) {     $content = file_get_contents($url);     $position1 = strpos($content, $start);     $position2 = strpos($content, $finish);     $content = substr($content, $position1, $position2-$position1);     $content = strip_tags($content, '<p><a>');     //echo nl2br($content);    // echo ($content);     return $content; }   $tt = parser($url, $start, $finish);

Но что то я не смог правильно настроить его и потом решил что лучше через PHP Simple HTML DOM Parser
Код:

Код
$html = file_get_html('http://dpd.ru/dpd/otpravka/varianty-otpravki/blizhajshij-ofisterminal.do2');  // Find all SPAN tags that have a class of "myClass" foreach($html->find('ul.arrow') as $e)     echo $e->outertext . '<br>';


и в любом из услучаев выдает мне английскую версию, хотя заходя на сайт , показывает русскую, на сайте 2 языка и язык переключается через js , отдельные страницы я не заметил

Сообщение отредактировал kvins - 4.3.2014, 13:41


--------------------
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Tollun
Tollun
сообщение 4.3.2014, 14:17; Ответить: Tollun
Сообщение #2


Старожил
******

Группа: Active User
Сообщений: 1595
Регистрация: 1.10.2009
Из: Хабаровск
Поблагодарили: 394 раза
Репутация:   66  


Хозяева сайта уже скоро узнают о Ваших похождениях из статистики :)

А по теме, используйте curl, отправляйте header с нужным Accept-Language
хотя если Вам file_get_contents роднее - через него тоже можно

Сообщение отредактировал Tollun - 4.3.2014, 14:22


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Чем сжимать картинки для сайта без потери качества
1st-finstep.ru - Заработок в сети и методы продвижения сайта
15 komarik_vlad 1529 Сегодня, 12:05
автор: x64
Открытая тема (нет новых ответов) Нужен шаблон сайта. Джумла. игры
1 pix87 502 Вчера, 20:54
автор: Yepperoni
Открытая тема (нет новых ответов) Редирект только главной страницы
301 редирект
2 Gera 526 15.12.2017, 13:50
автор: Gera
Открытая тема (нет новых ответов) Турбо страницы
13 OS_ZP_UA 1910 15.12.2017, 11:07
автор: Ley
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыНе повлияет ли на позиции сайта?
Если убрать контент
12 maxg5 1329 14.12.2017, 21:11
автор: alexandrrr


 



RSS Текстовая версия Сейчас: 17.12.2017, 16:33
Дизайн