X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Парсинг страницы
macbeth9
macbeth9
Topic Starter сообщение 3.12.2013, 18:56; Ответить: macbeth9
Сообщение #1


Приветствую всех! Есть задача, нужно спарсить страницу https://btc-e.com/exchange/ltc_usd . Пока у меня не получается идет редирект там, можете помочь пожалуйста. Заранее благодарю.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Degradator
Degradator
сообщение 3.12.2013, 19:14; Ответить: Degradator
Сообщение #2


Там вроде нет ничего (из видимого кода).
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
macbeth9
macbeth9
Topic Starter сообщение 3.12.2013, 19:47; Ответить: macbeth9
Сообщение #3


ну она никак не хочет, пробывал через file_get_contents, curl and etc.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
xdrew
xdrew
сообщение 3.12.2013, 21:03; Ответить: xdrew
Сообщение #4


Она не хочет, потому что курл не умеет исполнять js, а страница отдает скрипт, который и редиректит:
[JS]document.cookie="a=a5f6c8768cf9f4f6acd1281c9380a356;path=/;";location.href=document.location.pathname;[/JS]
Отключите в своем браузере js — тоже перестанет открываться.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
macbeth9
macbeth9
Topic Starter сообщение 3.12.2013, 21:19; Ответить: macbeth9
Сообщение #5


так как тогда можно получить?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
xdrew
xdrew
сообщение 6.12.2013, 8:47; Ответить: xdrew
Сообщение #6


Как-то даже и не знаю. Как вариант, запускать selenium и использовать какой-нибудь фреймворк, типа behat или codeception для работы с ним. Но это уже изврат какой-то. Вероятно, как-то проще можно.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Witu
Witu
сообщение 6.12.2013, 14:53; Ответить: Witu
Сообщение #7


а что там вообще нужно взять то?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
cren
cren
сообщение 11.12.2013, 10:31; Ответить: cren
Сообщение #8


Нужно парсить данные которые js записывает в cookie, сохранять их в куки cURL, а после этого получать страницу.

например:
[PHP]
function get_page($url, $cookies=''){
...
}

$url = 'https://btc-e.com/exchange/ltc_usd';
$page = get_page($url);
$cookie = explode($page, 'document.cookie="');
$cookie = explode($cookie[1], '"');
$cookie = $cookie[0];
$page = get_page($url, $cookie);

[/PHP]

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыТрафик в Телеграм (рассылка, инвайт, парсинг)
9 gelt 2847 8.4.2024, 15:28
автор: gelt
Открытая тема (нет новых ответов) Нужно ли закрывать ненужные страницы тегом noindex, follow?
8 noviktamw 2906 2.3.2024, 12:53
автор: toplinks
Открытая тема (нет новых ответов) Вытащить страницы из кэша Яндекса
2 VostrVL 1959 11.1.2024, 23:07
автор: ЛаврионСергеевич
Открытая тема (нет новых ответов) ВКонтакте: полный комплекс услуг (массовая рассылка по стенам групп и в ЛС), парсинг, лайки, инвайты
Гарантия самой низкой цены
4 MaxChemist 1917 1.1.2023, 13:23
автор: MaxChemist
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыСбор баз, парсинг информации, постинг, автоматизация
Качественно и в срок
21 SEOMR 20838 22.7.2022, 15:10
автор: iodjin


 



RSS Текстовая версия Сейчас: 19.4.2024, 11:09
Дизайн