Помощник
|
Как скопировать адреса сайтов из лайвинтернет? |
Sonic_md
|
Сообщение
#1
|
||
|
|
||
|
|||
nonamez |
21.1.2016, 12:01;
Ответить: nonamez
Сообщение
#2
|
|
Хитро там сделано. Оно с JS подгружает в TSV формате http://www.liveinternet.ru/rating///today.tsv?page=1
|
|
|
Jordanutto |
21.1.2016, 12:02;
Ответить: Jordanutto
Сообщение
#3
|
|
Content Downloader так сможет сделать, а точнее тот, у кого он есть. Думаю за 3$ исполители найдутся.
-------------------- Парсинг любой информации с Авито, Drom, Cian, Юла, Эльдорадо, Мвидео. Писать в ЛС |
|
|
nonamez |
21.1.2016, 12:49;
Ответить: nonamez
Сообщение
#4
|
|
За что тут платить? 2 строки кода:
Код $last_page = 14119; for ($i = 1; $i < ($last_page + 1); $i++) { $data = file_get_contents('http://www.liveinternet.ru/rating///today.tsv?page=' . $i); $data = preg_replace('/^.+\n/', '', $data); file_put_contents('out.tsv', $data, FILE_APPEND); } На выходе получаем файл формата tsv, который прекрасно читается екселем и ему подобными Selection_038.png ( 259,75 килобайт ) Кол-во скачиваний: 9 если не нравится tsv, то вот csv: Код $last_page = 14119;
for ($i = 1; $i < ($last_page + 1); $i++) { $out_csv = fopen('out.csv', 'a'); if (($handle = fopen('http://www.liveinternet.ru/rating///today.tsv?page=' . $i, "r")) !== FALSE) { while (($data = fgetcsv($handle, 1000, "\t")) !== FALSE) { if ($data[0] !== 'всего') { fputcsv($out_csv, $data); } } fclose($out_csv); fclose($handle); } } Сообщение отредактировал nonamez - 21.1.2016, 12:49 |
|
|
Sonic_md
|
Сообщение
#5
|
|
nonamez,
Спасибо. А куда и как этот код (первый или второй код(для эксель)) вставлять, чтобы получить файл с адресами сайтов? |
|
|
nonamez |
21.1.2016, 13:29;
Ответить: nonamez
Сообщение
#6
|
|
Sonic_md, это PHP
|
|
|
Sonic_md
|
Сообщение
#7
|
|
nonamez,
Может моя просьба окажется неприличной. Но если это не займет много времени и ресурсов ПК, можете скинуть сюда итоговый txt файл(или xls-файл, если тхт нельзя) с адресами сайтов, т.к. нужны только адреса (названия сайтов или другая статистика не нужна)? nonamez, Со скриптами дело не имел. Погуглил. Подскажите правильно ли делаю Часть 1. 1. Скачал-установил Denwer 2. Запустил Денвер 2: Зашел на новый виртуальный диск Z. 3: Зашел в папку home. 4: Создал свой папку: test 5: Зашел в эту папку и создал в ней папку с именем www. 6: В папке www создал файл index.php в котором записал этот код, который вы прислали 7: Перезапустил Denwer 8: В браузере открыл ссылку: http://test/index.php жму Enter и в этой вкладке вижу просто текст: $last_page = 14119; for ($i = 1; $i < ($last_page + 1); $i++) { $data = file_get_contents('http://www.liveinternet.ru/rating///today.tsv?page=' . $i); $data = preg_replace('/^.+\n/', '', $data); file_put_contents('out.tsv', $data, FILE_APPEND); } и ничего не происходит Или не так делаю? |
|
|
nonamez |
21.1.2016, 16:34;
Ответить: nonamez
Сообщение
#8
|
|
и ничего не происходит Или не так делаю? Делаешь правильно, молодец, но есть определённые нюансы - лень объяснять... Вот список links_uniq.zip ( 1,81 мегабайт ) Кол-во скачиваний: 6 (Убраны повторы) Сообщение отредактировал nonamez - 21.1.2016, 16:35 |
|
|
Sonic_md
|
Сообщение
#9
|
|
nonamez,
А какие повторы? не заметил |
|
|
nonamez |
21.1.2016, 16:51;
Ответить: nonamez
Сообщение
#10
|
|
Sonic_md, я не знаю, прогнал просто список на дубликаты на всякий случай и всё. Возможно повторы там из-за того, что стата лайв и при переходе по страницам некоторые сайты прыгают.
Сообщение отредактировал nonamez - 21.1.2016, 16:52 |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Статейное продвижение ваших сайтов по качественной базе с тИЦ тИЦ 10+ |
237 | Intersect | 257964 | Сегодня, 12:13 автор: Intersect |
|
Как вы отдыхаете от работы за компом | 151 | adw-kupon.ru | 19830 | Вчера, 13:52 автор: Vmir |
|
Как вы бросили работу и перешли на заработок с сайтов? | 20 | uahomka | 3455 | Вчера, 11:54 автор: Skyworker |
|
Как в пушсетках покупают по 100-200 тысяч кликов за день? | 1 | Boymaster | 541 | Вчера, 11:45 автор: Skyworker |
|
Вечные ссылки с трастовых сайтов | 54 | 1informer | 22854 | 20.4.2024, 18:39 автор: 1informer |
Текстовая версия | Сейчас: 24.4.2024, 15:29 |