X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Добавить ответ в эту тему
> продаю список Web страниц с весом цитирования, тексты 300+ миллионов записей
Artisan
Artisan
Topic Starter сообщение 9.9.2015, 12:58; Ответить: Artisan
Сообщение #1


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Согласно указаниям правил.

http://www.maultalk.com/topic81111.html

Продаю список Web страниц с весом цитирования.

Вес цитирования понимается в смысле
Google pagerank, Yandex вИЦ, и похожие.

За основу был взят Google pagerank,
сейчас считается похожим способом.

Тематика не ограничивалась, выбраны
страницы с наибольшим весом цитирования.

Формат текстовые файлы,
300+ миллионов записей.

Запись значит не сайт, а
отдельная страница сайта.

В каждой записи (строке) действительное
число (цифры точка цифры) вес цитирования,
знак @ разделитель, URL адрес страницы.

В базе много хлама, потому что лучше
оставить хлам, чем выбросить полезное.

Для сбора используется
самописное изделие.

Часть знаний была взята с
Google для ускорения, сейчас
все знания собираются без
помощи поисковых систем
прямо с изучаемых сайтов.

Тип площадок всякий,
не ограничивался.

Весь список разбит на 100 (сто) отдельных
текстов, каждый текст упакован в отдельный
ZIP архив, ~ 100 (сто) мегабайт каждый архив,
всего ~ 10 (десять) гигабайт архивов.

Цена пока точно не определена,
для начала USD 100 (сто) продажа,
USD 10 (десять) обновление для
тех, кто уже купили первый раз.

Прошу желающих купить писать мне
в личные сообщения на этом форуме.


Если список нужен, но хотите дешевле,
то предлагайте Вашу разумную цену.

После оплаты я пришлю адрес, с
которого Вы сами скачаете список.

Можно покупать для фирмы,
или в складчину с друзьями.

Можно продавать мелкие выборки из списка.

Можно создавать Ваши сервисы
на основе знаний из этого списка.

Нельзя перепродавать весь
список, и нельзя выкладывать
список для скачивания публике.

Ниже адрес страницы
с образцами из списка,
и количество строк в списке.

При продаже количество
может отличаться, потому
что список обновляется.

http://www.leak.info/leak/index.html

$ wc *.txt

3972498 3972498 287112094 00.txt
3968073 3968073 286841949 01.txt
3966471 3966471 286683497 02.txt
3972879 3972879 287108069 03.txt
3969636 3969636 286919894 04.txt
3973986 3973986 287281668 05.txt
3972944 3972944 287294252 06.txt
3970170 3970170 286909371 07.txt
3969975 3969975 287027425 08.txt
3969588 3969588 286915298 09.txt
3972096 3972096 287079769 10.txt
3972808 3972808 287126293 11.txt
3967863 3967863 286766649 12.txt
3972781 3972781 287216928 13.txt
3965904 3965904 286712814 14.txt
3972141 3972141 287107307 15.txt
3971598 3971598 287056072 16.txt
3971134 3971134 287165358 17.txt
3971537 3971537 287082641 18.txt
3971977 3971977 287035254 19.txt
3972653 3972653 287204425 20.txt
3971063 3971063 287017637 21.txt
3970712 3970712 287061143 22.txt
3973068 3973068 287210117 23.txt
3971025 3971025 287081116 24.txt
3972041 3972041 287019249 25.txt
3971294 3971294 286971717 26.txt
3969689 3969689 286876022 27.txt
3971876 3971876 287064266 28.txt
3974819 3974819 287355205 29.txt
3965845 3965845 286660257 30.txt
3971943 3971943 287115448 31.txt
3968744 3968744 286842070 32.txt
3969329 3969329 286872820 33.txt
3973984 3973984 287315617 34.txt
3969071 3969071 286919574 35.txt
3972211 3972211 287123660 36.txt
3970738 3970738 287000127 37.txt
3969657 3969657 286849516 38.txt
3970792 3970792 287022893 39.txt
3969487 3969487 286924217 40.txt
3973483 3973483 287213099 41.txt
3970167 3970167 286990497 42.txt
3972636 3972636 287155800 43.txt
3967748 3967748 286818063 44.txt
3972016 3972016 287125177 45.txt
3969673 3969673 287019100 46.txt
3969083 3969083 286849028 47.txt
3969519 3969519 286894095 48.txt
3968210 3968210 286903862 49.txt
3970775 3970775 287038742 50.txt
3969582 3969582 286970327 51.txt
3967760 3967760 286828305 52.txt
3975027 3975027 287340298 53.txt
3973868 3973868 287221415 54.txt
3972146 3972146 287179451 55.txt
3970590 3970590 286941580 56.txt
3967437 3967437 286737021 57.txt
3970512 3970512 286988665 58.txt
3968223 3968223 286879913 59.txt
3968122 3968122 286856099 60.txt
3969805 3969805 286949348 61.txt
3970288 3970288 286999932 62.txt
3970174 3970174 286974635 63.txt
3970806 3970806 287014746 64.txt
3970673 3970673 287030411 65.txt
3968625 3968625 286883389 66.txt
3970908 3970908 287070811 67.txt
3969891 3969891 286973880 68.txt
3968575 3968575 286847591 69.txt
3972367 3972367 287137242 70.txt
3972497 3972497 287124494 71.txt
3971053 3971053 287056563 72.txt
3967178 3967178 286767384 73.txt
3968489 3968489 286949056 74.txt
3970824 3970824 287109266 75.txt
3971750 3971750 287096704 76.txt
3971486 3971486 287006871 77.txt
3972295 3972295 287165080 78.txt
3970298 3970298 286994603 79.txt
3970136 3970136 287022568 80.txt
3967125 3967125 286826437 81.txt
3969857 3969857 286951787 82.txt
3965637 3965637 286634154 83.txt
3969843 3969843 286934135 84.txt
3972544 3972544 287175049 85.txt
3971082 3971082 287050933 86.txt
3974031 3974031 287272674 87.txt
3969543 3969543 286885002 88.txt
3969259 3969259 286935930 89.txt
3970798 3970798 287029772 90.txt
3968689 3968689 286858917 91.txt
3966635 3966635 286744558 92.txt
3971649 3971649 287083283 93.txt
3970527 3970527 286939900 94.txt
3970461 3970461 287023886 95.txt
3969260 3969260 286908166 96.txt
3971381 3971381 287142736 97.txt
3968318 3968318 286806583 98.txt
3969184 3969184 286880653 99.txt
397046618 397046618 28700159364 total

Сообщение отредактировал Artisan - 9.9.2015, 13:00


--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
anchous
anchous
сообщение 9.9.2015, 13:45; Ответить: anchous
Сообщение #2


Йеребатан Абырвалг
*******

Группа: Super Moderator
Сообщений: 7996
Регистрация: 12.4.2011
Из: СССР
Поблагодарили: 4515 раз
Репутация:   418  


Цитата(Artisan @ 9.9.2015, 12:58) *
В базе много хлама

Цитата(Artisan @ 9.9.2015, 12:58) *
300+ миллионов записей

Цитата(Artisan @ 9.9.2015, 12:58) *
для начала USD 100 (сто) продажа


можно я просто резюмирую, дабы не приходилось выискивать крупицы смысла в простыне


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
zhurik
zhurik
сообщение 9.9.2015, 13:56; Ответить: zhurik
Сообщение #3


Бывалый
****

Группа: User
Сообщений: 376
Регистрация: 27.4.2013
Из: Тюмень
Поблагодарили: 179 раз
Репутация:   37  


Как то непонятно, какое практическое применение у этих списков?


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Artisan
Artisan
Topic Starter сообщение 10.9.2015, 10:02; Ответить: Artisan
Сообщение #4


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Цитата(anchous @ 9.9.2015, 9:45) *
можно я просто резюмирую


Можно, спасибо.

Все искалки собирают хлам,
чтобы не потерять полезное.

Мое дело честно описать.

Цитата(Artisan @ 9.9.2015, 8:58) *
Если список нужен, но хотите дешевле,
то предлагайте Вашу разумную цену.


По поводу цены для самых смелых
есть специальное предложение.

Цитата(zhurik @ 9.9.2015, 9:56) *
какое практическое применение у этих списков?


Например искать места
для размещения линков.

Если нужны линки из страны, выбрать
страницы под национальным доменом.

Выборки адресов
с ключевым словом.

И дальше по списку.




Правила Форума

http://www.maultalk.com/topic66650.html

Цитата
17. Исключением может быть публикация информации, связанной с какими-либо нововведениями, при условии ее подробного изложения.


Есть полезная новость.

Цитата(Artisan @ 9.9.2015, 10:18) *
По поводу цены для самых смелых
есть специальное предложение.


Я попробовал цену для ограничения количества
пользователей, чтобы у покупателей было меньше
конкурентов, и покупателям было проще заработать.

Насколько я понял, трудящимся список интересен,
но пока нет ясности, как на этом зарабатывать.

Поэтому попробуем другой способ действий.

Больше пользователей, которые
думают, что делать со списком.

USD 10 (десять) цена продажи,
USD 1 (один) цена обновления.


Цена продажи может меняться,
цена обновления может меняться.

Возможно вместо цены за отдельные скачивания
будет цена подписки на год или другое время.

Для экономного использования сети
возможно будет организовано скачивание
через торрент или другими способами.

Пояснения по весу цитирования.

Вес цитирования не абсолютная величина,
а относительная, то есть числа работают
для сравнения страниц в пределах списка.

Точность вычисления веса цитирования
похожа на точность Google pagerank,
у которого логарифмическая шкала.

То есть значения вычисляются
с точностью в несколько раз.

Сообщение отредактировал Artisan - 10.9.2015, 10:16


--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Woopy
Woopy
сообщение 10.9.2015, 11:49; Ответить: Woopy
Сообщение #5


Бывалый
****

Группа: User
Сообщений: 269
Регистрация: 15.1.2013
Из: Луганск
Поблагодарили: 54 раза
Репутация:   20  


Цитата(Artisan @ 9.9.2015, 12:58) *
выбраны страницы с наибольшим весом цитирования.


Цитата(Artisan @ 9.9.2015, 12:58) *
За основу был взят Google pagerank, сейчас считается похожим способом.


за основу взят pr? не совсем понимаю как вы рассчитывали вес цитирования, по количеству ссылающихся источников, если за основу взят pr то для поднятия ТИЦа, к примеру, ваша база ни к чему, так как у гугла и яндекса разные основы цитирования, у гугла, ранее, до отмены PRa, pr 2-3 главной и страниц категорий легко делался внутренней перелинковкой. можете еще разок поподробней расписать, что конкретно вы продаете. и кому и для чего данная база может сгодится, ну кроме "300+ миллионов записей", тысячная часть которых парсится с любого новостника которому более 10 лет учитывая что гугл пихает в индекс все что ни попадя, а вы сами написали, что очень много мусора в базе
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Artisan
Artisan
Topic Starter сообщение 10.9.2015, 13:02; Ответить: Artisan
Сообщение #6


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Цитата(Woopy @ 10.9.2015, 7:49) *
за основу взят pr? не совсем понимаю как вы рассчитывали вес цитирования, по количеству ссылающихся источников, если за основу взят pr то для поднятия ТИЦа, к примеру, ваша база ни к чему, так как у гугла и яндекса разные основы цитирования, у гугла, ранее, до отмены PRa, pr 2-3 главной и страниц категорий легко делался внутренней перелинковкой.


https://ru.wikipedia.org/wiki/PageRank

Пояснение PageRank в статье с адресом выше.

Основное отличие от тИЦ в том,
что PageRank учитывает не только
количество входящих линков, но
еще и важность этих линков.

Например один линк с морды CNN важнее,
чем тысяча линков со страниц школьников.

По поводу ни к чему, тИЦ для продвижения
действительно ни к чему, а вес цитирования
прямо влияет на продвижение, проще всего
понять по количеству страниц в поиске.

Yandex раньше тоже публиковал вес цитирования
типа PageRank, вИЦ, взвешенный индекс цитирования,
но потом Yandex его спрятал, чтобы не палить
оптимизаторам важные места.

В моем списке есть страницы под
RU и другими национальными доменами,
то есть для Yandex тоже годится.

PageRank пока не отменяли, но перестали
публиковать обновления, возможно чтобы
не палить оптимизаторам важные места.

Я вычисляю вес цитирования,
чтобы искать важные места.

За основу взят способ вычисления PageRank,
и начальные значения для веса цитирования,
чтобы ускорить вычисление обновлений.

Сейчас вычисления не зависят
от Google и других искалок.

Цитата(Woopy @ 10.9.2015, 7:49) *
можете еще разок поподробней расписать, что конкретно вы продаете. и кому и для чего данная база может сгодится, ну кроме "300+ миллионов записей", тысячная часть которых парсится с любого новостника которому более 10 лет учитывая что гугл пихает в индекс все что ни попадя, а вы сами написали, что очень много мусора в базе


Я продаю список страниц, линки
с которых важны для продвижения.

Можно покупать в известных местах линки,
которые плохо работают или вредят, потому
что продажные места известны искалкам.

Или можно найти другие места,
которые обычно не торгуют линками,
где можно размещать линки, которые
будут работать лучше линков
в известных местах.

Тысячная часть парсится,
но тысячная часть не годится
для вычисления важности.

Хлама много, я сразу об этом написал.

Но вместе с хламом
есть и полезности.

Доля полезного лучше, чем в Google, потому
что выше условия для попадания в список.

Лучше сохранить хлам,
чем потерять полезное.



--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seaddnet
seaddnet
сообщение 10.9.2015, 14:29; Ответить: seaddnet
Сообщение #7


Новичок
*

Группа: User
Сообщений: 23
Регистрация: 8.9.2015
Поблагодарили: 1 раз
Репутация:   0  


Artisan, не очень понятно как это использовать? Отобрал страницы и писать 100 000 писем владельцам сайтов с просьбой на конкретной странице ссылку разместить? Забанят за спам в первый же день. Крайне не эффективное занятие.
Вы бы уже тогда отфильтровали базу по начилию формы комментов и разделили по движкам сайтов, дорвейщики бы такую думаю купили, а так фактически база на единичного специфического пользователя.


--------------------
Seadd.net - недорогой пакетный аддурл в Гугл, Яндекс, Бинг.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Artisan
Artisan
Topic Starter сообщение 10.9.2015, 16:20; Ответить: Artisan
Сообщение #8


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Цитата(seaddnet @ 10.9.2015, 10:29) *
Отобрал страницы и писать 100 000 писем владельцам сайтов с просьбой на конкретной странице ссылку разместить?


Зачем 100 тысяч писем? Сначала сделать
грубую выборку, потом натравить на тысячи
адресов грубой выборки Вашего робота,
чтобы уточнял годность для задачи.

Останется выборка самых годных,
с которыми работать тщательно.

Цитата(seaddnet @ 10.9.2015, 10:29) *
Вы бы уже тогда отфильтровали базу по начилию формы комментов и разделили по движкам сайтов.


https://ru.wikipedia.org/wiki/Разделение_труда

Цитата
Разделе́ние труда́ — исторически сложившийся процесс обособления, видоизменения, закрепления отдельных видов трудовой деятельности, который протекает в общественных формах дифференциации и осуществления разнообразных видов трудовой деятельности.

Является причиной повышения общей производительности труда организованной группы специалистов (синергетический эффект) за счет:

* Выработки навыков и автоматизма совершения простых повторяющихся операций
* Сокращения времени, затрачиваемого на переход между различными операциями


Есть много людей, которые умеют
ваять роботов для изучения страниц.

Можно зарабатывать на продаже роботов
для тщательного изучения адресов из списка.

Можно делать готовые выборки,
и можно делать online сервисы.

Цитата(seaddnet @ 10.9.2015, 10:29) *
фактически база на единичного специфического пользователя.


Я тоже так думал, поэтому
сразу пробовал цену больше.

Но когда я уменьшил цену,
тогда интерес увеличился.

Чем больше людей,
тем больше идей
для использования.



--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Artisan
Artisan
Topic Starter сообщение 17.9.2015, 21:32; Ответить: Artisan
Сообщение #9


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Список даром.

http://rapidgator.net/folder/3491139/20150917.html

Качество вычислений
будет улучшаться.


--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Artisan
Artisan
Topic Starter сообщение 28.9.2015, 1:31; Ответить: Artisan
Сообщение #10


Участник
***

Группа: User
Сообщений: 107
Регистрация: 9.7.2015
Из: venok.com
Поблагодарили: 15 раз
Репутация:   4  


Сделаны улучшения согласно
советам от пользователей.

Вычисления улучшились,
и хлама стало меньше.

http://rapidgator.net/folder/3503518/20150927.html

Свежий список даром.

http://www.leak.info/

Сайт с адресами
свежих списков.


--------------------
{ www.venok.com / wiki для Ваших новостей, \ ( English / английский / перевожу / сочиняю )
\ BB code с линками, быстрое добавление, любое количество. }
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Добавить ответ в эту тему
Быстрый ответ
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Черный список обменников и как безопасно обменять валюту
140 Kurses 29733 Вчера, 16:20
автор: BestExchangers
Открытая тема (нет новых ответов) Создание сайтов / Web Studio Avram Lincoln
15 AvramLincoln 1672 7.12.2017, 14:09
автор: Nikko
Открытая тема (нет новых ответов) Индексирование страниц
8 munch 1602 5.12.2017, 19:48
автор: mussan
Открытая тема (нет новых ответов) Вебмастер яндекса показывает большое количество левых страниц с сайта
3 AlexsBloger 997 4.12.2017, 22:10
автор: Pavel85
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыПродаю Качественные, Уникальные статьи на заказ Вебархив от 90 - 100% Уникальность!
Вебархив по очень низкой цене 5р за 1000 символов текста бсп
39 Webfrilanser 6006 4.12.2017, 20:20
автор: Александр30


 



RSS Текстовая версия Сейчас: 13.12.2017, 11:34
Дизайн