Предлагаю свежие базы (начало февраля 2014) ЯК, русский DMOZ, каталог Mail.ru и базу сайтов с присвоенной Яндексом тематикой (январь 2014).
1) База сайтов, находящихся в Яндекс каталоге. файл excel (xlsx), поля: - домен вида (домен.ру) - домен в кодировке Punycode - ТИЦ - регион - рубрика каталога вида: Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув и т.д. Поддерживается полный уровень вложенности подрубрик. Полные дубли (домен + рубрика) удалены. Также удалены "промежуточные" значения, полученные при парсинге. Т.е. если после парсинга было: домен1.ру | Рубрика / Подрубрика 1ув домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув То в итоге останется: домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув Т.е. можно делать максимально полную выборку по любой рубрике, подрубрике любого уровня вложенности. Всего уникальных доменов (без дублей) - 125023 шт. Цена: 40$
2) База Скрытый ЯК Сайты с присвоенной Яндексом тематикой (т.н. "Скрытый ЯК"). База в формате Excel (xlsx), поля базы: - домен - ТИЦ - тематика по бару - регион Домены проверены на "клей" и наличие в ЯК - т.е. они не склеены и их нет в яндекс каталоге (yaca.yandex.ru). Собрана в Январе 2014. Общее количество доменов в базе - 25880 шт. Цена: 40$
3) База сайтов, находящихся в русском Дмозе (http://www.dmoz.org/World/Russian/) файл excel (xlsx), поля: - домен вида (домен.ру) - домен в кодировке Punycode - ТИЦ - рубрика каталога вида: Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув и т.д. Поддерживается полный уровень вложенности подрубрик. Полные дубли (домен + рубрика) удалены. Также удалены "промежуточные" значения, полученные при парсинге. Т.е. если после парсинга было: домен1.ру | Рубрика: Подрубрика 1ув домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув То в итоге останется: домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув Дублирующиеся домены подсвечены, легко можно отсортировать и почистить стандартными средствами excel. Всего уникальных доменов (без дублей) - 95456 шт. Цена: 30$
4) База сайтов, находящихся в каталоге list.mail.ru файл excel (xlsx), поля: - домен вида (домен.ру) - домен в кодировке Punycode - основная рубрика каталога - ТИЦ Внутри каждой рубрики дублей нет. Некоторые домены могут присутствовать в нескольких рубриках каталога - поэтому дублируются в общей базе. Дублирующиеся домены подсвечены, легко можно отсортировать и почистить стандартными средствами excel. Всего уникальных доменов (без дублей) - 92287 шт. Цена: 30$
Контакты: ICQ: 613726098 E-mail: base-10@mail.ru
|
|