X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Автоматизация
James Raynor
James Raynor
Topic Starter сообщение 31.5.2012, 7:07; Ответить: James Raynor
Сообщение #1


Здравствуйте. Сегодня на рботе шеф озадачил: выбрать из базы ИНН(>1900 строк) организации, которые занимаются алкоголем. Проверка происходит через сторонний сайт. Копируешь из эксель ИНН вставляешь туда, нажимаешь найти, ищешь глазками в видах деятельности всякий алкоголь.

Можно-ли сделать это с помошью скрипта? Если возможно, то подскажите в каком направление копать.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
xdrew
xdrew
сообщение 31.5.2012, 10:29; Ответить: xdrew
Сообщение #2


А нельзя на стороннем сайте сделать поиск по видам деятельности и выбрать алкоголь, а потом получить инн организаций, связанных с ним? Тогда просто бы получили список и банально прогнали.
Если нет, можно попробовать почитать про cURL.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arks
Arks
сообщение 31.5.2012, 15:03; Ответить: Arks
Сообщение #3


(James Raynor @ 31.5.2012, 10:07) *
ищешь глазками в видах деятельности всякий алкоголь

ну очевидно раз классификатора нет то вы его никак и не запрограммируете. Вам необходимо сначала определить в БД классификатор по тестовым данным(наборы слов которые классифицируют предложение как алкоголь, автомобили, электрочайники и т.п.), предварительно добавленным в БД. Затем каждый раз выполнять эту операцию при импорте данных по существующему классфикатору. Эксель почитать не проблема да он тут и не нужен если все проходит через БД.
Разумеется такой классификатор будет ошибаться пока не станет очень полным и медленным. Так что сначала определите критерии классификации.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
r3ntg3n
r3ntg3n
сообщение 31.5.2012, 15:09; Ответить: r3ntg3n
Сообщение #4


Например, можно парсер сделать: считывать данные из xls файла, прогонять их через сторонний сайт, и писать результаты проверки в БД. Получается, если у вас добавляется новый контрагент, которого еще нету в БД, то вам придется его проверить и записать в БД, если же контрагент уже в БД, то просто пропускаете его. Это что касается синхронизации. Впролне возможно, что на стороннем сайте есть какой-то интерфейс, тогда работать вообще через него. Результаты загоняете в БД, виды деятельности можете писать из класификаторами (кодами), а можете прямо текстом. Потом просто ищете по ключевому слову "алкоголь" или по соотвествующему коду.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arks
Arks
сообщение 1.6.2012, 1:07; Ответить: Arks
Сообщение #5


Касательно стороннего сайта - открываете фаербаг и смотрите при проверки списка ИНН на какой адрес происходит запрос и формат его POST-параметров.
Потом пишете у себя php -скрипт, Вам необходимо освоить для этого работу с Curl, найдете примеры в интернете. это расширение будет эмулировать данный пост-запрос с данными ИНН, автоматически подставленными из Вашей БД и возвращать в скрипт ответ стороннего сервера(например html или json) - вы этот ответ будете парсить, запихивать к себе в базу а уже потом как-то обрабатывать данные в своей БД - классифицировать, чистить и т.п.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
James Raynor
James Raynor
Topic Starter сообщение 1.6.2012, 6:52; Ответить: James Raynor
Сообщение #6


А сколько такой скрипт может стоить? А-то может убедить шефа заказать его.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arks
Arks
сообщение 1.6.2012, 8:32; Ответить: Arks
Сообщение #7


(James Raynor @ 1.6.2012, 09:52) *
А сколько такой скрипт может стоить?

такой какой? Парсер 300-1000 руб., эвристическая система классификации - 1 000 000 руб.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
James Raynor
James Raynor
Topic Starter сообщение 4.6.2012, 7:48; Ответить: James Raynor
Сообщение #8


Интересно, сколько написание займет времени.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) ✅ Dolphin - умная автоматизация вашей рекламы Facebook
54 Dolphin_Support 19113 27.2.2024, 18:01
автор: Dolphin_Support
Открытая тема (нет новых ответов) Автоматизация работы в браузере (BAS)
11 Moonsoon 7328 11.4.2023, 6:23
автор: Skyworker
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыСбор баз, парсинг информации, постинг, автоматизация
Качественно и в срок
21 SEOMR 20709 22.7.2022, 15:10
автор: iodjin
Открытая тема (нет новых ответов) ZennoPoster-услуги по написанию ботов, автоматизация работы в браузере. Сбор любых баз.
ZennoPoster-услуги по написанию шаблонов
0 Progernaut 1166 13.11.2020, 20:20
автор: Progernaut
Открытая тема (нет новых ответов) Teoseo - Парсинг, Наполнение, Автоматизация
8 teoseo 1848 22.8.2020, 10:14
автор: teoseo


 



RSS Текстовая версия Сейчас: 19.3.2024, 12:59
Дизайн