Помощник
|
Автоматизация |
James Raynor
|
Сообщение
#1
|
||
|
|
||
|
|||
xdrew |
31.5.2012, 10:29;
Ответить: xdrew
Сообщение
#2
|
|
А нельзя на стороннем сайте сделать поиск по видам деятельности и выбрать алкоголь, а потом получить инн организаций, связанных с ним? Тогда просто бы получили список и банально прогнали.
Если нет, можно попробовать почитать про cURL. |
|
|
Arks |
31.5.2012, 15:03;
Ответить: Arks
Сообщение
#3
|
|
ищешь глазками в видах деятельности всякий алкоголь ну очевидно раз классификатора нет то вы его никак и не запрограммируете. Вам необходимо сначала определить в БД классификатор по тестовым данным(наборы слов которые классифицируют предложение как алкоголь, автомобили, электрочайники и т.п.), предварительно добавленным в БД. Затем каждый раз выполнять эту операцию при импорте данных по существующему классфикатору. Эксель почитать не проблема да он тут и не нужен если все проходит через БД. Разумеется такой классификатор будет ошибаться пока не станет очень полным и медленным. Так что сначала определите критерии классификации. |
|
|
r3ntg3n |
31.5.2012, 15:09;
Ответить: r3ntg3n
Сообщение
#4
|
|
Например, можно парсер сделать: считывать данные из xls файла, прогонять их через сторонний сайт, и писать результаты проверки в БД. Получается, если у вас добавляется новый контрагент, которого еще нету в БД, то вам придется его проверить и записать в БД, если же контрагент уже в БД, то просто пропускаете его. Это что касается синхронизации. Впролне возможно, что на стороннем сайте есть какой-то интерфейс, тогда работать вообще через него. Результаты загоняете в БД, виды деятельности можете писать из класификаторами (кодами), а можете прямо текстом. Потом просто ищете по ключевому слову "алкоголь" или по соотвествующему коду.
|
|
|
Arks |
1.6.2012, 1:07;
Ответить: Arks
Сообщение
#5
|
|
Касательно стороннего сайта - открываете фаербаг и смотрите при проверки списка ИНН на какой адрес происходит запрос и формат его POST-параметров.
Потом пишете у себя php -скрипт, Вам необходимо освоить для этого работу с Curl, найдете примеры в интернете. это расширение будет эмулировать данный пост-запрос с данными ИНН, автоматически подставленными из Вашей БД и возвращать в скрипт ответ стороннего сервера(например html или json) - вы этот ответ будете парсить, запихивать к себе в базу а уже потом как-то обрабатывать данные в своей БД - классифицировать, чистить и т.п. |
|
|
James Raynor
|
Сообщение
#6
|
|
А сколько такой скрипт может стоить? А-то может убедить шефа заказать его.
|
|
|
Arks |
1.6.2012, 8:32;
Ответить: Arks
Сообщение
#7
|
|
|
|
|
James Raynor
|
Сообщение
#8
|
|
|
Интересно, сколько написание займет времени.
|
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
✅ Dolphin - умная автоматизация вашей рекламы Facebook | 54 | Dolphin_Support | 19113 | 27.2.2024, 18:01 автор: Dolphin_Support |
|
Автоматизация работы в браузере (BAS) | 11 | Moonsoon | 7328 | 11.4.2023, 6:23 автор: Skyworker |
|
Сбор баз, парсинг информации, постинг, автоматизация Качественно и в срок |
21 | SEOMR | 20709 | 22.7.2022, 15:10 автор: iodjin |
|
ZennoPoster-услуги по написанию ботов, автоматизация работы в браузере. Сбор любых баз. ZennoPoster-услуги по написанию шаблонов |
0 | Progernaut | 1166 | 13.11.2020, 20:20 автор: Progernaut |
|
Teoseo - Парсинг, Наполнение, Автоматизация | 8 | teoseo | 1848 | 22.8.2020, 10:14 автор: teoseo |
Текстовая версия | Сейчас: 19.3.2024, 12:59 |