X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> Исправление опечаток, [типа сервис]
devuser
devuser
Topic Starter сообщение 9.1.2015, 18:22; Ответить: devuser
Сообщение #1


Все будет тип-топ
*****

Группа: Active User
Сообщений: 713
Регистрация: 5.12.2012
Из: Online
Поблагодарили: 342 раза
Репутация:   52  


Всем привет

Работали над одним проектом, параллельно получился сервис по исправлению опечаток.
Веб-морда доступна по этому адресу

Что умеет и зачем это нужно:

Умеет исправлять опечатки в словах (возможно не во всех случаях, но в большинстве своем). Ввели "амартизатар" - получили в ответе "амортизатор". И так далее.

Нужно тем желающим, которые хотят улучшить поиск на своем портале/блоге/магазине и так далее. Прогнали поисковый запрос через сервис, получили варианты, улучшили качество поиска. Пользователи у нас, к сожалению, не все грамотные.

Работает по словарю, вычисляя расстояние Левенштейна и используя прочие фишки. В словаре более 4,5 млн правильных слов.

На веб-морде можно вводить несколько слов, через запятую, для проверки. Но чем больше слов, тем больше задержка. Работает долго отчасти потому, что сервер слабоват.

Также, по этому адресу доступен API-интерфейс. Обращаться POSTом.

Пример обращения под спойлером
Развернуть/Свернуть
CODE
<?php
$url = "http://typo.colorito.in.ua/api.php";
$post = array();
$post['key'] = 'demo';
$post['first-letter'] = 1;
$post['secong-letter'] = 1;
$post['words'] = serialize(array('паравоз', 'белченок', 'мома'));

$ch = curl_init($url);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post);

$result = curl_exec($ch);

curl_close($ch);

header ("Content-Type:text/xml");
header("Cache-Control: no-cache");
header("Pragma: no-cache");

echo $result;
?>


Пример (результат выполнения) доступен по этому адресу.
Можете попробовать сами, используя key=demo (как представлено в коде выше), но у демо-пользователя через API слова всегда одни и те же.

Кто хочет поиграть - велком в личку за ключами. На данный момент это абсолютно бесплатно.
Кто хочет такой себе, и не хочет зависеть от моего сервиса - могу продать, долларов за 70

Если есть вопросы - задавайте, отвечу.

Сообщение отредактировал devuser - 9.1.2015, 18:29


--------------------
1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Sanasol
Sanasol
сообщение 9.1.2015, 22:22; Ответить: Sanasol
Сообщение #2


Участник
***

Группа: User
Сообщений: 111
Регистрация: 9.7.2013
Из: Санкт-Петербург
Поблагодарили: 47 раз
Репутация:   6  


Все ваши примеры это ошибки, а не опечатки.

Вот это очепятка
А это ашибка

Тем не менее сервис очепятка смог исправить, а ошибка нет


Долгий отклик это плохо. А он очень долгий по нынешним меркам.

+ нужно исправлять словосочетания, а не отдельные слова

Там же стоит галочка первая буква правильная, только сейчас дошло. Странная галочка :)))

Сообщение отредактировал Sanasol - 9.1.2015, 21:58


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
devuser
devuser
Topic Starter сообщение 9.1.2015, 22:28; Ответить: devuser
Сообщение #3


Все будет тип-топ
*****

Группа: Active User
Сообщений: 713
Регистрация: 5.12.2012
Из: Online
Поблагодарили: 342 раза
Репутация:   52  


Цитата(Sanasol @ 9.1.2015, 20:22) *
Там же стоит галочка первая буква правильная, только сейчас дошло. Странная галочка ))


Она увеличивает длительность отклика в разы. Поэтому в демке она принудительная.
Ну и по статистике поиска с посещаемого инет-магазина (1000 уников в сутки) процент пользователей, которые не знают первой буквы крайне мал.

По поводу словосочетаний тоже спорный вопрос. Я никогда, например, не ищу точное вхождение. Точнее сначала "точное", потом обрезка по Стеммеру до корней слова. Тоже повышает точность поиска, но это в следующей серии :)


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Sanasol
Sanasol
сообщение 9.1.2015, 22:55; Ответить: Sanasol
Сообщение #4


Участник
***

Группа: User
Сообщений: 111
Регистрация: 9.7.2013
Из: Санкт-Петербург
Поблагодарили: 47 раз
Репутация:   6  


devuser, просто статью в блоге или на статейнике трудно найти по одному слову например, а если ищут словосочетание, то ваш сервис бесполезен получается. Можно конечно извратом заняться и разбить на слова чтобы по отдельности пробить каждое, но это увеличит время отклика опять же.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) (Требуется) Исправление ДЛЕ шаблонов
0 Tootkin 458 17.7.2017, 12:33
автор: Tootkin
Открытая тема (нет новых ответов) Нужно редактирование шаблона WP, исправление верстки и микроразметки
бюджет 10 долларов
3 devvver 711 1.3.2017, 16:54
автор: ZaDrotom
Открытая тема (нет новых ответов) Исправление косяков верстки на Joomla
0 Kirusha 768 26.1.2011, 23:11
автор: Kirusha


 



RSS Текстовая версия Сейчас: 15.12.2017, 3:11
Дизайн