X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> Новая система исправления ошибок от Nigma.ru
Tatsin
Tatsin
Topic Starter сообщение 16.7.2007, 15:36; Ответить: Tatsin
Сообщение #1


Новичок
*

Группа: Viewer
Сообщений: 2
Регистрация: 16.7.2007
Поблагодарили: 0 раз
Репутация:   0  


http://www.nigma.ru/index.php?action=click...nu_element=news

Разработчики интеллектуальной поисковой системы Nigma.ru представляют на суд пользователя новую версию своей системы исправления ошибок в запросах. Теперь посетителям Nigma.ru нужно очень сильно постараться, чтобы сделать неграмотный запрос. И вот почему.

Система исправления ошибок Nigma.ru исправляет грубые ошибки, опечатки, предлагая пользователю на выбор не один, а несколько вариантов исправлений. Корректируются ошибки, связанные с неправильным выбором раскладки клавиатуры (включая комбинации с другими ошибками). Словарь интеллектуальной поисковой системы расширен названиями известных брендов, набирать которые в строке запроса пользователь может даже на русском языке, так как Нигма автоматически расширяет поиск альтернативным написанием бренда. Разработчики Nigma.ru провели исследование, по результатам которого составили таблицу сравнения систем исправления ошибок (см.таблицу). Результаты говорят сами за себя. К тому же, обнаружились интересные особенности поисковиков. К примеру, в одном из тестируемых поисковиков по запросу, введенному на русском языке с ошибкой в написании, предлагается исправить запрос, в другом – ошибка в написании не исправляется, но, если бренд написан правильно, поиск ведется по обоим вариантам его написания. Нигма же делает и то, и другое.

Виктор Лавренко, руководитель группы разработчиков Nigma.ru: «Не так давно мы дали возможность пользователям Nigma.ru писать жалобы на неверную работу нашей поисковой системы - для того, чтобы эффективнее оптимизировать алгоритмы поиска и кластеризации. Внимательно анализируя письма пользователей, мы обнаружили, что очень часто они не находят нужной информации не из-за неправильно написанных алгоритмов, а из-за того, что просто неграмотно составляют запрос, или допускают орфографические ошибки и опечатки. Поэтому мы сконцентрировались на том, чтобы создать такую систему исправления ошибок, которая сможет исправлять и опечатки, и грубые орфографические ошибки. Мы постарались сделать так, чтобы эта система исправляла ошибки эффективнее. То есть, пользователям теперь вообще не нужно правильно оформлять запрос – мы предлагаем им все возможные орфографически правильные варианты и с помощью кластеров пытаемся угадать, что же они все-таки ищут. Тем не менее, наша система жалоб по-прежнему работает – мы разбираем каждую из них, поэтому если какой-то запрос не был исправлен – пожалуйста, пишите нам, исправим!»





Алгоритм исправления ошибок составлен следующим образом:

· исправляется до 4 грубых ошибок, включая опечатки (например, "эзпорвленейэ"=>"исправление");

· пользователю на выбор предлагается не один, а несколько вариантов исправления ошибки; также приводится неисправленный вариант, чтобы пользователь из списка слов мог выбрать те, которые, по его мнению, необходимо исправить;

· исправляются перестановочные опечатки (например, "слвоо"=>"слово", "апра"=>"пара" "пеертсаноква"=>"перестановка");

· исправления сортируются по звучанию – чем ближе звучание к исправляемому слову, тем выше расположен вариант исправления (например, для запроса "ашипка" предлагаются исправления в таком порядке: ошибка, шапка, шибко, шпика и т.п.);

· если между двумя словами пропущен пробел, предлагается исправление с вставкой пробела; при этом, если в одном из слов допущена грубая ошибка, она тоже исправляется, а также если по звучанию слова не совпадают с их написанием, например, "ЮрейЛушкоф"=>"Юрий Лужков";

· исправляются ошибки, допущенные по причине выбора другой раскладки клавиатуры (к примеру, "yfqnb"=>"найти" или "ьщишду"=>"mobile");

· также исправляются ошибки, связанные с неверным выбором раскладки клавиатуры в комбинации с другими ошибками (например, "fibgrf"=>"ашипка"=>"ошибка"); при этом, если возникает необходимость исправления ошибок со сменой раскладки, то предлагается и вариант с чистым преобразованием раскладки (например, "fibgrf"=>"ашипка");

· словарь расширен компьютерными терминами (к примеру, вместо исправления "сокит"=>"соки" первым вариантом предлагается исправление "сокит"=>"сокет");

· словарь дополнен названиями известных брендов (например, "SonyErikson"=>"Sony Ericsson");

При этом адреса страниц, адреса электронной почты и пути не исправляются; слова, написанные в верхнем регистре, считаются аббревиатурами и также не исправляются.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
jED
jED
сообщение 16.7.2007, 16:11; Ответить: jED
Сообщение #2


Бывалый
****

Группа: User
Сообщений: 348
Регистрация: 5.11.2006
Поблагодарили: 0 раз
Репутация:   0  


Вот уже и косячок найден :)
http://www.nigma.ru/index.php?q=%EC%E5%F2%...n=0&5=1&6=1&7=1
Словарик маленький?

Да даже если и попроще
http://www.nigma.ru/index.php?q=%EC%E5%F2%...n=0&5=1&6=1&7=1


--------------------
Помогу рефералам с повышение доходности сайтов: юзабилити + веб-аналитика + seo. Стучите в личку.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Tatsin
Tatsin
Topic Starter сообщение 16.7.2007, 16:24; Ответить: Tatsin
Сообщение #3


Новичок
*

Группа: Viewer
Сообщений: 2
Регистрация: 16.7.2007
Поблагодарили: 0 раз
Репутация:   0  


Ну это потому, что это форма от глагола "метать":)
А насчет "металопластиковые" - спасибо за замечание, исправим!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
jED
jED
сообщение 16.7.2007, 16:44; Ответить: jED
Сообщение #4


Бывалый
****

Группа: User
Сообщений: 348
Регистрация: 5.11.2006
Поблагодарили: 0 раз
Репутация:   0  


Цитата(Tatsin)
Ну это потому, что это форма от глагола "метать":)

Да я про глагол учёл, но ведь во-первых более вероятно что в данном случае это не глагол (вообще набирают ли юзеры глаголы кроме случаев транзакционных запросов? сомнительно что набирают) и по вашему же серпу видно что в основном это металл-существительное, а не глагол, а во-вторых, в любом случае должны быть варианты исправлений, ибо есть варианты, имхо.


--------------------
Помогу рефералам с повышение доходности сайтов: юзабилити + веб-аналитика + seo. Стучите в личку.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
zasar
zasar
сообщение 31.8.2008, 22:22; Ответить: zasar
Сообщение #5


Новичок
*

Группа: Viewer
Сообщений: 4
Регистрация: 26.8.2008
Поблагодарили: 0 раз
Репутация:   0  


а вот для нигмы это супер что такое сделали!!!
этим поисковиком я пользуюсь чаще всего.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seena seena
seena seena
сообщение 14.4.2010, 9:51; Ответить: seena seena
Сообщение #6


Новичок
*

Группа: Viewer
Сообщений: 1
Регистрация: 14.4.2010
Поблагодарили: 0 раз
Репутация:   0  


Hi,

Thanks for all solutions you guys have provided. The sad thing is I still can't get it to work and I have no hair left on my head. ;D. I've done everything that everyone has suggested me too. :D

- I did the Registry User permission thing. It didn't help. (didn't find the sub nodes (whatever that is) that someone mentioned, maybe I have to check that again).

- I tried the GAX (but that one fail on execution).

- I've searched for the "Microsoft.VisualStudio.TemplateWizardInterface" but as i run vista i found some similar lines and commented them out in "VCExpress.exe.config" as suggested instead of "devenv.exe.config". But that didn't help.

- I've reinstalled. No change.

- Run as Administrator. Fail.

- I've change the project location folder and gave it a unique names. Didn't work.

I think i did something else, but can't remember what it was, but as there are no more solutions out there and there are nothing on Microsoft site for this that helps. I must ask you guys.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Комплексный (SEO) аудит сайтов, нахождение и устранение всех ошибок сайта. Вывод в ТОП
29 Taylor 9936 8.12.2017, 13:40
автор: kukla
Горячая тема (нет новых ответов) ZennoPoster MP - новая эра в SEO автоматизации! Зарабатывай более $1000 не напрягаясь!
192 nuaru_ 94636 4.12.2017, 17:11
автор: nuaru_
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыShopsHunter – новая платформа для монетизации целевого трафика
0 Majevsky 456 1.12.2017, 16:26
автор: Majevsky
Открытая тема (нет новых ответов) В выдаче Google появилась новая поисковая функция
0 MissContent 1442 1.12.2017, 10:44
автор: MissContent
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыПоисковая система SEZNAM.CZ
SEO оптимизация в Чехии. Кто что посоветует, как работает поисковик?
13 DocTor 2736 25.11.2017, 20:17
автор: Alexandr_js


 



RSS Текстовая версия Сейчас: 12.12.2017, 1:23
Дизайн