X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Новая система исправления ошибок от Nigma.ru
Tatsin
Tatsin
Topic Starter сообщение 16.7.2007, 15:36; Ответить: Tatsin
Сообщение #1


http://www.nigma.ru/index.php?action=click...nu_element=news

Разработчики интеллектуальной поисковой системы Nigma.ru представляют на суд пользователя новую версию своей системы исправления ошибок в запросах. Теперь посетителям Nigma.ru нужно очень сильно постараться, чтобы сделать неграмотный запрос. И вот почему.

Система исправления ошибок Nigma.ru исправляет грубые ошибки, опечатки, предлагая пользователю на выбор не один, а несколько вариантов исправлений. Корректируются ошибки, связанные с неправильным выбором раскладки клавиатуры (включая комбинации с другими ошибками). Словарь интеллектуальной поисковой системы расширен названиями известных брендов, набирать которые в строке запроса пользователь может даже на русском языке, так как Нигма автоматически расширяет поиск альтернативным написанием бренда. Разработчики Nigma.ru провели исследование, по результатам которого составили таблицу сравнения систем исправления ошибок (см.таблицу). Результаты говорят сами за себя. К тому же, обнаружились интересные особенности поисковиков. К примеру, в одном из тестируемых поисковиков по запросу, введенному на русском языке с ошибкой в написании, предлагается исправить запрос, в другом – ошибка в написании не исправляется, но, если бренд написан правильно, поиск ведется по обоим вариантам его написания. Нигма же делает и то, и другое.

Виктор Лавренко, руководитель группы разработчиков Nigma.ru: «Не так давно мы дали возможность пользователям Nigma.ru писать жалобы на неверную работу нашей поисковой системы - для того, чтобы эффективнее оптимизировать алгоритмы поиска и кластеризации. Внимательно анализируя письма пользователей, мы обнаружили, что очень часто они не находят нужной информации не из-за неправильно написанных алгоритмов, а из-за того, что просто неграмотно составляют запрос, или допускают орфографические ошибки и опечатки. Поэтому мы сконцентрировались на том, чтобы создать такую систему исправления ошибок, которая сможет исправлять и опечатки, и грубые орфографические ошибки. Мы постарались сделать так, чтобы эта система исправляла ошибки эффективнее. То есть, пользователям теперь вообще не нужно правильно оформлять запрос – мы предлагаем им все возможные орфографически правильные варианты и с помощью кластеров пытаемся угадать, что же они все-таки ищут. Тем не менее, наша система жалоб по-прежнему работает – мы разбираем каждую из них, поэтому если какой-то запрос не был исправлен – пожалуйста, пишите нам, исправим!»





Алгоритм исправления ошибок составлен следующим образом:

· исправляется до 4 грубых ошибок, включая опечатки (например, "эзпорвленейэ"=>"исправление");

· пользователю на выбор предлагается не один, а несколько вариантов исправления ошибки; также приводится неисправленный вариант, чтобы пользователь из списка слов мог выбрать те, которые, по его мнению, необходимо исправить;

· исправляются перестановочные опечатки (например, "слвоо"=>"слово", "апра"=>"пара" "пеертсаноква"=>"перестановка");

· исправления сортируются по звучанию – чем ближе звучание к исправляемому слову, тем выше расположен вариант исправления (например, для запроса "ашипка" предлагаются исправления в таком порядке: ошибка, шапка, шибко, шпика и т.п.);

· если между двумя словами пропущен пробел, предлагается исправление с вставкой пробела; при этом, если в одном из слов допущена грубая ошибка, она тоже исправляется, а также если по звучанию слова не совпадают с их написанием, например, "ЮрейЛушкоф"=>"Юрий Лужков";

· исправляются ошибки, допущенные по причине выбора другой раскладки клавиатуры (к примеру, "yfqnb"=>"найти" или "ьщишду"=>"mobile");

· также исправляются ошибки, связанные с неверным выбором раскладки клавиатуры в комбинации с другими ошибками (например, "fibgrf"=>"ашипка"=>"ошибка"); при этом, если возникает необходимость исправления ошибок со сменой раскладки, то предлагается и вариант с чистым преобразованием раскладки (например, "fibgrf"=>"ашипка");

· словарь расширен компьютерными терминами (к примеру, вместо исправления "сокит"=>"соки" первым вариантом предлагается исправление "сокит"=>"сокет");

· словарь дополнен названиями известных брендов (например, "SonyErikson"=>"Sony Ericsson");

При этом адреса страниц, адреса электронной почты и пути не исправляются; слова, написанные в верхнем регистре, считаются аббревиатурами и также не исправляются.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
jED
jED
сообщение 16.7.2007, 16:11; Ответить: jED
Сообщение #2


Вот уже и косячок найден :)
http://www.nigma.ru/index.php?q=%EC%E5%F2%...n=0&5=1&6=1&7=1
Словарик маленький?

Да даже если и попроще
http://www.nigma.ru/index.php?q=%EC%E5%F2%...n=0&5=1&6=1&7=1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Tatsin
Tatsin
Topic Starter сообщение 16.7.2007, 16:24; Ответить: Tatsin
Сообщение #3


Ну это потому, что это форма от глагола "метать":)
А насчет "металопластиковые" - спасибо за замечание, исправим!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
jED
jED
сообщение 16.7.2007, 16:44; Ответить: jED
Сообщение #4


Цитата(Tatsin)
Ну это потому, что это форма от глагола "метать":)

Да я про глагол учёл, но ведь во-первых более вероятно что в данном случае это не глагол (вообще набирают ли юзеры глаголы кроме случаев транзакционных запросов? сомнительно что набирают) и по вашему же серпу видно что в основном это металл-существительное, а не глагол, а во-вторых, в любом случае должны быть варианты исправлений, ибо есть варианты, имхо.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
zasar
zasar
сообщение 31.8.2008, 22:22; Ответить: zasar
Сообщение #5


а вот для нигмы это супер что такое сделали!!!
этим поисковиком я пользуюсь чаще всего.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
seena seena
seena seena
сообщение 14.4.2010, 9:51; Ответить: seena seena
Сообщение #6


Hi,

Thanks for all solutions you guys have provided. The sad thing is I still can't get it to work and I have no hair left on my head. ;D. I've done everything that everyone has suggested me too. :D

- I did the Registry User permission thing. It didn't help. (didn't find the sub nodes (whatever that is) that someone mentioned, maybe I have to check that again).

- I tried the GAX (but that one fail on execution).

- I've searched for the "Microsoft.VisualStudio.TemplateWizardInterface" but as i run vista i found some similar lines and commented them out in "VCExpress.exe.config" as suggested instead of "devenv.exe.config". But that didn't help.

- I've reinstalled. No change.

- Run as Administrator. Fail.

- I've change the project location folder and gave it a unique names. Didn't work.

I think i did something else, but can't remember what it was, but as there are no more solutions out there and there are nothing on Microsoft site for this that helps. I must ask you guys.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Сделаю аудит сайта на максималках. Разбор ошибок и конкурентов. Запишу видео.
Ручной анализ, нахожу ошибки, которые многие не видят
4 bigboy 2213 28.11.2022, 12:10
автор: bigboy
Открытая тема (нет новых ответов) Продам скрипт rtb exchange suite - система перепродажи трафика dsp/ssp в реальном времени.
4 buypushplatform 4169 12.10.2021, 15:29
автор: ULUD
Открытая тема (нет новых ответов) Партнерская система Buylink.pro
1 mvchansas 1040 14.7.2021, 10:11
автор: mvchansas
Открытая тема (нет новых ответов) Futcoin.net - новая ниша в партнерках по онлайн-играм с щедрой комиссией и ребиллами
4 Futcoin 1693 16.6.2021, 10:45
автор: Futcoin
Открытая тема (нет новых ответов) RXbux - новая европейская фарма партнёрка. До 45% комиссии!
9 RXbux 3336 18.3.2021, 14:59
автор: RXbux


 



RSS Текстовая версия Сейчас: 20.4.2024, 12:28
Дизайн