Помощник
|
Уникальность текстов после уникализации |
Marina_M |
13.10.2010, 23:23;
Ответить: Marina_M
Сообщение
#12
|
|
скачала Advego Plagiatus, там есть "глубокая проверка", интересно - какой шингл она подразумевает?
-------------------- |
|
|
KipiaSoft |
14.10.2010, 6:07;
Ответить: KipiaSoft
Сообщение
#13
|
|
Нескажите... Адвего показывает 100% Миратулз 95%. В результате некоторые оптимизаторы отправляют "на доработку"... Мне значит такие просто не попадались -------------------- |
|
|
Globaldota |
14.10.2010, 6:18;
Ответить: Globaldota
Сообщение
#14
|
|
|
Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте! Очевидно, что так можно определять процент перекрытия текстов, выявлять все его источники и т.п. Этот изящный алгоритм воплотил давнюю мечту доцентов: отныне мучительный вопрос «у кого студент списывал этот курсовик» можно считать решенным! Легко оценить долю плагиата в любой статье http://www.dialog-21.ru/trends/?id=15539&f=1 Сообщение отредактировал Globaldota - 14.10.2010, 6:18 |
|
|
||
SeoKar |
14.10.2010, 7:04;
Ответить: SeoKar
Сообщение
#15
|
|
|
скачала Advego Plagiatus, там есть "глубокая проверка", интересно - какой шингл она подразумевает? там вроде при глубокой проверке просто проверяется больше частей текста на предмет совпадений, а шингл задается в настройках, в версии 1.1.0.49 примерно 6-7 но лучше пользоваться Адвего То есть, к примеру, яндекс съест, скажем, на 95% текст уникальный с шинглом 6, а уникальный на 50-60% текст с шинглом 6 пожует и выплюнет? P.S. а для google не подскажите? Он вроде суровее относится к дублям...
|
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Исчезающие фрилансеры после предоплаты. Зачем? Какой смысл? | 35 | metvekot | 9273 | 19.3.2024, 20:19 автор: MisterBit |
|
Состояние после ампутации - нужна помощь благотворительный топик |
46 | vitvirtual | 5561 | 12.3.2024, 21:52 автор: Гиппопотам |
|
Нужен исполнитель на постоянную основу для набора небольших текстов | 19 | Думающий | 8800 | 9.2.2024, 16:04 автор: Думающий |
|
Размножение текстов Чмтабельность, уникальность 90-95% |
83 | volk3d | 105070 | 23.6.2023, 11:58 автор: volk3d |
|
Подписка на сервис ИИ генерации текстов | 16 | malamut | 3692 | 16.11.2022, 14:48 автор: malamut |
Текстовая версия | Сейчас: 29.3.2024, 14:18 |