X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Гугл усложняет жизнь сателлитчикам
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:16; Ответить: Aetos
Сообщение #1


Бывалый
****

Группа: User
Сообщений: 274
Регистрация: 31.3.2008
Из: Украина, Харьков
Поблагодарили: 110 раз
Репутация:   25  


Сегодня увидел, на мой взгляд, важную новость:
Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.

В настоящее время, школьные и правительственные документы выкладываются во Всемирную паутину в основном именно в PDF-формате. До настоящего времени Google не мог распознать текст и воспринимал содержимое как картинку. И вот, у Интернет гиганта появилась новейшая технология оптического распознавания символов (Optical Character Recognition). Векторная информация изображения преобразовывается поисковым алгоритмом в слова, которые в свою очередь легко поддаются индексированию.

«Теперь результаты поиска будут значительно шире и точнее», радуются в Google. Что касается пользователя, то у него появится возможность находить гораздо больше нужной информации.

Насколько я знаю, сканированный контент довольно часто используется для сателлитов (да и не только). Если сказанное в статье правда, это может существенным образом усложнить жизнь многим вебмастерам.

Источник: http://eterra.info/news/260


--------------------
-2
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
gangstar90
gangstar90
сообщение 19.8.2010, 19:20; Ответить: gangstar90
Сообщение #2


Doors not dead
******

Группа: Active User
Сообщений: 1080
Регистрация: 2.2.2009
Из: Котелок с 1000 летним стажем
Поблагодарили: 293 раза
Репутация:   44  


я и раньше думал что pdf индексируется smile.gif

Сообщение отредактировал gangstar90 - 19.8.2010, 19:21


--------------------
Стабильный доход для сайтов ipad тематики!
Писать в лс для рассмотрения Вашего ресурса


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:24; Ответить: Aetos
Сообщение #3


Бывалый
****

Группа: User
Сообщений: 274
Регистрация: 31.3.2008
Из: Украина, Харьков
Поблагодарили: 110 раз
Репутация:   25  


Да тут толком и непонятно-то, идет ли речь только о PDF, либо о любом сканированном тексте. Если действительно "текст изображения распознается самостоятельно самой поисковой системой", то дела обстоят гораздо серьезнее.
Чесно говоря, у меня у самого много контента - скан книг по теме сайта. Если Гугл всерьез взялся за эту технологию, стало быть, такие тексты для него перестанут быть уникальными.

Сообщение отредактировал Aetos - 19.8.2010, 19:24


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
bitrixoid
bitrixoid
сообщение 19.8.2010, 19:24; Ответить: bitrixoid
Сообщение #4


клоновод
******

Группа: Banned
Сообщений: 1951
Регистрация: 27.4.2009
Поблагодарили: 1118 раз
Репутация:   166  


OCR для индексации гугл начал использовать еще в 2008 году.

Aetos, а что вам боятся то гугла? там неуник сидит плохо чтоли? прекрасно сидит.


--------------------
клоновод


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:28; Ответить: Aetos
Сообщение #5


Бывалый
****

Группа: User
Сообщений: 274
Регистрация: 31.3.2008
Из: Украина, Харьков
Поблагодарили: 110 раз
Репутация:   25  


(bitrixoid @ 19.8.2010, 18:24) *
Aetos, а что вам боятся то гугла? там неуник сидит плохо чтоли? прекрасно сидит.

Да я как-то всегда испытывал опасения по поводу уникальности текстов у себя на сайтах. Даже зачастую специально занимался распознаванием книг в djvu, вместо того, чтобы выложить на сайт тематическую книгу, которая в интете имеется в Word'e или PDF'e. А тут почитал - выходит, вся моя работа на смарку... biggrin.gif
Нет, я конечно, не думаю, что это "смертельно", но все же меня это не радует.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
berd
berd
сообщение 19.8.2010, 19:31; Ответить: berd
Сообщение #6


Завсегдатай
*****

Группа: Active User
Сообщений: 584
Регистрация: 11.2.2009
Поблагодарили: 113 раз
Репутация:   15  


Это никак не повлияет на саттелитчиков, да контент не будет уникальный и что? Вообще не вижу проблем.


--------------------
Протеин 150грн\кг, доставка по Украине.


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
disiyndel
disiyndel
сообщение 19.8.2010, 19:34; Ответить: disiyndel
Сообщение #7


Завсегдатай
*****

Группа: Active User
Сообщений: 762
Регистрация: 27.10.2009
Из: отборных зерен.
Поблагодарили: 219 раз
Репутация:   29  


Скан бывает и из оффлайновых источников, которые в инет не попадают.
Все будет ок.


--------------------
http://heisenbrog.com - только цифры, факты и эксперименты.


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:35; Ответить: Aetos
Сообщение #8


Бывалый
****

Группа: User
Сообщений: 274
Регистрация: 31.3.2008
Из: Украина, Харьков
Поблагодарили: 110 раз
Репутация:   25  


(berd @ 19.8.2010, 18:31) *
да контент не будет уникальный и что?

Как вариант - всевозможные фильтры, вылет страниц из основного индекса в дополнительный, падение посещаемости, снижение заработка на контекстной рекламе и партнерках. (Ну это в том случае, если речь идет не о сателлитах, сделанных исключительно под Сапу).
(disiyndel @ 19.8.2010, 18:34) *
Скан бывает и из оффлайновых источников, которые в инет не попадают.
Я просто как человек довольно ленивый никогда не сканирую оффлайн-источники; всегда качаю готовый скан из интернета. При этом до сих пор не могу подружить большинство своих сайтов с Гуглом.

Сообщение отредактировал Aetos - 19.8.2010, 19:37


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
install
install
сообщение 19.8.2010, 19:38; Ответить: install
Сообщение #9


Яндекс ЛОХ
*******


Группа: Active User
Сообщений: 3530
Регистрация: 28.5.2009
Из: Нижневартовска
Поблагодарили: 1376 раз
Репутация:   201  


(berd @ 19.8.2010, 21:31) *
Вообще не вижу проблем.

Тоже не вижу в этом проблемы, есть сайты с копипастом 100% и нормально все индексирует. Сателлиты не просятся в топ 10, им главное индексация.
это вот у придурковатого яндекса были бы проблемы.


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:40; Ответить: Aetos
Сообщение #10


Бывалый
****

Группа: User
Сообщений: 274
Регистрация: 31.3.2008
Из: Украина, Харьков
Поблагодарили: 110 раз
Репутация:   25  


ОК. Вижу народ отнесся к новости спокойно - тогда и я пока не буду впадать в панику. biggrin.gif


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Как действительно успешно внедрять привычки. И менять жизнь
seoandme.ru - SEO-блог Анны Ященко
14 AnnaYa 1450 15.12.2017, 8:49
автор: kaverima80
Горячая тема (нет новых ответов) Гугл жёстко игнорит новый домен
Гугл не индексирует домен
54 nahalturu 7064 14.12.2017, 0:22
автор: Ley
Открытая тема (нет новых ответов) Увеличение посещаемости сайта (яндекс, гугл, соц сети) - реальные люди
16 SANR 1467 13.12.2017, 13:03
автор: kukla
Открытая тема (нет новых ответов) Настройка и ведение ваших кампаний по контекстной рекламе Яндекс Директ и Гугл Эдвордс
2 AvramLincoln 505 11.12.2017, 13:18
автор: AvramLincoln
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыПочему гугл не любит кулинарный сайт?
22 aleggator 2832 10.11.2017, 14:09
автор: Emtec


 



RSS Текстовая версия Сейчас: 18.12.2017, 3:55
Дизайн