X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> Гугл усложняет жизнь сателлитчикам
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:16; Ответить: Aetos
Сообщение #1


Сегодня увидел, на мой взгляд, важную новость:
Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.

В настоящее время, школьные и правительственные документы выкладываются во Всемирную паутину в основном именно в PDF-формате. До настоящего времени Google не мог распознать текст и воспринимал содержимое как картинку. И вот, у Интернет гиганта появилась новейшая технология оптического распознавания символов (Optical Character Recognition). Векторная информация изображения преобразовывается поисковым алгоритмом в слова, которые в свою очередь легко поддаются индексированию.

«Теперь результаты поиска будут значительно шире и точнее», радуются в Google. Что касается пользователя, то у него появится возможность находить гораздо больше нужной информации.

Насколько я знаю, сканированный контент довольно часто используется для сателлитов (да и не только). Если сказанное в статье правда, это может существенным образом усложнить жизнь многим вебмастерам.

Источник: http://eterra.info/news/260


--------------------
-2
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
gangstar90
gangstar90
сообщение 19.8.2010, 19:20; Ответить: gangstar90
Сообщение #2


я и раньше думал что pdf индексируется smile.gif

Сообщение отредактировал gangstar90 - 19.8.2010, 19:21


--------------------
Стабильный доход для сайтов ipad тематики!
Писать в лс для рассмотрения Вашего ресурса


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:24; Ответить: Aetos
Сообщение #3


Да тут толком и непонятно-то, идет ли речь только о PDF, либо о любом сканированном тексте. Если действительно "текст изображения распознается самостоятельно самой поисковой системой", то дела обстоят гораздо серьезнее.
Чесно говоря, у меня у самого много контента - скан книг по теме сайта. Если Гугл всерьез взялся за эту технологию, стало быть, такие тексты для него перестанут быть уникальными.

Сообщение отредактировал Aetos - 19.8.2010, 19:24


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
bitrixoid
bitrixoid
сообщение 19.8.2010, 19:24; Ответить: bitrixoid
Сообщение #4


OCR для индексации гугл начал использовать еще в 2008 году.

Aetos, а что вам боятся то гугла? там неуник сидит плохо чтоли? прекрасно сидит.


--------------------
клоновод


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:28; Ответить: Aetos
Сообщение #5


(bitrixoid @ 19.8.2010, 18:24) *
Aetos, а что вам боятся то гугла? там неуник сидит плохо чтоли? прекрасно сидит.

Да я как-то всегда испытывал опасения по поводу уникальности текстов у себя на сайтах. Даже зачастую специально занимался распознаванием книг в djvu, вместо того, чтобы выложить на сайт тематическую книгу, которая в интете имеется в Word'e или PDF'e. А тут почитал - выходит, вся моя работа на смарку... biggrin.gif
Нет, я конечно, не думаю, что это "смертельно", но все же меня это не радует.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
berd
berd
сообщение 19.8.2010, 19:31; Ответить: berd
Сообщение #6


Это никак не повлияет на саттелитчиков, да контент не будет уникальный и что? Вообще не вижу проблем.


--------------------
Протеин 150грн\кг, доставка по Украине.


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
disiyndel
disiyndel
сообщение 19.8.2010, 19:34; Ответить: disiyndel
Сообщение #7


Скан бывает и из оффлайновых источников, которые в инет не попадают.
Все будет ок.


--------------------
http://heisenbrog.com - только цифры, факты и эксперименты.


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:35; Ответить: Aetos
Сообщение #8


(berd @ 19.8.2010, 18:31) *
да контент не будет уникальный и что?

Как вариант - всевозможные фильтры, вылет страниц из основного индекса в дополнительный, падение посещаемости, снижение заработка на контекстной рекламе и партнерках. (Ну это в том случае, если речь идет не о сателлитах, сделанных исключительно под Сапу).
(disiyndel @ 19.8.2010, 18:34) *
Скан бывает и из оффлайновых источников, которые в инет не попадают.
Я просто как человек довольно ленивый никогда не сканирую оффлайн-источники; всегда качаю готовый скан из интернета. При этом до сих пор не могу подружить большинство своих сайтов с Гуглом.

Сообщение отредактировал Aetos - 19.8.2010, 19:37


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
install
install
сообщение 19.8.2010, 19:38; Ответить: install
Сообщение #9


(berd @ 19.8.2010, 21:31) *
Вообще не вижу проблем.

Тоже не вижу в этом проблемы, есть сайты с копипастом 100% и нормально все индексирует. Сателлиты не просятся в топ 10, им главное индексация.
это вот у придурковатого яндекса были бы проблемы.


--------------------


Поблагодарили: (1)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aetos
Aetos
Topic Starter сообщение 19.8.2010, 19:40; Ответить: Aetos
Сообщение #10


ОК. Вижу народ отнесся к новости спокойно - тогда и я пока не буду впадать в панику. biggrin.gif


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Agent Accounts Google, TikTok, Bing, Facebook, VK, Yandex.Direct with balances(Агентские аккаунты Гугл,Фейсбук,ВКонтакте,Директ)
Не платите НДС 20% + Постоплата (Возврат до 50% бюджета)
0 ipnesterov 2280 21.4.2020, 15:54
автор: ipnesterov
Открытая тема (нет новых ответов) Ищу волшебника Гугл-таблиц
2 Bel_Ami 2051 6.12.2019, 19:36
автор: REGNET
Открытая тема (нет новых ответов) Куплю гугл отзывы на карте google
Желательно люди с Украины и хотя бы базовым уровнем
2 jorjo22 3163 13.7.2019, 23:23
автор: aleks19
Открытая тема (нет новых ответов) Настройка и ведение ваших компаний по контекстной рекламе Яндекс Директ и Гугл Эдвордс
23 AvramLincoln 10350 5.2.2019, 13:36
автор: AvramLincoln
Открытая тема (нет новых ответов) Оптимизирую Скорость Загрузки Вашего Сайта и Увеличу количество баллов в Гугл Пейдж Спид
0 procsi 3480 18.12.2017, 17:40
автор: procsi


 



RSS Текстовая версия Сейчас: 18.4.2024, 22:23
Дизайн