X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> BERT – крупнейшее обновление Google. Как оптимизировать ваш сайт под BERT.
DrMax
DrMax
Topic Starter сообщение 18.1.2020, 11:37; Ответить: DrMax
Сообщение #1


BERT - это нейросеть, созданная Google в 2018 году и уже доказавшая преимущества в ряде практических задач. Используя её можно решать целый ряд задач: анализировать текст, отвечать на вопросы, создавать переводчики, выявлять спам, создавать системы предиктивного ввода текста и т.д. В октябре 2019 года Google добавила нейронную сеть BERT в ядро алгоритмов поиска Google для английского языка, а в декабре – для более чем 70 языков. Новое обновление поиска получило название BERT и затронуло 10% всех поисковых запросов.



1. BERT - нейронная сеть, созданная Google

Научить компьютеры понимать естественный текст, как это делает человек, является интересной и крайне сложной задачей. Ведь в естественном языке много нюансов, разобраться в которых с трудом могут даже люди. В информатике есть целый подраздел Natural Language Processing (далее – NLP) – методы обработки естественного языка. NLP позволяет применять алгоритмы машинного обучения для текста и речи.

Сегодня у многих из нас есть смартфоны с распознаванием речи – в них используется именно NLP. Также, многие люди используют ноутбуки и компьютеры со встроенным в ОС распознаванием речи.

Итак, в 2018 году Google анонсирует новейшую нейронную сеть BERT (Bidirectional Encoder Representations from Transformers). BERT использует Transfer learning (трансферное обучение), что позволяет использовать его основную языковую модель, дополнительно обучив её под свои конкретные задачи, самым разнообразным компаниям. Это означает, что обучение нейронной сети происходит в два этапа. Сначала долго и дорого её обучают на огромном корпусе в миллиарды слов (это называется pre-training). На втором этапе сеть можно быстро дообучить под разные задачи.

Ранее, одним из основных инструментов претренинга было нечто вроде словаря, использующего векторное представление слов, описывавших связи между словами в виде цифр. Однако прошедшая претренинг на векторном словаре нейросеть не понимала смысл слов. С её точки зрения, предложения «человек укусил собаку» и «собака укусила человека» идентичны.

В Google разработали уникальную систему претренинга для обеспечения нейросети более богатыми правилами – не только словарём, но и синтаксисом с контекстом. Исследователи начали обучать нейросети на более общей задаче под названием языковое моделирование, скармливая нейросетям огромные объёмы текста – миллиарды слов, расставленных в грамматически корректные предложения. После этого нейросеть должна уметь предсказать следующее слово в тексте самостоятельно.

По сути, BERT состоит из трех важнейших составляющих. Во-первых - это прошедшая претренинг языковая модель. Во-вторых – возможность решить, какие из особенностей предложения являются наиболее важными. В-третьих, в отличие от других прошедших претренинг языковых моделей, созданных посредством обработки нейросетями терабайтов текста, читаемого слева направо, модель BERT читает и справа налево, и одновременно слева направо, и обучается предсказывать, какие слова случайным образом были исключены из предложений.

Каждый из трёх этих составляющих – глубокая модель языка с претренингом, внимание и двунаправленность – существовали до BERT по отдельности. Но до тех пор, пока Google не выпустил свой алгоритм в конце 2018 года, никто не скомбинировал их таким успешным образом.


2.Внедрение BERT в основной алгоритм поиска Google

В октябре 2019 года Google «выкатил» обновление ядра алгоритмов поиска под названием BERT. Отныне, одноименная нейросеть будет работать в качестве составляющего ядра алгоритмов поиска. По заверению Google - это крупнейшее обновление ядра со времен RankBrain.

Многие вебмастера не заметили скачков трафика после внедрения нового алгоритма, хотя Google заверяет, что оно коснулось 10% всех поисковых запросов. Чтобы понять, почему вебмастера не ощутили значительных колебаний трафика, еще раз рассмотрим как работает BERT и на какие запросы он влияет.

Типичный вебмастер, в основном, сфокусирован на СЧ или даже ВЧ запросы, которые достаточно коротки (1-3 слово). BERT сфокусирован на обработке длинных запросов. Именно поэтому большинство вебмастеров пока не замечают колебания, которое оказал BERT на выдачу.

Итак, BERT лучше понимает и интерпретирует НЧ и микро-НЧ запросы, длинный хвост запросов. В частности, - это могут подтвердить дорвейщики, которые ощутили резкие колебания трафика и некоторые вебмастера, плотно работающие с 3-5-словниками, что характерно для продуктовых партнерок, например работающих под Amazon.

Необходимо понимать, что BERT – это не фактор ранжирования. Непосредственно на ранжирование органической выдачи она не влияет. Однако, нейросеть позволяет Google лучше интепретировать запросы пользователей, лучше понимать интент. Именно это может достаточно сильно повлиять на Ваш трафик, после дальнейшего обучения нейросети.

Если вы не заметили значительных флуктуаций в выдаче, это не означает, что их не было. Вы просто их не искали.


3. Как найти запросы, на которые повлиял BERT и как оптимизировать сайты под них

Методика поиска запросов, на которые оказал влияние алгоритм BERT – достаточно стандартна и я расписывал её неоднократно за последние несколько лет.
Смотрите например в статье про YMYL в разделе «Как найти некачественный контент на сайте».

Еще один способ есть непосредственно в разделе статьи про BERT, где ищем запросы, используя Search Console.

В целом алгоритм очень прост. Для поиска запросов, на которые оказал влияние BERT можно использовать Google Analytics или Google Search Console.

Даты релиза алгоритма нам известны - 21 октября 2019 для англоязычных и 9 декабря для русскоязычных сайтов. Отсчитываем 3-4 недели после даты релиза (можно и больше) и сравниваем его с аналогичным предыдущим периодом.

Для поиска используем каналы (органическую выдачу Google). И далее строим разрез по ключевым словам.

Нам интересны запросы, которые существовали в предыдущем периоде, а в новом периоде (после внедрения алгоритма) не имеют показов. Так мы найдем утерянные запросы. Отсортировав результат по отсутствующим в предыдущем периоде и появившемся в новом (после релиза ядра алгоритмов), мы увидим, какие запросы появились, как теперь Google осмысляет контент.

Если в указанный период на сайт добавлялся контент, то запросы, подходящие новому контенту необходимо исключить из анализа.

Получив список запросов можно приступать к оптимизации вашего сайта.

Как известно, сотрудники Google утверждают, что оптимизация под BERT - невозможна. Об этом высказался и Дэнни Салливан и Джон Мюллер.
«Запросы не являются чем-то, на что вы можете повлиять в плане SEO», – сообщил Мюллер.
«Если есть что-то, что вы можете сделать для оптимизации под алгоритм BERT, так это убедиться, что на ваших страницах естественный текст… Вместо того, чтобы использовать как можно больше ключевых слов, пишите естественно».

Не густо, не правда-ли?

Итак, чтобы «оптимизировать» под алгоритм BERT, рекомендую изучить ваш набор данных по приобретенным и потерянным ключевым словам и провести традиционную оптимизацию контента, чтобы улучшить или восстановить позиции запросов.

Сначала вам нужно определить ключевые слова, которые вы потеряли после обновления BERT и заняться редакцией контента для их восстановления. При этом вовсе не нужно добавлять в контент эти поисковые запросы. Иногда достаточно добавить несколько предлогов и перефразировать пару предложений.

В случае «пропажи» запросов, скорее всего страница перестала ранжироваться из-за «смещения акцентов» в смысле контента, совсем как в примере про преподавателя и студента. Обновление BERT помогает Google лучше понимать семантику (значение слов и фраз). Это означает, что если вы ранее ранжировались по фразе с длинным хвостом, но потеряли позиции после внедрения BERT, то, вероятно, страница соответствовала ключевым словам в запросе, но на самом деле не соответствовала цели поиска (интенту). Необходимо добавить смысла тем фразам и акцентировать внимание на тех словах, которые соответствуют интенту пользователя.

Говоря попросту, ранее страница незаслуженно ранжировалась по утерянным запросам. Новый алгоритм BERT помог Google это понять. Вам придется немного постараться, обновляя контент, чтобы вернуть утерянные запросы.

Улучшайте ваш контент и для тех ключей, которые появились после обновления BERT. Изучите, что именно пишут конкуренты и как они расставляют акценты в своих текстах. Используйте идеи конкурентов, чтобы сделать свой контент более «ценным», чем у них. Необходимо отвечать на конкретные запросы в своем контенте лучше, чем конкуренты.

Огромное количество способов оптимизации приведено в моей книге «SEO Монстр 2020». На более чем 700 страницах раскрыты все важнейшие факторы ранжирования и методы воздействия на них с практическими примерами.

Хороший рост показали информационные сайты, построенные по SILO-структуре. Здесь изолированные кластеры запросов более точно давали ответы на НЧ запросы за счет наличия значительного числа «поддерживающих» страниц.


Заключение

Внедрение нейросети BERT в ядро алгоритмов поиска Google - очередной шаг корпорации к улучшению понимания запросов пользователей, заданных на естественном языке.

Нейросеть будет развиваться на всех уровнях. Уверен, что она пройдет не только post но pre- тренинг, будет постоянно обучаться, в том числе и силами асессоров, контролирующих качество органической выдачи. Все это скажется в дальнейшем на стратегиях продвижения сайтов и способах манипуляции ранжирующими факторами.

И обратите внимание, что русскоязычная языковая модель, по сравнению с англоязычной, на порядок хуже прошла пре-тренинг и показывает гораздо худшие результаты. Это означает, что основные обновления как языковой модели, так и обученной нейросети BERT еще впереди.

Готовьтесь и читайте правильную литературу, чтобы понимать, как нужно оптимизировать свой сайт.

Источник: DrMax.su


--------------------
Сео измышлизмы на drmax.su.


Поблагодарили: (1)
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
NormanSky
NormanSky
сообщение 18.1.2020, 20:43; Ответить: NormanSky
Сообщение #2


Цитата(DrMax @ 18.1.2020, 11:37) *
И обратите внимание, что русскоязычная языковая модель, по сравнению с англоязычной, на порядок хуже прошла пре-тренинг и показывает гораздо худшие результаты. Это означает, что основные обновления как языковой модели, так и обученной нейросети BERT еще впереди.


т.е. пока особо смысла нету ковыряться в запросах, если модель будет дорабатывать?
Хотя кто ее знает когда и как быстро...
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
artek
artek
сообщение 20.1.2020, 15:29; Ответить: artek
Сообщение #3


Цитата(NormanSky @ 18.1.2020, 20:43) *
т.е. пока особо смысла нету ковыряться в запросах, если модель будет дорабатывать?

Имеет смысл изначально делать контент для людей, а не для ПС.


--------------------
Профессиональное наполнение форумов, групп ВК, комментирование. Опыт работы. Отзывы. Гарантии.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
DrMax
DrMax
Topic Starter сообщение 21.1.2020, 12:41; Ответить: DrMax
Сообщение #4


NormanSky, фиг его знает, когда у Гугла дойдут руки до России. Пока прикрутили, работает, ну и гут. Они сейчс будут пост-треннинг делать, дрссировать асессорами нейросеть, дабы улучшить выдачу. ИМХО это более важная задача.

Кстати, русскую языковую модель тренировали в основном по Википедии, т.е. она все нормы языка сдирала оттуда. Вывод, писать в стиле Вики сейчас гораздо "выгодней". Кроме вики использованы новости, dirty, комментарии к фейсбуку и (!!!) субтитры к фильмам


--------------------
Сео измышлизмы на drmax.su.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Osipec
Osipec
сообщение 21.1.2020, 21:36; Ответить: Osipec
Сообщение #5


Цитата(artek @ 20.1.2020, 15:29) *
Имеет смысл изначально делать контент для людей, а не для ПС.


Об этом твердят уже последние лет 10 )
Но все продолжают упорно делать грязное seo )
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Aleksey4e
Aleksey4e
сообщение 23.1.2020, 16:25; Ответить: Aleksey4e
Сообщение #6


Лично я считаю, что нужно делать любой контент. Смотря для каких целей это делаешь и для кого. Потому что сейчас в интернете можно зарабатывать и с плохим контентом и с хорошим))
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
nypnypHbIu
nypnypHbIu
сообщение 4.3.2020, 1:16; Ответить: nypnypHbIu
Сообщение #7


Цитата
Потому что сейчас в интернете можно зарабатывать и с плохим контентом и с хорошим))


И что обидно, иногда на гуглопереводах иностранных сайтов можно заработать чуть ли не больше конкурентов с нормальным контентом.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
VinogradOFF
VinogradOFF
сообщение 4.3.2020, 16:00; Ответить: VinogradOFF
Сообщение #8


Цитата(nypnypHbIu @ 4.3.2020, 1:16) *
иногда на гуглопереводах иностранных сайтов


так логично
переводят обычно топовые материалы
уже меньше думать надо над качеством материала, если он уже в англ версии дотсточно хороший
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
nypnypHbIu
nypnypHbIu
сообщение 8.3.2020, 0:57; Ответить: nypnypHbIu
Сообщение #9


Цитата
уже меньше думать надо над качеством материала, если он уже в англ версии дотсточно хороший


есть такое. на днях ещё на вебледи читал тред с жалобами, что какой-то сайт по СНГ тупо копипаст собирает, даже пикчи с вотемарками, и при этом тусит в топе органики яндекса. чем громче ПС кукарекают о своих чудо-алгоритмах, тем они на деле оказываются более позорными.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Ваш сайт блокирует Роскомнадзор?
23 hollywooduk 5095 Вчера, 10:43
автор: hollywooduk
Открытая тема (нет новых ответов) Тысячи ботовых переходов на сайт
18 Suagaring 4536 26.3.2024, 21:42
автор: c4p1t4l15t
Открытая тема (нет новых ответов) Большие ставки для кликов в Я.Директ. Как удешевить?
2 rownong27 1119 26.3.2024, 14:13
автор: knezevolk
Открытая тема (нет новых ответов) SEO Линк Билдинг под Бурж | Вечные ссылки США, Европа и Мир с Гарантией
18 Needmylink1 6539 25.3.2024, 20:51
автор: Needmylink1
Открытая тема (нет новых ответов) Как вы бросили работу и перешли на заработок с сайтов?
12 uahomka 2289 25.3.2024, 6:52
автор: Skyworker


 



RSS Текстовая версия Сейчас: 28.3.2024, 21:41
Дизайн