В этой статье мы собрали всю актуальную информацию о BERT и даже больше. Как обновление повлияет на SEO, практические советы по подготовке к нему и почему BERT восхищает не только SEO-специалистов — читайте ниже (всего 12 минут).

 

Что такое BERT: главное о новом поисковом алгоритме Google

В официальном объявлении Google говорится, что алгоритм BERT (Bidirectional Encoder Representations From Transformers) — алгоритм глубокого обучения, базирующийся на технологии обработки естественного языка (NLP) на основе нейронной сети. Да, Google умеет сбить с толку, но на самом деле все довольно просто.

Новый алгоритм призван предлагать пользователям результаты, которые РЕАЛЬНО соответствуют их поисковому намерению, благодаря своей способности понимать естественную речь.

С BERT такого не случится

Как именно? BERT научили (точнее он сам научился, ведь он относится к алгоритмам машинного обучения) интерпретировать интент и контекст поискового запроса, учитывая всю фразу, а не отдельно взятые слова.

Небольшое уточнение: BERT сейчас понимает только английский и со временем обучится другим языкам. Но фантазировать по поводу работы BERT в русском языке мы не будем и пока все примеры подаем для англоязычных запросов.

В частности, речь идет о длинных поисковых запросах, сформулированных так, как-будто человек это проговорил. Также BERT правильнее интерпретирует фразы, где есть предлоги «for» «to» — они значительно меняют смысл предложения. Примеры будут далее в статье.

Новый алгоритм даже может лучше понимать омонимы: «нужно почитать родителей» и «нужно почитать книгу». Одинаковое звучание и написание, но абсолютно разный смысл.

 

Технические подробности и происхождение BERT

Для общего представления..

Google давно работал над пониманием языка машинами.

Можно сказать, что BERT начал зарождаться с 2017 года. Тогда команда Google AI запустила работу над проектом Transformers, который подразумевал разработку новой структуры нейронной сети для понимания языка.

Благодаря этой новой структуре, слова в поисковой фразе обрабатываются по отношению к другим словам, а не просто слово за словом по порядку.

Так, концепция проекта Transformers была объединена с поисковым алгоритмом BERT.

Осенью 2018 года компания впервые представила технологию обработки естественного языка BERT. После этого пользователи (сами того не подозревая) могли натренировать систему ответов на свои вопросы.

Особенность данного алгоритма заключается именно в его глубокой двунаправленности во время репрезентации контекста фразы. В этой статье Google описан детальный механизм данного процесса.

Новый алгоритм настолько мощный, что количество ресурсов, необходимых для его работы, вынудило корпорацию полностью разместить его в облаке и использовать Cloud TPU (тензорный процессор). Обычная аппаратура может ограничивать КПД алгоритма.

 

Что теперь с RankBrain

RankBrain появился в 2015 году и был первым методом искусственного интеллекта Google для понимания поисковых запросов. Он анализирует как запросы, так и содержание страниц из индекса Google.

И так, BERT не заменяет RankBrain – это просто дополнительный метод для трактования контекста фразы, который скорее всего базируется на работе RankBrain.

Тем не менее, это отдельные системы, поэтому при обработке поискового запроса (в зависимости от его сложности) могут применяться как BERT, так и RankBrain. Google будет определять с помощью какого алгоритма лучше интерпретировать поисковый запрос. Не исключается, что для толкования поискового запроса будут использоваться несколько методов.

Новый алгоритм можно назвать следующим шагом в эволюции понимания человеческого языка искусственным интеллектом.

 

Взаимосвязь алгоритма BERT с голосовым поиском

Безусловно, голосовой поиск и голосовые помощники все больше набирают популярность, поэтому существует необходимость в улучшении их работы. Ведь поисковая система не всегда понимает, что вытекает из контекста сказанной фразы.

Последние годы Google реализовывал опции, связанные с голосовым поиском. Поэтому любой уважающий себя специалист в области SEO уже уловил тонкую связь между Voice Search и BERT (нет, не тонкую).

Алгоритм имеет все необходимое, чтобы найти наиболее релевантный результат для голосового запроса с длинным хвостом. Многие западные специалисты уверены, что BERT только увеличит способность Google точно отвечать на голосовые запросы и поможет компании продвинуться далеко вперед в развитии этой области.

С этого момента стоит уделить больше внимания оптимизации под голосовой поиск — ваша возможность получить дополнительный трафик. О главной особенности оптимизации под голосовой поиск читайте в нашей статье.

 

Влияние алгоритма BERT на поисковые результаты

Поскольку алгоритм пока знает только английский, то можем лишь поделиться опытом наших западных коллег.

  • Алгоритм у них работает уже больше недели и точно известно, что он оказывает влияние на 1 из 10 поисковых запросов в Google.
  • Изменения коснулись запросов с длинным хвостом и фраз, сформулированных на манер устной речи.
  • Отмечается, что большую роль теперь играют предлоги, которые до нынешнего обновления не имели особого значения при формировании семантического ядра.
  • Ожидается «смена игроков» в разделе быстрых ответов Google, так как компания заявила, что алгоритм натренирован подбирать наиболее подходящие результаты Featured Snippets.

 

Кстати, 99% результатов голосового поиска появляются в быстрых ответах, что еще раз говорит о взаимосвязи BERT с Voice Search.

 

Примеры алгоритма в действии

Прежде чем запустить BERT, в Google долго его тестировали, добиваясь наилучших результатов. Чтобы проиллюстрировать непосредственную работу алгоритма и его влияние на поисковую выдачу, Google подготовил следующие примеры.

Поисковой запрос: «2019 brazil traveler to usa need a visa».

Результаты по запросу «2019 виза для путешественника из бразилии в сша» до и после обновления:

Как видите, до обновления в результатах предлагалась статья для граждан США, собирающихся в Бразилию (что абсолютно противоположно интенту запроса), а после обновления поисковой результат стал релевантным запросу — предлагается сайт консульства США в Бразилии. Такое изменение вызвано тем, что алгоритм понимает предлоги и смог верно определить контекст (откуда и куда путешествует пользователь).

Поисковый запрос: «Can you get medicine for someone pharmacy»

Результаты по запросу «Можешь ли ты забрать лекарства за (вместо) кого-то аптека» до и после обновления:

Раньше не учитывалось самое главное слово в этой фразе — «вместо» (for), поэтому в результатах были инструкции по получению рецепта для лекарства. А теперь — ответ на вопрос.

Поисковый запрос: «Parking on a hill with no curb»

Результаты по запросу «Стоянка на склоне без бордюра» до и после обновления:

А вот и пример с быстрыми ответами. Ранее внимание акцентировалось на слове «бордюр» и упускалось самое главное — «без» (no). Теперь узнать, как же запарковаться на склоне, где отсутствует бордюр, стало намного легче.

 

Влияние алгоритма BERT на SEO и ваш сайт

BERT не наказывает и не вознаграждает сайты. Поэтому выдыхайте.

Повторяем еще раз, что меняется модель понимания ключевых слов алгоритмами поисковой системы. BERT не анализирует контент страницы.

В Google не сказали стоит ли ожидать больший или меньший трафик, но упомянули о нишевых запросах. Алгоритм позволяет поисковой системе давать более точные ответы на низкочастотные нишевые запросы, поэтому компания рассчитывает, что люди начнут ими пользоваться чаще.

 

Как мы можем подготовиться к грядущему у нас обновлению BERT

Опыт — половина успеха, а он у нас уже есть, благодаря западным специалистам-первопроходчикам.

Нужно смириться — невозможно оптимизировать непосредственно под BERT, но можно (и нужно) удвоить работу по созданию релевантного и качественного контента.

Google будет лучше понимать естественный язык и определять смысл и контекст запроса, а значит он будет лучше определять релевантные этим запросам страницы. Поэтому плохо написанный, thin контент больше не прокатит.

Окей, вы уверены в качестве своего контента. Теперь проверьте насколько он годен для Featured Snippets.

Нет, Google не хочет вас убить (надеюсь), просто без BERT немного сложно понять контекст написанного

 

Вот мини чек-лист как попасть в блоки с ответами:

  • Создавайте контент в разговорной манере, задавайте вопросы и отвечайте на них.
  • Текст лучше размещать в виде коротких легко читаемых параграфов с подзаголовками.
  • Разрабатывайте инструкции, которые касаются тематики.
  • Используйте маркированные списки, таблицы, разбиение на этапы.

Читая между строк..

Сосредоточиваемся на создании контента, ориентированного на реальные вопросы, которые задает ваша аудитория. Поэтому добавьте в семантическое ядро сайта ключи с длинным хвостом — те самые низкочастотники.

Здесь возникает закономерный вопрос — как их ОРГАНИЧНО внедрить в контент сайта. Сейчас, как никогда, говорят о FAQ (страница вопросов-ответов). Этот формат — наилучший выход из такой ситуации.

Очень нужны ответы

 

Кому надо, вот чек-лист по оптимизации страницы FAQ.

1) Соберите релевантные тематике часто задаваемые вопросы. Используйте сервисы для сбора ключевых слов. Ваша цель — вопросительные запросы. Также опросите менеджеров по работе с клиентами, менеджеров по продажам — что чаще всего спрашивают люди.

Формируйте вопрос так, как-будто его задает вам человек и пишите максимально читабельный ответ. Последнее требование скорее для поискового робота, который будет отвечать на голосовой запрос.

2) Позаботьтесь об удобной навигации. Если много вопросов, создайте удобную логичную структуру часто задаваемых вопросов. Разбейте вопросы на категории — так легче ориентироваться и пользователю и поисковому роботу (чем искать нужную информацию в огромном перечне пунктов).

3) Сделайте страницу FAQ визуально привлекательной. Этот пункт для пользователей, так как в сухом тексте никто не будет искать нужную информацию. Добавьте релевантные тексту изображения, инфографику или даже видео.

4) Разметьте структурированные данные. Дайте поисковым роботам понять, что находится на этой странице и для чего. Есть шанс, что FAQ попадет в поисковую выдачу. И тогда плюс к привлекательности страницы в поиске, плюс к CTR и минус конкуренты в нише (их позиции будут ниже). Для этого используйте разметку FAQPage в формате JSON-LD.

 

Больше, чем просто алгоритм: BERT может закончить ваше предложение

Google говорит, что BERT знаменует собой новый этап в поиске, поскольку это один из самых значительных шагов, которые компания сделала за всю свою историю.

Мы рассматриваем этот алгоритм, как новый этап в понимании машинами людей и, на самом деле, BERT просто поражает.

В августе исследователи из Алленовского института искусственного интеллекта провели тест для ИИ на английском языке. Их задачей было продолжить предложения, выбрав ответ из нескольких вариантов. К примеру, такое задание:

Женщина садится за рояль на сцене. Она…

1) сидит на стуле, пока ее сестра играет с куклой;

2) с кем-то смеется, пока играет музыка;

3) находится в толпе, наблюдая за танцорами;

4) нервно кладет свои пальцы на клавиши.

Всем нам ответ очевиден, но роботам было сложнее — они справлялись примерно с 60% тестовых вопросов. Для сравнения — люди проходили тест, в среднем, на 88%.

Когда Google анонсировал свой алгоритм BERT, он тоже прошел этот тест. BERT справился так же, как и человек. Внимание (!), он ведь даже не был создан для прохождения этого теста.

А теперь представьте.

BERT за несколько дней проанализировал множество статей из Википедии, обучился и начал применять эти знания. Он научился угадывать пропущенные слова в любом месте любого предложения. Например, «Я зашел в магазин и купил _____ молока».

Исследователи предложили BERT проанализировать множество вопросов и ответы на них. Вскоре алгоритм умел самостоятельно давать ответы уже на совершенно другие незнакомые вопросы.

Ученые показывали алгоритму разные новостные заголовки одного и того же события. BERT обучился распознавать два похожих предложения, если в них вложен один и тот же смысл (нет, вот так — СМЫСЛ). Обычно искусственный интеллект распознает похожие предложения, если в них есть точные соответствия.

Потомки BERTа

BERT может похвастаться тестом на понимание прочитанного. Он обрабатывал статью с энциклопедии и потом отвечал на вопросы по типу «Что такое кислород?», «Что такое осадки?».

И вот супер навык, по-моему: BERT может определить хороший ли фильм или плохой, анализируя отзывы о нем.

BERT преуспел потому, что для его работы используются большие вычислительные мощности, которых раньше не было.

 

В завершении..

BERT пока еще темная лошадка и мы продолжаем следить за обновлением информации о нем. А пока пересматриваем семантическое ядро :)

 

Комментарии

Комментарии