Тренды

BERT: новый алгоритм Google

Автор Freelance.Today
Google уже стал такой важной частью нашей жизни, что многие из нас болтают с ним напрямую. 

Пользователи говорят своему телефону «как мне попасть на рынок» или «когда начнется весна», словно говорят с человеком. Но стоит помнить: Google состоит из алгоритмов.

И один из таких алгоритмов — Google BERT — помогает поисковой системе понять, что люди просят, и дает ответы, которые они хотят получить.

Правильно: боты — не люди, но технологии настолько продвинулись вперед, что они могут понимать человеческий язык, включая сленг, ошибки, синонимы и языковые выражения, присутствующие в нашей речи, а мы этого даже не замечаем.

Этот новый алгоритм поиска был создан Google, чтобы лучше понять намерения пользователей при поиске, и содержание веб-страниц. 

Но как он работает? И как продумать свою стратегию продвижения?

Давайте теперь во всем этом разберемся.

Что такое Google BERT?

Google BERT — это алгоритм, который улучшает понимание поисковой системой человеческого языка.

Это важно во вселенной поиска, поскольку люди спонтанно выражают свои мысли что в поисковых запросах, что в содержании страниц, а Google работает над тем, чтобы найти правильное соответствие между одним и другим.

Чтобы понять, что такое BERT, нам познакомиться с некоторыми техническими терминами. 

Во-первых, BERT — это нейронная сеть . 

Вы знаете, что это такое?

Нейронные сети — это компьютерные модели, которые могут изучать и распознавать закономерности. Они являются частью машинного обучения.

В случае BERT нейронная сеть способна изучать формы выражения человеческого языка. Он основан на модели обработки естественного языка (NLP) под названием Transformer, которая понимает отношения между словами в предложении, а не просматривает одно за другим по порядку.

BERT — это предварительная обучающая модель обработки естественного языка. Это означает, что набор данных модели обучается в текстовом корпусе (например, в Википедии) и может использоваться для разработки различных систем.

Например, можно разработать алгоритмы, ориентированные на анализ вопросов, ответов или настроений.

Все это в области искусственного интеллекта. То есть, все делают боты! 

После программирования алгоритм непрерывно изучает человеческий язык, обрабатывая миллионы получаемых данных .

Но за пределами мира искусственного интеллекта, который больше похож на научную фантастику, важно знать, что BERT понимает полный контекст слова — термины, которые идут до и после, и отношения между ними, что чрезвычайно полезно для понимания содержания сайтов и намерения пользователей при поиске в Google.

Когда был выпущен BERT?

В ноябре 2018 года  Google запустил BERT с открытым исходным кодом  на платформе GitHub. 

С этого момента любой может использовать предварительно обученные коды и шаблоны BERT для быстрого создания своей собственной системы.

Сам Google использовал BERT в своей поисковой системе. В октябре 2019 года Google анонсировал самое большое обновление за последнее время:  внедрение BERT  в поисковый алгоритм.

Google уже делал модели для понимания человеческого языка, но это обновление было объявлено одним из  самых значительных скачков в истории поисковых систем.

Изначально BERT был запущен только в США и на английском языке. Но к декабрю 2019 года модель уже была расширена до более чем 70 языков. Таким образом, результаты поиска по всему миру стали более качественными.

 

Что такое NLP?

Чтобы объяснить, что такое BERT, мы упомянули, что этот алгоритм является моделью обработки  естественного языка (NLP). Позвольте объяснить.

NLP — это область искусственного интеллекта, которая сходится с лингвистикой при изучении взаимодействия человека и компьютерных языков. Такой тип системы существует давно, со времен  Алана Тьюринга (1950-х годов, если точнее).

В 1980-х годах модели NLP были внедрены в искусственный интеллект. С тех пор компьютеры обрабатывали большие объемы данных, что произвело  революцию во взаимоотношениях людей и машин.

Мы можем не замечать этого в повседневной жизни, но наше общение чрезвычайно сложное и разнообразное. 

Существует так много языков, синтаксических правил, семантических отношений, сленгов, поговорок, аббревиатур и повседневных ошибок, что порой люди с трудом понимают друг друга!

Для компьютеров это еще сложнее, поскольку мы используем  для них неструктурированный язык,  и нужны системы для его понимания.

Для этого NLP использует ряд техник, таких как абстрагирование того, что не имеет отношения к тексту, исправление орфографических ошибок и сокращение слов до их радикальных или инфинитивных форм.

Отсюда можно структурировать, сегментировать и классифицировать контент, чтобы понять смысл. Затем система вырабатывает ответ на естественном языке для взаимодействия с пользователем.

Такая система позволяет, например, сказать:  «Алекса, расскажи мне рецепт шоколадного торта», а виртуальный помощник Amazon отвечает, сообщая ингредиенты и способ приготовления.

Это решение сегодня используется в нескольких ресурсах, таких как взаимодействие с чат-ботами, автоматический перевод текстов, анализ эмоций при мониторинге социальных сетей и, конечно же, поисковая система Google.

Заменил ли BERT RankBrain?

Google постоянно изучает способы улучшения  пользовательского опыта  и достижения наилучших результатов. 

В 2015 году поисковая система анонсировала обновление, изменившее поисковую вселенную:  RankBrain. Это был первый случай, когда алгоритм использовал искусственный интеллект для понимания контента и поиска.

Как и BERT, RankBrain также использует машинное обучение, но не обрабатывает естественный язык. Этот метод ориентирован на анализ запросов и группировку слов и фраз, которые семантически похожи.

Таким образом, когда в Google делается новый запрос, RankBrain анализирует прошлые поисковые запросы и определяет, какие слова и фразы лучше всего соответствуют этому запросу,  даже если они не совпадают точно или никогда не искались.

Таким образом, это был первый шаг Google к пониманию человеческого языка. Даже сегодня это один из методов, используемых алгоритмом для понимания целей поиска и содержания страниц, чтобы предоставлять пользователям лучшие результаты.

Таким образом, BERT не заменил RankBrain — он просто принес еще один метод понимания человеческого языка. В зависимости от поиска алгоритм Google может использовать любой метод (или даже комбинировать их), чтобы предоставить пользователю наилучший ответ.

Имейте в виду, что алгоритм Google состоит из огромного количества правил и операций. RankBrain и BERT играют важную роль, но они — только части этой надежной поисковой системы.

Как работает Google BERT?

Одним из отличий Google от других систем языковой обработки является его двунаправленный характер. Но что это значит?

Остальные системы только однонаправленные. То есть они контекстуализируют слова только с помощью терминов, которые находятся слева или справа в тексте.

BERT работает в обоих направлениях: он анализирует контекст слева и справа от слова. Это дает гораздо более глубокое понимание отношений между терминами и между предложениями.

Еще одно отличие состоит в том, что BERT строит языковую модель с небольшим корпусом текста.

В то время как другие модели используют большие объемы данных для машинного обучения,  двунаправленный подход BERT позволяет обучать систему более точно и с гораздо меньшим количеством данных.

В Google BERT используется для понимания намерений пользователей при поиске и содержимого, которое индексируется поисковой системой.

В отличие от RankBrain, ему не нужно анализировать прошлые запросы, чтобы понять, что имеют в виду пользователи. BERT понимает слова, фразы и весь контент так же, как и мы.

Как BERT влияет на результаты поиска?

Когда Google запустил BERT, он сказал, что обновление затронет около 10% поисковых запросов в Соединенных Штатах. 

Как и любое обновление алгоритма, это объявление вызвало движение на рынке SEO, поскольку многие сайты опасались потери позиций.

Однако, в отличие от обновлений, направленных на противодействие недобросовестным действиям, BERT не наказывал ни один сайт. Что он делает, так это улучшает согласованность между поисковыми запросами пользователей и содержанием страницы.

Следовательно, если кто-то потерял позиции по определенному ключевому слову,  это означает, что сайт не дает хорошего ответа на запрос.

С другой стороны, если страница подходит для Google, она, вероятно, была лучше согласована с другим запросом и ей удалось улучшить качество своего трафика, что повысило вероятность того, что посетители будут получать удовольствие от контента.

В объявлении BERT Google также сказал, что обновление повлияет на избранные фрагменты, которые представляют собой выделенные разделы, которые появляются в «нулевой позиции» поисковой выдачи.

Google начал отбирать наиболее релевантные сниппеты для поиска. Поэтому, опять же, те, кто потерял избранные фрагменты, не были наказаны — они просто не доставляли лучший быстрый ответ на то, что искал пользователь. 

Контент и SEO: как оптимизировать сайт под BERT?

Итак, что вы можете сделать, чтобы улучшить свои SEO-результаты?

Что ж, правда в том, что оптимизировать для BERT особо нечего.

Если в этой статье вы искали приемы оптимизации, возможно, эта фраза вас разочаровывает. Но вы должны понимать, что Google сделал это обновление именно для предотвращения оптимизации страниц и контента сайтами для ботов.

Поисковая система хочет предлагать пользователям полезный контент и рассчитывает найти его на вашем сайте.

Так что не оптимизируйте свой сайт для BERT — оптимизируйте для пользователей. 

Пишите правильно

И RankBrain, и BERT постановили:  контент должен создаваться для людей, а не для ботов! Так что забудьте о точном соответствии ключевых слов. 

Чтобы точно соответствовать поисковым запросам пользователей, многие люди по-прежнему исключают вспомогательные слова (называемые стоп-словами, такие как «до», «а», «от», «один» и т. д.), пытаясь приблизиться к терминам, которые используют пользователи.

Это генерирует супероптимизированные тексты, которые создают странное впечатление от чтения.

Еще одно отклонение от нормы — оптимизация текстов с учетом орфографических ошибок, которые допускают пользователи. Итак, вместо того, чтобы писать «адвокат», что было бы правильно, в тексте используется «юрист», так как многие люди могли бы писать так.

Помимо того, что сайт совсем не помогает SEO, он также теряет доверие!

Так что пишите естественно и без ошибок о том, как выбрать байк и как нанять юриста. 

Помните, что Google понимает естественный язык, поэтому вам не нужно (и не следует!) что-то выдумывать, чтобы текст соответствовал условиям поиска пользователей.

Оптимизируйте поисковые запросы

Хорошо, понятно, что точные ключевые слова больше не нужны для SEO. Итак, чтобы контент появлялся в поисковых запросах пользователей, как следует оптимизировать его содержание?

Вместо того, чтобы сосредотачиваться на ключевых словах, переключите внимание на поисковые намерения. 

Если раньше вы фокусировались на оптимизации того, что ищет пользователь, теперь вы должны оптимизировать то, что пользователь хочет найти. Вы видите разницу?

Секрет заключается в том, чтобы понять  намерения вашего  покупателя, то есть какие сомнения и вопросы его мучают. 

Поиск семантических отношений между словами

Возможно, возникло еще одно сомнение: если точное соответствие больше не подходит для SEO, имеет ли смысл поиск по ключевым словам?

Конечно, есть! Поиск по ключевым словам остается мощным инструментом планирования.

С его помощью вы можете понять, какие поисковые запросы приводят к вашему сайту, какие термины используют пользователи и какие темы становятся все популярнее в вашей сфере. Таким образом, можно спланировать руководящие принципы для удовлетворения этих запросов.

Разница в том, что вы больше не будете чрезмерно оптимизировать статьи блога с помощью этих точных терминов. Теперь вы можете определить основные условия поиска и найти слова, которые устанавливают с ними семантические отношения.

Синонимы, антонимы, сленг и совместное использование являются частью семантического поля слова. Поэтому вместо того, чтобы повторять ключевое слово несколько раз, вы можете изучить эти варианты в своем тексте вместе с основными терминами.

Эта практика обогащает опыт чтения и помогает Google понять смысл ваших материалов.

Создавайте качественный контент

Это очевидно, но повторить не помешает. По сути, Google хочет, чтобы вы производили качественный контент для людей. Google BERT — одно из главных обновлений в этом смысле.

Так что не тратьте больше времени на размышления об оптимизации для того или иного термина. 

Помимо соответствия поисковым запросам, посвятите себя созданию оригинального, обновленного, надежного и полезного контента для пользователей. Создавайте контент, который стоит прочитать и поделиться.

Google рекомендует, чтобы качественный контент обладал высоким уровнем EAT, то есть  опытом, авторитетом и доверием. 

Предложите лучший опыт чтения

Наконец, всегда думайте об опыте чтения. Вспомните книгу, которую просто не можете отложить. Или статью, которая обогащает вас таким количеством полезной информации?

Вдохновляйтесь ими! 

Постарайтесь понять, чем они привлекают читателя. Конечно, вам придется адаптировать формат и язык для Интернета, например, с   функциями сканирования и использования ссылок и изображений.

Это то, что вы должны делать в своих текстах, чтобы заинтересовать аудиторию и заставить читателей вернуться. В SEO это взаимодействие посылает положительные сигналы в Google, говоря, что вы предлагаете хороший опыт и заслуживаете заработать рейтинговые баллы.

Наконец, теперь вы знаете все детали Google BERT и влияние этого обновления на вселенную SEO.

Как видите, Google не шутит.

Самые передовые технологии искусственного интеллекта используются для улучшения работы поисковой системы как со стороны веб-сайта, так и со стороны пользователя. И, конечно же, на BERT работа в этом направлении не остановится. 

Источник

 
  • 951