Классическая схема «запрос-документ» стала неактуальной из-за заспамленности большинства тематик. Поэтому ей на смену пришли алгоритмы латентного семантического анализа, а затем нейросети. В ответ специалисты SEO стали внедрять LSI-копирайтинг.
Что такое LSI-копирайтинг
Цель — повышение релевантности, полезности, актуальности и достоверности материала. LSI-копирайтинг помогает поисковым системам лучше понимать смысл и содержание текста. В результате сайт может попасть на первые страницы выдачи, даже имея минимальное количество ключевых слов.
На практике это значит, что в тексте необходимо использовать синонимы основного запроса, сопутствующие ключевые слова и дополнительные фразы из смежных тематик. Это позволит полностью охватить и раскрыть тему. Такой контент оценят и пользователи, и поисковые системы.
История
Первоначально LSA применяли для выявления семантической структуры и автоматического индексирования текста. Затем — для построения когнитивных моделей и представления баз знаний. В США метод использовался для проверки качества обучающих методик и знаний школьников.
Суть метода
LSI — аббревиатура от latent semantic indexing, с английского — латентное семантическое индексирование. Это способ использования LSA в области поиска информации.
Проще говоря, LSA позволяет машинам понимать смысл и содержание документа. А при ранжировании уравнивает «веса» разных по написанию, но близких по смыслу слов. Таким образом структурируются синонимы и запросы схожей тематики.
Основа системы — терм-документная матрица, разбор которой и является LSA. Терм-документная матрица представляет собой таблицу, в которой совмещаются «термы» (слова, фразы, термины) и документы. Строки соответствуют документам, а столбцы — терминам. Число обозначает количество пересечений.
LSI в алгоритмах поисковых систем
Окончательно новые требования к качеству текстов сформировались к 2013 году. В это время Google запустил новый алгоритм — Hummingbird («Колибри»). Главное отличие нового алгоритма — поиск стал понимать поисковые запросы разговорного типа. Google научился отыскивать нужные документы, исходя из семантических связей, а не просто по запросам.
«Яндекс» подхватил эстафету в ноябре 2016 года — запустил алгоритм «Палех». Его задача — распознавать низкочастотные и сложные запросы из «длинного хвоста». То есть понимать запросы в разговорном ключе. Общая масса таких запросов составляет порядка 40% от объема текста.
Для работы алгоритма были использованы нейросети и машинное обучение. Подробнее о механике и принципах работы алгоритма можно прочитать в блоге «Яндекс» на Хабрахабре. Введение в работу «Палеха» подогрело интерес к LSI-текстам в русскоязычном интернете.
Весной 2017 года «Яндекс» вводит «Баден-Баден» — новый алгоритм определения текстов, которые перенасыщены ключевыми словами. Тысячи сайтов попадают под фильтр и понижаются в выдаче, условием возврата трафика называется отказ от SEO-текстов.
Осенью 2017 «Яндекс» запускает «Королев» — алгоритм поиска на основе нейросетей. По заявлению «Яндекс», алгоритм «…сопоставляет смысл запросов и веб-страниц…». Новый алгоритм работает на нейросетях, но при этом не отменяет LSI, а усиливает сложившиеся тенденции. Теперь писать SEO-тексты нет никакого смысла — вместо топа можно получить фильтр за переоптимизацию.
«Андромеда» — следующий алгоритм Яндекса, обновивший в ноябре 2018 года поисковую систему. Ключевые обновления: быстрые ответы, отвечающие на запрос прямо в выдаче, стали разнообразнее — с их помощью можно узнать не только какой-то факт, но подробную информацию о событиях. Например, по запросу «чемпионат испании» Яндекс покажет турнирную таблицу и расписание следующих матчей, предложит посмотреть видео и почитать новости.
Зимой 2019 поиск компании вновь трансформировался. Разработчики запустили новую версию поисковой системы — «Вега». Она стала точнее и быстрее отвечать на запросы, а также учитывать сигналы от асессоров-экспертов при обучении поискового алгоритма. Люди стали решать с помощью Яндекса гиперлокальные задачи — находить нужное в конкретном микрорайоне, квартале или даже доме.
В конце 2020 года Яндекс запустил новый алгоритм поискового ранжирования «YATI», действие которого основано на нейросетях-трансформерах. Эта нейросетевая архитектура опирается на смысловую составляющую и устанавливает наилучшее семантическое единение между намерением пользователя, запросом и документом. Простыми словами, суть алгоритма состоит в применении тяжелых нейросетей для «поиска по смыслу».
Годом позднее компания представила новую версию поиска «Y1». Главная цель обновления — ускорить поиск информации и сэкономить время пользователей. Для этого в компании использовали генеративные нейросети, которые обрабатывают запросы и выдают быстрые и емкие ответы. Основные возможности новинки: быстрые ответы, поиск внутри видео, оценка сайтов и бизнесов по отзывам, визуальный поиск, повышение безопасности.
Отличие LSI от SEO-копирайтинга
Это результат того, что теперь поисковые машины оценивают релевантность контента по смыслу. Учитывается контекст, уместность, семантические варианты запросов и их окружение. Вкупе с поведенческими факторами это позволяет оценивать качество текста и потребности читателей.
Преимущества и недостатки
Преимущества
Недостатки
Требования к LSI-текстам
Как создать LSI-текст
LSI-ключи
Инструменты для сбора LSI-фраз
Подсказки поисковых систем
Блоки «Вместе с..» и «… часто ищут»
Статистика запросов Яндекс и Google
Pixel Tools
Arsenkin Tools
Ubersuggest tool
Создание структуры
Пример проработки структуры статьи
Постановка технического задания
Пример ТЗ
Выбор исполнителя
Сравнение LSI и SEO-текста
Частые вопросы по LSI
Выводы
Основная задача LSI — фильтрация спама и распознавание смысла текста. Непосредственно на ранжирование она влияет опосредованно. Но в условиях жесткой конкуренции необходимо прорабатывать сайт полностью. Поскольку иногда именно мелочи могут дать решающее преимущество.
LSI-копирайтинг — не идеальный метод, но имеет ряд преимуществ: позволяет не попасть под текстовые фильтры и улучшить старые материалы. Переработка текстов дает возможность вывести сайт из-под санкций и увеличить посещаемость сайта.
Комментарии к статье
Комментарии: 0