Блог

Голосовое управление и поиск. Нужно ли бизнесу думать об этом?

9 ноября 2018
15 мин. 23734
image
image
Алексей Семёнов редактор
Голосовое управление и поиск. Нужно ли бизнесу думать об этом?
Многие из умных гаджетов, которыми мы ежедневно пользуемся, поддерживают технологию распознавания речи. С помощью голоса мы ищем информацию, покупаем товары, управляем другими устройствами. Влияет ли этот факт на бизнес и продвижение продуктов и, если да, то как? Мы разобрались. Рассказываем, как устроена технология голосового управления, будет ли она развиваться и какие изменения ждет маркетинг в ближайшем будущем.
Распознавание речи есть практически во всех мобильных устройствах, также оно работает на стационарных персональных компьютерах, в умных колонках, домашних устройствах, системах умного дома. Подавляющее большинство приборов интернета вещей (Internet of Things — сеть физических предметов, которые оснащены технологиями для взаимодействия друг с другом) уже имеют распознавание речи, а в перспективе нас ждет голосовое управление автомобилями и его мультимедийными системами.

История голосового управления

Первый электронный синтезатор речи был изобретен Гомером Дадли, сотрудником компании Bell, в 1937 году. Аппарат назывался Voder. А первым кто занялся распознаванием речи с помощью электроники был советский физик Лев Мясников — он работал над этим с 1939 года в рамках диссертации «Техническая фонетика».
Первый электронный синтезатор речи — Voder. Источник
Первый электронный синтезатор речи — Voder
В 1952 году был представлен первый голосовой распознаватель чисел от 1 до 9, который снова разработала компания Bell. Аппарат назывался Audrey (Automatic digit recognizer) и работал с помощью телефона. Оператор называл число, а аппарат распознавал его, сравнивая с имеющимися образцами. В 1962 году IBM представила компьютер Shoebox, который мог распознавать 16 фраз и 6 цифр.

Первый массовый продукт по распознаванию речи выпустили в 1990 году — это была программа Dragon Dictate. В 1994 году был представлен IBM ViaVoice, а в 1995 году Bell представила телефонную систему Val для автоматизации работы диспетчеров и маршрутизации звонков. В 1996 году SRI развернул интерактивное программное обеспечение голосового ответа.

В 2001 году Microsoft представила Windows и Office XP speech, в которых использовалось распознавание речи в модуле «Альтернативный ввод». В 2007 году голосовое управление появилось у всей операционной системы Windows в версии Vista, также Microsoft выпустила мобильный голосовой поиск для Live Search (впоследствии переименован в Bing).
Google Voice Search
Google Voice Search
В 2002 год Google запускает Voice Search, на основе которого было создано множество современных программ и приложений, включая «Google Ассистент».

В 2008 году Google запустил первое приложение голосового поиска для iPhone, которое в 2012 году эволюционировало в персонального ассистента Google Now для Android. К 2011 году словесная и фонетическая база данных на серверах насчитывала уже около 230 миллиардов слов на разных языках мира. В то же время функцию голосового поиска получил и фирменный браузер Google Chrome.

В том же 2011 году на презентации iPhone 4s объявили о полной интеграции голосового помощника SIRI в iOS. В апреле 2014-го Microsoft представил голосового помощника Cortana. Она по умолчанию установлена на компьютерах, мобильных устройствах с операционной системой Windows 10 и на игровых консолях Xbox One. В том же году Amazon представила своего голосового помощника Alexa и умную колонку Amazon Echo, которая отличилась тем, что может управлять множеством устройств в рамках системы «умный дом».

В 2016 году на презентации Google I/O был представлен Google Assistant — умный персональный помощник. Он стал частью умной колонки Google Home и смартфонов Pixel. Сейчас функция работает на устройствах под управлениях Android по всему миру. В 2017 году российская компания представила голосового помощника «Алиса», а в 2018 собственную умную колонку «Яндекс.Станция».

Технология

Голосовое управление имеет два типа взаимодействия:
Голосовые команды: «Позвонить маме», «Вызвать такси» и т.д.
Голосовой поиск: «Кто выиграл матч», «Где заказать пиццу?».
Голосовой поиск — аналог обычных поисковых запросов, но созданных голосом. Голосовые команды — взаимодействие со специальными устройствами и программами. И то, и другое важно учитывать при продвижении продуктов — значительная часть голосовых команд также имеет поисковую направленность, то есть люди могут искать в интернете какой-то товар или услугу.

Если на вашем устройстве есть функция голосового поиска, вы можете вводить поисковые запросы без использования клавиатуры. А также искать информацию, товары, услуги, отдавать команды электронным помощникам.

При голосовом запросе автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Затем поисковая система или приложения обрабатывают его и выдают результат.
SpeechKit Cloud — облачный сервис распознавания речи. Источник
SpeechKit Cloud — облачный сервис распознавания речи
Обработка голосового запроса происходит в четыре этапа:
Фильтрация — нужная фраза выделяется из шумового облака.
Оцифровывание — звуковые волны преобразуются в код.
Анализ — полученные данные обрабатываются.
Выявление шаблонов данных — запрос сравнивается с примерами из базы данных и историей запросов.
Одна из самых продвинутых систем распознавания речи принадлежит Google. Интересно, что она может переводить фразы. Уже сейчас искусственный интеллект способен распознавать акценты и интонации, точность распознавания речи Google оценивается в 95% и не уступает человеку.

У «Яндекс» есть собственная система распознавания речи Yandex SpeechKit, которая используется более чем в 400 приложениях. Голосовой поиск доступен в сервисах «Навигатор», «Город», «Карты», а также в браузере. Кроме того, есть бесплатный виджет голосового поиска «Яндекс.Строка». Также российская компания активно внедряет своего голосового помощника «Алису» в браузеры и электронные устройства.

Системы от Google и «Яндекс» работают на базе искусственного интеллекта и с применением нейронных сетей. Они постоянно самообучаются и совершенствуются. Искусственный интеллект собирает данные миллионов образцов и на их основе создает модели. Впоследствии все новые запросы сравниваются с ними.

Голосовой поиск и помощники работают в смартфонах с ассистентами «Google Ассистент», «Яндекс.Алиса», Siri, Alexa, Cortana, Samsung Bixby, а также в «умных» колонках Google Home, Amazon Echo, Apple HomePod и других. С помощью голосового помощника можно определить или включить песню, узнать погоду, построить маршрут, вызвать такси, найти ближайшее кафе или совершить какое-то действие на компьютере.

Как используют голосовое управление

Согласно исследованиям Google, 55% американских подростков и 41% взрослых пользовались голосовым поиском хотя бы 1 раз в день. Больше всего голосовой поиск востребован во время приготовления пищи, просмотра телевизора и в других подобных ситуациях, когда сложно набрать текст привычным образом и требуются дополнительные усилия.

Исследование было заказано Google и выполнено Northstar Research, глобальной консалтинговой фирмой. Она изучила привычки голосового поиска со смартфонов у 1400 американцев старше 13 лет (400 подростков 13−17 лет и 1000 взрослых старше 18).
Результат изучения привычек голосового поиска со смартфонов. Источник
Результат изучения привычек голосового поиска со смартфонов

Статистика

60,5 миллионов человек в США в настоящее время используют цифровых помощников.
Согласно данным MindMeld, в 2015 году количество голосовых запросов достигло 50 миллиардов в месяц.
Компания Highervisibility выяснила, что 27% респондентов используют голосовых помощников ежедневно, еще столько же использует их хотя бы раз в неделю.
В 2017 году зарегистрировано около 33 миллионов устройств с голосовым управлением по всему миру.
Западные эксперты назвали голосовой поиск одним из топ-3 трендов SEO в 2017 году.
Еще в 2016 году Google заявлял, что 20% всех запросов в Google сделаны голосом.
На 2018 год «Google Ассистент» работает на 400 миллионах устройств по всему миру. И эта цифра только растет.
По данным Global Web Index, 25% людей в возрасте от 16 до 24 лет используют голосовой поиск с мобильных устройств.
25% поисковых запросов на панели задач Windows 10 — голосовые, по данным Purna Virji.
Вот как выглядит в 2018 году распределение голосового поиска по устройствам, согласно исследованиям, проведенным компанией PWC.
Распределение голосового поиска по устройствам
Распределение голосового поиска по устройствам

Влияние на бизнес

В начале 2017 года маркетинговое агентство Higher Visibility опубликовало статистику по использованию голосового поиска. Согласно ему, больше половины опрошенных использует поиск при вождении автомобиля. Отчасти это говорит о том, что голосовой поиск повлияет в первую очередь на локальные запросы, то есть на местный бизнес.

К примеру, пользователь спрашивает: «OK Google, где здесь можно поесть пиццу?». В ответ голосовой ассистент посоветует ближайшее заведение. Очевидно, если вы владелец бизнеса и вас нет в Google My Business, вас не будет на карте и система вас не порекомендует.

В апреле 2018 BrightLocal провели исследование, согласно которому чаще всего пользователи ищут кафе и рестораны, продуктовые магазины, доставку еды, магазины одежды и отели. При этом 58% потребителей использовали голосовой поиск, чтобы найти информацию, привязанную к конкретной местности. За последние 12 месяцев 46% пользователей голосового поиска ежедневно ищут местные компании. В основном спрашивают адрес, телефон, контакты, способы добраться и время работы.
Какие компании ищут с помощью голоса.
Какие компании ищут с помощью голоса
Чтобы попасть в результаты голосовой выдачи, ваш сайт должен быть специальным образом оптимизирован. Как именно — расскажем в отдельной статье.

Прогнозы

По прогнозам компании Comscore, к 2020 году 50% запросов будет производиться голосом.
К 2022 году объем покупок с помощью голоса достигнет 40 миллиардов долларов. По состоянию на 2017 год продажи составляли 2 миллиарда долларов.
22% американцев, которые пользуются голосовыми помощниками, купили что-либо с их помощью.
Согласно исследованиям WalkerSands за 2018 год, каждый пятый пользователь умной колонки от Amazon покупал с ее помощью, а треть планировала сделать это в следующем году.
У голосового помощника Cortana от Microsoft 133 миллиона пользователей ежемесячно.
Отчет Voicebot говорит, что почти 20% взрослых в США имеют умные колонки.
Согласно исследованию PWC, из 90% респондентов 72% использовали голосового помощника.
Можно предположить, что тенденция будет лишь нарастать — значит, готовиться к этому стоит заранее. Рост количества цифровых помощников и умных устройств может превратить голосовую выдачу в полноценный канал для продвижения бизнеса.

Расскажите
о вашем проекте