Большие возможности: распознавание голоса в Digital Signage

0
0
23 марта 2018

В ИТ-индустрии - много шума вокруг голосового управления: технология может стать следующим большим шагом на пути совершенствования общения человека с машинами. Мы не сомневаемся, что внедрение механик по распознаванию голоса будет поворотным инструментом и в развитии digital signage, как одного из цифровых каналов коммуникаций с клиентами, в самое ближайшее время. Вместе с тем есть целый ряд задач, которые необходимо решить для того, чтобы все это стало реальностью.

Чем проще, тем лучше

В первую очередь, необходимо быть реалистами в вопросе использования технологии распознавания голоса для вовлечения в коммуникацию посетителей, например, магазинов. На техническом уровне это требует серьезных процессорных мощностей для распознавания и ответа на голосовые команды. Чтобы снизить компьютерную мощность, требуемую для интерпретации и правильного ответа на звуковую коммуникацию, очень важно упростить процесс взаимодействия с клиентом. Например, вместо того, чтобы делать цифровую инсталляцию, способную отвечать на сложные запросы, сначала необходимо отточить специальную лексику для старта самых простых коммуникаций. Сложные схемы взаимодействия когда-нибудь тоже займут свое место в цифровых каналах, но не раньше, чем будет сделана базовая подготовка к этому. Отлично выполненная инсталляция с элементарной, но высоко функциональной схемой коммуникации намного лучше для клиента, чем сложное взаимодействие с большой вероятностью провала.

Ищем нестандартные решения

Следующий большой вопрос - наличие интернет-соединения. Не всегда возможно предоставить подключение к интернету для всех устройств digital signage. Эта проблема особенно актуальна для ритейла в регионах. Без интернета система не может подключаться к базе данных запросов в режиме реального времени. Решение – зафиксировать небольшое количество стандартных схем взаимодействия, которые можно начать простыми голосовыми командами и продолжить которые система сможет без постоянного доступа к интернету. Это создаст у покупателя впечатление реального общения с цифровым носителем, в то время как на самом деле сценарий их диалога был заранее прописан, а медиа-плеер просто выводит заготовленный текст на экран.

Определяем рамки общения

И наконец, важно точно определить приемлемую для большинства покупателей глубину коммуникации. Некоторые довольно свободно общаются со своими устройствами Amazon Echo или Google Home и чувствуют себя при этом комфортно, находясь в своей гостиной, в то время как в общественных местах ведут себя более сдержанно и менее охотно вступают в коммуникацию.

Google Home mini

По этой причине нормы голосового взаимодействия с цифровыми инсталляциями будут развиваться по-другому, нежели это происходит в сфере устройств для дома с голосовым управлением, количество которых растет с неимоверной быстротой. Ожидается, что к 2020 году будет насчитываться более семи миллиардов видов таких устройств, в то время как сейчас их всего четыре. Всего год назад голосовое управление использовали в основном для контроля освещения, включения музыки, использования устройств в рамках «умного дома» и установки будильника.

Борьба на рынке голосовых устройств сейчас идет в основном между такими ИТ гигантами, как Apple, Google, Microsoft, Amazon. Так, Amazon включает помощницу Alexa все в большее число гаджетов, Microsoft продвигает Cortana через сеть партнерств, и скоро появятся устройства с помощником от Amazon и ассистеном Microsoft. Google выводит на рынок электронной коммерции Google Assistant, а Apple интегрирует Siri в свою экосистему (уже сейчас Siri ежемесячно работает на 375 миллионах устройств в 36 странах).

Помощник Amazon Alexa

Голосовые возможности в сфере digital signage сейчас находятся только на начальном этапе, однако открывающиеся перспективы для развития огромны – к 2020 году, по прогнозу comScore, 50% поисковых запросов станут голосовыми. Это не значит, что разговаривать с цифровыми инсталляциями в ближайшее время станет нормой. Но очевидно, что индустрия будет постепенно переходить на гораздо более глубокий уровень голосового взаимодействия с устройствами digital signage.