OK, Google, кто твой хозяин?
Feb. 12th, 2017 01:44 pmЕсть у Гугла такая система голосового управления всем на свете, которая называется Google Home и стоит $129. В основе её лежит софтинка, которая летом 2012 года вышла на рынок под названием Google Now (и тогда же стала частью Android 4.1), а впоследствии переименовалась в Google Assistant, чтобы те, кто в танке, догадались: речь идёт об аналоге Siri.

Google Home — это изначально просто такая колонка с микрофоном, воспринимающая голосовые команды хозяина и отвечающая на них тоже голосом, за неимением дисплея. Но, естественно, затачивалась она не под поиск Google для слепых и безруких, а под пресловутый «Интернет вещей». То есть умеет подключаться по Bluetooth к системам управления «умным домом» и служит для них голосовым интерфейсом. Естественно, в случае, когда такие системы инсталлированы в квартире владельца.
Вот широко известная в Америке видеореклама, показывающая, что эта система умела делать по состоянию на октябрь 2016:
Система, как и многие её предшественницы, приводится в действие фразой «OK Google». Всё, что владелец устройства произносит вслед за этими волшебными словами, расценивается системой как голосовая команда — и исполняется.
Неделю назад эту самую рекламу показали в прайм-тайм по всем американским каналам во время трансляции Superbowl LI. И во множестве домов, где установлена колонка Google Home, голоса актёров из рекламного ролика привели к её самопроизвольной активации. В соответствии с командами из ролика, в квартирах телезрителей начал зажигаться и гаснуть свет, включалась музыка, из динамика сыпались кулинарные рецепты и испанские переводы английских приветствий... Заодно владельцы устройства могли оценить степень его многозадачности — и многие остались недовольны. Хотя, если говорить честно, она тут совершенно не нужна. Даже пользователь, обладающий даром чревовещания, вряд ли станет одновременно, на два голоса, отдавать электронному ассистенту разные команды.
Навскидку кажется странным, что неприятности начались только теперь, хотя сервисы активируются командой OK Google уже пятый год. Но на самом деле тут всё просто. Когда пользователь говорил OK Google своему телефону или очкам, он только к этому девайсу и обращался. Соответственно, телефон в кармане соседа этих команд не слышал, и никак на них не реагировал. А когда орать заветный «сим-сим» поручили жизнерадостным комсомольцам из телерекламы, и стали транслировать их вопли через качественные колонки на всю гостиную в каждом втором американском доме (трансляцию Superbowl LI смотрели 111,3 млн зрителей), то система расслышала ключевые для себя слова и метнулась исполнять последующие команды, в порядке их поступления.
Вот и всё, что нам, в сущности, нужно знать про голосовой интерфейс ввода.
На случай, если мы не знали этого раньше.
В отличие от систем, использующих для доступа пароли, коды доверенных устройств, отпечатки пальцев и контуры лица, голосовой ввод на сегодня совершенно анонимен и бесхозен. Им может пользоваться кто угодно. И для отдачи команд (смартфону, компьютеру, системе бронирования, офисному лифту), и для диктовки текстов.
Задача распознавания «хозяина» в этой технологии пока что не ставилась и не решалась.
Как показал инцидент во время трансляции Superbowl, это открывает необъятный простор для злоупотреблений — и для лулзов (написать, например, песню, где OK Google или Hey Siri станет припевом), и для несанкционированного доступа к чужим устройствам в пределах слышимости.
Месяцем раньше похожая неприятность постигла пользователей аналогичного устройства от Amazon в Южной Калифорнии. После того, как в местных теленовостях показали сюжет, где маленькая девочка заказала через Amazon Echo домик для своей куклы и полтора кило печенья, ведущий прокомментировал:
— Мне понравилось, как девочка сказала Alexa ordered me a dollhouse.
Эта фраза, произнесённая хорошо поставленным дикторским голосом, была расценена многими устройствами Amazon Echo как команда начать покупку кукольного домика в онлайн-магазине. Для владельцев Echo этот инцидент негативных финансовых последствий не имел, потому что процесс покупки интерактивен, а ведущий продолжать тему не стал. Зато на интернет-магазины в Сан-Диего обрушился шквал неоконченных заявок на покупки кукольных домиков...
Впрочем, разбираться с рисками предоставим параноикам и другим экспертам. Куда более печальный вывод, лично для меня — что технологии голосового ввода сегодня остаются в очень сыром и недоразвитом виде. Те решения, которые мы сегодня имеем на массовом рынке — это не бета и даже не альфа-версия. Это скорей прототип. А жаль, потому что речевой ввод текстов и команд — штука действительно очень крутая и полезная.

Google Home — это изначально просто такая колонка с микрофоном, воспринимающая голосовые команды хозяина и отвечающая на них тоже голосом, за неимением дисплея. Но, естественно, затачивалась она не под поиск Google для слепых и безруких, а под пресловутый «Интернет вещей». То есть умеет подключаться по Bluetooth к системам управления «умным домом» и служит для них голосовым интерфейсом. Естественно, в случае, когда такие системы инсталлированы в квартире владельца.
Вот широко известная в Америке видеореклама, показывающая, что эта система умела делать по состоянию на октябрь 2016:
Система, как и многие её предшественницы, приводится в действие фразой «OK Google». Всё, что владелец устройства произносит вслед за этими волшебными словами, расценивается системой как голосовая команда — и исполняется.
Неделю назад эту самую рекламу показали в прайм-тайм по всем американским каналам во время трансляции Superbowl LI. И во множестве домов, где установлена колонка Google Home, голоса актёров из рекламного ролика привели к её самопроизвольной активации. В соответствии с командами из ролика, в квартирах телезрителей начал зажигаться и гаснуть свет, включалась музыка, из динамика сыпались кулинарные рецепты и испанские переводы английских приветствий... Заодно владельцы устройства могли оценить степень его многозадачности — и многие остались недовольны. Хотя, если говорить честно, она тут совершенно не нужна. Даже пользователь, обладающий даром чревовещания, вряд ли станет одновременно, на два голоса, отдавать электронному ассистенту разные команды.
Навскидку кажется странным, что неприятности начались только теперь, хотя сервисы активируются командой OK Google уже пятый год. Но на самом деле тут всё просто. Когда пользователь говорил OK Google своему телефону или очкам, он только к этому девайсу и обращался. Соответственно, телефон в кармане соседа этих команд не слышал, и никак на них не реагировал. А когда орать заветный «сим-сим» поручили жизнерадостным комсомольцам из телерекламы, и стали транслировать их вопли через качественные колонки на всю гостиную в каждом втором американском доме (трансляцию Superbowl LI смотрели 111,3 млн зрителей), то система расслышала ключевые для себя слова и метнулась исполнять последующие команды, в порядке их поступления.
Вот и всё, что нам, в сущности, нужно знать про голосовой интерфейс ввода.
На случай, если мы не знали этого раньше.
В отличие от систем, использующих для доступа пароли, коды доверенных устройств, отпечатки пальцев и контуры лица, голосовой ввод на сегодня совершенно анонимен и бесхозен. Им может пользоваться кто угодно. И для отдачи команд (смартфону, компьютеру, системе бронирования, офисному лифту), и для диктовки текстов.
Задача распознавания «хозяина» в этой технологии пока что не ставилась и не решалась.
Как показал инцидент во время трансляции Superbowl, это открывает необъятный простор для злоупотреблений — и для лулзов (написать, например, песню, где OK Google или Hey Siri станет припевом), и для несанкционированного доступа к чужим устройствам в пределах слышимости.
Месяцем раньше похожая неприятность постигла пользователей аналогичного устройства от Amazon в Южной Калифорнии. После того, как в местных теленовостях показали сюжет, где маленькая девочка заказала через Amazon Echo домик для своей куклы и полтора кило печенья, ведущий прокомментировал:
— Мне понравилось, как девочка сказала Alexa ordered me a dollhouse.
Эта фраза, произнесённая хорошо поставленным дикторским голосом, была расценена многими устройствами Amazon Echo как команда начать покупку кукольного домика в онлайн-магазине. Для владельцев Echo этот инцидент негативных финансовых последствий не имел, потому что процесс покупки интерактивен, а ведущий продолжать тему не стал. Зато на интернет-магазины в Сан-Диего обрушился шквал неоконченных заявок на покупки кукольных домиков...
Впрочем, разбираться с рисками предоставим параноикам и другим экспертам. Куда более печальный вывод, лично для меня — что технологии голосового ввода сегодня остаются в очень сыром и недоразвитом виде. Те решения, которые мы сегодня имеем на массовом рынке — это не бета и даже не альфа-версия. Это скорей прототип. А жаль, потому что речевой ввод текстов и команд — штука действительно очень крутая и полезная.
no subject
Date: 2017-02-12 10:47 am (UTC)no subject
Date: 2017-02-12 12:26 pm (UTC)(no subject)
From:no subject
Date: 2017-02-12 10:59 am (UTC)no subject
Date: 2017-02-12 02:16 pm (UTC)(no subject)
From:no subject
Date: 2017-02-12 11:02 am (UTC)Казалось бы, почему во всех таких случаях не дать (или, скорее, заставить) владельца дать "домашнему питомцу" имя, и так и активировать ("Зрдыщ, включи свет!").
no subject
Date: 2017-02-12 11:56 am (UTC)(no subject)
From:no subject
Date: 2017-02-12 11:19 am (UTC)no subject
Date: 2017-02-12 12:12 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2017-02-12 11:22 am (UTC)no subject
Date: 2017-02-12 12:05 pm (UTC)no subject
Date: 2017-02-12 11:25 am (UTC)no subject
Date: 2017-02-12 06:46 pm (UTC)(no subject)
From:no subject
Date: 2017-02-12 11:26 am (UTC)no subject
Date: 2017-02-12 01:06 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2017-02-12 11:26 am (UTC)Ну на на деле - все эти рассказы корпораций про "умные дома" - очередная попытка нарубить бабла с лохов из совершенно пустой идеи. Надо сначала промыть мозги рекламой, потом навешать хорошей лапши на уши. А оболваненный и зомбированный лох побежит платить за кухонную технику с WiFi & Bluetooth. При этом сам не понимая - а нахэра все это нужно?
no subject
Date: 2017-02-12 12:11 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2017-02-12 11:27 am (UTC)Решение на поверхности, не понятно почему его не применили.
no subject
Date: 2017-02-12 02:20 pm (UTC)no subject
Date: 2017-02-12 11:47 am (UTC)2. Проблема с тем, что голосовой ввод для него пока не распознаёт хозяина по голосу -- вполне известна разработчикам. В данный момент она отчасти решается тем, что через Google Home пользователь не имеет доступа к некоторым более персональным сервисам, доступным на новых телефонах, или через бота в Allo.
no subject
Date: 2017-02-12 12:00 pm (UTC)no subject
Date: 2017-02-12 12:08 pm (UTC)Голосом управляю светом (philips hue), через IFTTT очень много возможностей для программирования команд - от написания почты до напоминания сделать что-то. Вызывать убер - вообще класс. Ну и управление музыкой и видео (chromecast как аудио так и видео).
Единственный большой косяк - это привязка к одному аккаунту, но это вопрос времени.
no subject
Date: 2017-02-12 06:57 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2017-02-12 12:16 pm (UTC)Не знаю, как у кого, а у меня телефон распознаёт фразу "Окей, Гугл" только от меня.
Специально для фактчекинга этого коммента заставил жену и дочку проговорить её в телефон - в обоих случаях безрезультатно. На мой же голос телефон реагирует безотказно.
no subject
Date: 2017-02-12 06:58 pm (UTC)(no subject)
From:no subject
Date: 2017-02-12 01:02 pm (UTC)no subject
Date: 2017-02-12 01:33 pm (UTC)no subject
Date: 2017-02-12 01:24 pm (UTC)no subject
Date: 2017-02-12 01:24 pm (UTC)Немногие знают, что в аббревиатуре IoT буква S обозначает "security"
no subject
Date: 2017-02-12 01:52 pm (UTC)no subject
Date: 2017-02-12 01:31 pm (UTC)в таком формате ("настольное" устройство посреди комнаты) устройство от Амазон было первым, а не просто аналогичным.
Конкретно у Алексы покупку голосом можно защитить пин-кодом.
no subject
Date: 2017-02-12 01:47 pm (UTC)Точнее, если придерживаться хронологии, то сначала узнала его жена. Если ты понимаешь, о чем я )))))))))))))))))))))
Просто взяла зачем-то его телефон и случайно подержала кнопочку Home (в леново это так запускается).
no subject
Date: 2017-02-12 02:04 pm (UTC)no subject
Date: 2017-02-12 05:54 pm (UTC)no subject
Date: 2017-02-12 02:10 pm (UTC)Борис, ты не прав!У меня Google Pixel с Android 7.1.1. Так вот, у него есть функция обучения голосу хозяина. Я ей воспользовался, и теперь, на чужой голос, произносящий "Ok, Google", телефон заявляет, что голос не распознан.
Как я понимаю, это благодаря не только софту, но и самому шустрому процессору сейчас на рынке: Snapdragon 821.
Вполне возможно, что для процессоров послабее это просто недоступно, как, например, для устройства на которое Вы, Антон, ссылаетесь.
no subject
Date: 2017-02-12 02:24 pm (UTC)no subject
Date: 2017-02-12 03:33 pm (UTC)no subject
Date: 2017-02-13 04:53 pm (UTC)Всё понимает: поиск, имена в телефонной книге, СМС тоже можно надиктовать.
(no subject)
From:no subject
Date: 2017-02-12 04:47 pm (UTC)no subject
Date: 2017-02-12 04:50 pm (UTC)no subject
Date: 2017-02-12 07:10 pm (UTC)no subject
Date: 2017-02-13 07:55 am (UTC)no subject
Date: 2017-02-13 10:27 am (UTC)Но это настолько редкий случай, в случае чего выключить микрофон.