- Управление голосом в приложениях на Android
- Можно ли организовать голосовое меню (IVR) на Android-смартфоне?
- Голосовое меню для андроид
- Голосовое управление андроид, полное руководство
- Голосовое управление
- Now on Tap
- Пасхалки в поиске Google
- Tasker
- Немного хитростей
- Open Mic+ for Google Now
- Commandr for Google Now
- Ассистент Дуся
- Выводы
Управление голосом в приложениях на Android
Началось все с того, что я посмотрел неплохой обзор (сравнение) Siri и Google Now. Кто из них лучше, спорить не буду, однако у меня лично планшет на Андроиде. Я подумал, а что если написать калькулятор полностью на голосовом управлении (удобно ли будет?). Но для начала пришлось немного разобраться с самим голосовым управление, точнее говоря с голосовым вводом (управления еще добиться надо). Кроме того, я только что скачал Android Studio, и мне не терпелось скорей опробовать ее на практике (ну на минипроекте). Что ж, начнем.
Кидаем на активность ListView и Button. В ЛистВью будем сохранять сами команды, точнее варианты одной команды, а кнопка будет вежливо спрашивать, чего мы желаем. Да, программа логикой не будет обладать, с ее помощью просто посмотрим саму реализацию.
Добавим так же в Манифест одно разрешение
И все, теперь можно переходить непосредственно к программированию. «Находим необходимые компоненты»:
Прописываем обработчик нажатия для кнопки, который вызовет метод startSpeak(), о котором мы поговорим далее:
Ну наконец закончилась «вода». Начинаем «говорить»:
Пришло время дать волю фантазии и решить какие команды использовать. Сам я сначала хотел показать на примере тетрисного танчика: диктовали бы ему «up», «down», «left», «fire» и так далее, но это сложно оставляю вам. Я же отдавал команды по смене цвета кнопки, выходу из приложения, открытию страниц в браузере, запуску карт и перезагрузке устройства. Что касается последнего, reboot, это команда будет работать, как я понял, только на рутованных устройствах. На телефоне у меня есть права СП и все хорошо работает, а вот на планшете, он просто игнорирует эту команду. В записи команд нет ничего сложного, думаю комментариев будет достаточно:
Так выглядит окно записи команд:
Скажем с красивым английским акцентом «maps». Вызвали Google Maps:
Как видите, в списке выводятся все возможные (похожие) слова и из них уже выбирается необходимое нам.
Ну и на «finish», я закончил беседу с бездушной (или нет?) машиной.
Надеюсь моя небольшая статья побудит кого-нибудь на создание (не, не терминатора) какого-либо перспективного проекта, который упростит повседневную жизнь людям, а вам принесет миллионы, ну или хотя бы окажется полезной. Дерзайте!
Источник
Можно ли организовать голосовое меню (IVR) на Android-смартфоне?
Здравствуйте!
Интересует возможность организации бюджетного голосового меню для приёма звонков/заказов от клиентов. Задачи:
1. Ответить на типичные вопросы не отвлекая работников;
2. Сэкономить время потенциальных клиентов;
3. Увеличить конверсию с входящих звонков (терять меньше звонков).
Многоканальность особо не требуется, Asterisk представляется избыточным.
Можно ли нечто подобное организовать на базе Android? Или есть какие-то ограничения на приём звонков приложением?
- Вопрос задан более трёх лет назад
- 5502 просмотра
Оценить 1 комментарий
Сам ищу способ организации IVR (голосового меню). Пока что на ум приходит только использовать облачные сервисы IVR, типа aimylogic — просто переадресовывать все звонки на их номер, а бот уже уже раскидает)
Умный IVR — это бот-оператор, который обрабатывает входящие звонки. Умный IVR заменяет старое тоновое меню на голосовое управление и помогает клиентам получить ответы на вопросы еще быстрее.
Умный IVR понимает естественную речь клиента, отвечает на его вопросы, может использовать в диалоге данные из CRM и передает диалог оператору, если клиент на этом настаивает.
Умный IVR работает круглосуточно или в определенное время, например, с 18:00 до 9:00, когда рабочий день операторов закончен.
Источник
Голосовое меню для андроид
Краткое описание:
Голосовое управление с помощью VoiceButton
Описание:
С помощью голосовых команд VoiceButton можно выполнять голосовой поиск контактов оффлайн, звонить, набирать номер, искать места на карте, прокладывать маршруты, открывать программы и многое другое. Голосовой набор номера через гарнитуру блютуз будет очень полезен за рулем автомобиля.
Приложение умеет озвучивать входящие звонки и автоматически включать громкую связь. Поддерживается активация программы с помощью Bluetooth и проводной гарнитуры. В системах с Android 4.1. и выше поддерживается работа оффлайн.
Приложение может работать в двух режимах:
Обычный — режим в котором программа не будет разговаривать с вами. При определении контакта с высокой точностью может быть совершен автоматический набор номера через заданное в настройках время. Этот режим может быть использован при отсутствии гарнитуры;
За рулем — режим в котором программа будет синтезировать голосовые сообщения. Этот режим полезен при использовании гарнитуры или тогда, когда ваши руки заняты.
Режимы могут автоматически переключаться при подключении и отключении гарнитуры, а также при работе навигатора и движении со скоростью автомобиля . В каждом режиме могут использоваться персональные настройки, заданные вами.
Запускать программу можно с помощью блютуз или проводной гарнитуры.
Обычно для запуска с Bluetooth гарнитуры нужно нажать и держать кнопку вызова. Для уточнения ознакомьтесь с инструкцией на конкретную модель. В некоторых случаях запуск программы с гарнитуры не работает. Причина может быть как в гарнитуре, так и в самом телефоне.
Для запуска с проводной гарнитуры нажмите и удерживайте кнопку гарнитуры. Чтобы работал запуск при блокировке активируйте пункт в настройках.
Для всех команд можно использовать псевдонимы (слова для автоматической замены).
Программа использует встроенные в систему голосовой ввод и синтезатор речи.
Для поиска мест и навигации голосом программа поддерживает практически все программы для навигации.
Подробное описание работы некоторых функций
Работа с контактами
Для поиска контакта нужно запустить распознавание программы и после звукового сигнала произнести текст для поиска.
Поиск контакта работает по имени, номеру или его части, типу, названию организации
Пример: Алексей Иванов, Антон 911, Мама домашний, Антон рабочий, Вася Сбербанк.
Для точной идентификации контакта можно использовать псевдоним.
Данная функция доступна онлайн и оффлайн.
Работа с программами
Для запуска программы нужно произнести команду «открой приложение» + «имя программы».
Например: открой приложение галерея.
Если использовать псевдоним, можно запускать программы используя более простые слова. Например вместо «Открой приложение галерея» можно сказать «покажи картинки», если конечно вы создадите такой псевдоним. Псевдонимы можно использовать для открытия программ со сложными названиями. Данная функция доступна онлайн и оффлайн.
Работа с навигатором и картой
Для поиска ближайшего места нужно произнести команду «карта» + «название места или адрес». Если у вас установлены карты и место найдено, будет запущена программа с предложением прокладки маршрута.
Чтобы узнать текущее время просто скажите команду «время» и программа скажет вам его.
Чтобы перезвонить по последнему номеру произнесите команду «перезвони».
Важное достоинство программы: голосовой набор номера без интернета.
Требуется Android: 4.1 или более поздняя
Русский интерфейс: Да
Скачать:
Версия: 3.0.116 VoiceButton (Razalina)
версия: 3.0.85 — Поддержка последних версий Андроид. Добавление ярлыков приложения. VOICE-BUTTON-freeVersion-release-3.0.85-247.apk ( 3.05 МБ )
версия: 3.0.79VOICE-BUTTON-freeVersion-release-3.0.79-241.apk ( 2.81 МБ )
версия: 3.0.77VOICE-BUTTON-freeVersion-release-3.0.77-239.apk ( 2.81 МБ )
b]версия: 3.0.69[/b]VOICE-BUTTON-freeVersion-release-3.0.69-231.apk ( 2.81 МБ )
версия: 3.0.62VOICE-BUTTON-freeVersion-release-3.0.62-224.apk ( 2.75 МБ )
версия: 3.0.59VOICE-BUTTON-freeVersion-release-3.0.59-221.apk ( 2.75 МБ )
версия: 3.0.52VOICE-BUTTON-freeVersion-release-3.0.52-214.apk ( 2.75 МБ )
версия: 3.0.40VOICE-BUTTON-freeVersion-release-3.0.40-202.apk ( 2.73 МБ )
версия: 3.0.37VOICE-BUTTON-freeVersion-release-3.0.37-199.apk ( 2.73 МБ )
версия: 3.0.24VOICE-BUTTON-freeVersion-release-3.0.24-186.apk ( 2.68 МБ )
версия: 3.0.15VOICE-BUTTON-freeVersion-release-3.0.15-177.apk ( 2.68 МБ )
версия: 3.0.2VOICE-BUTTON-freeVersion-release-3.0.2-164.apk ( 2.4 МБ )
версия: 3.0.0app_freeButton-release_3.0.0.apk ( 2.4 МБ )
версия: 2.0.24app-freeButton-release_2.0.24.apk ( 819.57 КБ )
версия: 2.0.19 app-freeButton-release_2.0.19.apk ( 949.86 КБ )
версия: 2.0.18 app-freeButton-release_2.0.18.apk ( 949.8 КБ )
версия: 2.0.17 app-freeButton-release_2.0.17.apk ( 1.71 МБ )
версия: 2.0.15 app-freeButton-release_2.0.15.apk ( 1.7 МБ )
версия: 2.0.13 app-freeButton-release_2.0.13.apk ( 5.17 МБ )
версия: 2.0.11 app-freeButton-release_2.0.11.apk ( 2.63 МБ )
версия: 2.0.10 app-freeButton-release_2.0.10.apk ( 2.63 МБ )
версия: 2.0.7 app-freeButton-release_20_03_2016.apk ( 2.62 МБ )
версия: 2.0.6 VoiceButton (Пост Dionisiy11 #38507741)
версия: 2.0.5 VoiceButton (Пост Dionisiy11 #37994446)
версия: 2.0.4 VoiceButton (Пост #37583245)
версия: 2.0.1 app-freeButton-release.apk ( 2.52 МБ )
Сообщение отредактировал iMiKED — 27.06.20, 10:42
Источник
Голосовое управление андроид, полное руководство
Корпорация Google начинала свою деятельность как поисковик, и на данный момент поиск информации с помощью мобильных устройств так и остается одним из главных направлений развития. С каждым обновлением системы телефона/планшета, Google Play Services и отдельных программ появляется все больше новых функций, призванных облегчить жизнь пользователю. В этой статье я расскажу о наиболее полезных голосовых командах, контекстном поиске Now on Tap, а также покажу, как настроить телефон для выполнения любых голосовых команд, в том числе с помощью Tasker. Ведь именно об этом мы так мечтали, читая произведения фантастов в детстве.
Традиционно все новейшие разработки от «корпорации добра» внедряются на устройствах линейки Nexus. Так было и с голосовым управлением, и с Google Now, системой подачи информации в виде набора кaрточек. За Google Now, простой поиск Google и голосовой поиск отвечает одно приложение, это Google. Оно входит в комплект стандартных приложений от компании Google и доступно на любом сертифицированном Android-смартфоне.
Ранее голосовое управление активировалось только при нажатии на значок микрофона при открытой программе поиска (или на виджеты на рабочем столе). Затем появился лаунчер Google Старт, который позволил выполнять голосовые команды прямо с рабочего стола (с помощью фразы «Ok, Google»). Начиная с Android 4.4 та же возможность стала доступна и в других лаунчерах, но только при условии, что лаунчер явно поддерживает такую возможность (почти все популярные лаунчеры поддерживают).
Также существует несколько смартфонов с продвинутой функцией голосового управления, активируемoй, даже если экран смартфона выключен. Например, MOTO X содержит отдельный процессор с очень низким энергопотреблением, который только и занимается, что в фоновом режиме слушает все окружающие звуки на предмет ключевой фразы.
Виджет поиска на рабочем столе
Настройки голосового поиска
Голосовое управление
Простой поиск информации, конечно же, самая главная функция Google Now. Причем он достаточно интеллектуален, чтобы понимать контекст, а значит, команды можно объединять в цепочки. Например, если сказать: «О’кей, Google, кто президент Никарагуа?», то поиск выдаст ответ «Даниэль Ортега». А если далее спросить «Сколько ему лет?», то ответ будет «Семьдесят лет». Google Now понимает массу команд, приведу десять наиболее полезных.
- Карты и навигация — «поехали/навигация #названиеулицы #номердома». Запустит Google Maps в режиме навигатора по указанному адресу. Также можно указывать город, магазин, организацию и так далее.
- Калькулятор — «тринадцать процентов от пяти тысяч». Выдаст ответ и форму калькулятора в окне поиска. Голосом можно надиктовывать сложение, вычитание, умножениe, деление, корень числа. Также можно переводить меры весов, длин и прочего.
- Отправка СМС/сообщений — «написать смс Олег текст я за рулем, перезвоню позже». Отправлять сообщения также можно через WhatsApp, Viber и еще несколько популярных мессенджеров. По упрощенной схеме можно диктовать «сообщение #программа #контакт #текст». Например: «сообщение WhatsApp Олег я за рулем». После этого также голосом можно подтвердить отправку командой «отправить».
- Набор номера — «позвонить маме». Также можно продиктовать произвольный номер, которого нет в записной книге. При команде «позвонить сестре/брату» можно указать номер из контактов (если записано по-другому), тогда в следующий раз набор будет проходить автоматически.
- Напоминания и будильники — «разбудить меня в субботу в восемь утра» или «напомнить мне выключить плиту через десять минут». Также можно добавлять мероприятия в Google-календарь. События можно привязывать не только ко времени, но и к месту. Если добавить «напомни мне распечатать текст на работе», то при включенной геолокации и указанном адресе работы (места на карте) напоминание на телефоне всплывет автоматически. Обычный встроенный в приложение «Часы» таймер заводится так же легко.
- Угадай мелодию — «что это за песня». Запустит раcпознавание играющей музыки.
- Музыка/видео — «слушать (музыку) #группа #песня». Запустит указанную музыку в Play Music или клип на YouTube. Нормально работает с русскими названиями, но так как английские слова и исполнителей определяет, иногда неправильно интерпретируя под русский язык, то срабатывает не всегда.
- Фото/видео — «сделай фото / записать видео». Запустит камеру в выбранном режиме.
- Управление настройками — «выключи вайфай», «включи фонарик».
- Заметки — «заметка для себя тестовый пароль для сервиса один два три четыре». Добавит заметку в Google Keep.
Now on Tap
Описанию этого сервиса было уделено отдельное пристальное внимание на презентации Android 6.0 Marshmallow. И преподносился он как одна из основных особенностей новой прошивки. Но более-менее нормальную функциональность в России мы получили только в декабре. В официальном русском переводе он называется контекст от Now.
Как это работает? «Когда вы запускаете контекст от Now, Google анализирует все, что вы видите на экране, и ищет информацию в соответствии с этими данными» — вот официальное описание со страницы поддержки. На деле это значит, что вместо того, чтобы выделять и копировать интересующие фразы на экране, затем открывать поиск и вставлять фразу, можно просто нажать и удерживать кнопку «Домой». После этого Google предложит варианты для найденных ключевых фраз. Это могут быть картинки, видео, предложение открыть это место на картах, новости. Может предложить открыть сайт организации или сделать звонок, открыть профиль Facebook или посмотреть Twitter-аккаунт знаменитостей, добавить заметку. При наличии соответствующих приложений на устройстве после тапа на иконке страница откроется сразу внутри приложения. При прослушивании музыки из разных приложений можно одним нажатием вызвать подробную информацию об исполнителях, альбомах, клипах на YouTube и прочем.
Работа Now on Tap на примере «ВКонтакте»
Пасхалки в поиске Google
Так же как и в десктопной версии поиска, в голосовом поиске есть пасхалки. Приведу только несколько команд, остальные можешь узнать по этой ссылке. К сожалению, почти все они срабатывают только на английском языке и с английским интерфейсом или при выбранном в настройках только английском языке.
«Do a barrel roll».
«Make me a sandwich!»
«Sudo make me a sandwich!»
«When am I?»
«Beam me up, Scotty!»
«Up up down down left right left right».
«What does the fox say?»
Tasker
Если после всего прочитанного тебе все равно не хватает команд для воплощения своих фантазий, то, имея немного времени, можно настроить Google Now на выполнение практически любых команд. Для этого нам понадобятся прежде всего Tasker и плагин AutoVoice.
С помощью Таскера можно совершать множество действий: запускать приложения, контролировать звук, запускать скрипты, управлять экраном, проводить манипуляции над файлами, нажимать кнопки на экране, управлять media, делать запросы HTTP Get и Post и реагировать на них, управлять расширенными настройками телефона. И все это можно делать, отдавая голосовые команды. А с помощью множества плагинов функциональность расширяется еще больше.
Для начала работы необходимо включить пункт Google Now Integration внутри AutoVoice. В Таскере необходимо создать отдельный профиль для каждой команды или группы команд. Как обычно, для составления профилей рекомендую в настройках Таскера включать английский. Для тестового профиля составим голосовую команду выключения звука. Для этого создадим новый профиль с параметрами Event → Plugin → AutoVoice Recognized. Заполняем следующие поля:
- Command Filter — тут вводим необходимую голосовую команду, в нашем примере: «выключи звук». Если нажать на строку Speak Filter, то команду можно надиктовать.
- Exact Command — если поставить галочку, то будет срабатывать только на точную команду, иначе может сработать на каждое отдельное слово или форму слова.
- Use Regex — использовать регулярные выражения. Позволяет настроить распознавание нескольких слов в одном профиле. Если в первом поле ввести «(выключи|выключить) (звук|громкость)» без кавычек, то профиль будет срабатывать на команды «выключи звук», «выключи громкость», «выключить звук» и «выключить громкость».
Для действия используем Audio → Ringer Volume и Audio → Notification Volume. Для контроля срабатывания можно добавить всплывающее уведомление через Alert → Flash и в поле Text ввести «Выключил».
Команды «выключи вайфай» работают сразу в Google Now, а «выключи звук» предлагает открыть настройки. И после перехвата команды через Таскер и ее выполнения все равно остается на текущем экране с запросом. Поэтому к действиям дополнительно добавим App → Go Home. Ну а чтобы позабавить друзей, во всех профилях для управления голосом можно первым действием поставить Alert → Say и ввести фразу «слушаюсь, хозяин». Тогда телефон в ответ на команды будет реагировать голосом.
С помощью дополнительных плагинов, например AutoRemote, можно управлять другими устройствами на Android. А если на комп поставить EventGhost, то с помощью многочисленных плагинов можно сделать немало интересного. Одним из самых полезных применений будет настройка умного дома, но это отдельная большая история. У Жуана Диаса (Joao Dias), разработчика всех Auto*-плагинов, есть также дополнение и для компа, что позволяет интегрировать управление мобильными устройствами через голосовой помощник Cortana на десктопе.
Немного хитростей
Таскер — это хардкор. Можно творить потрясающие вещи, но для этого нужно освоить много информации, разбираться в переменных, регулярных выражениях и прочем. Для тех, кто не хочет возиться с Таскером, есть большое количество программ, которые используют возможности голосового управления, но имеют более понятный и доступный интерфейс и просты в обращении. Остановлюсь на трех.
Open Mic+ for Google Now
Программа позволяет изменить ключевую фразу с «Ok, Google» на любую другую. К сожалению, после одного из обновлений сервисов и запроса от Google перестала работать с Google Engine, оставив только PocketSphinx. В связи с этим для ключевой фразы подходят только английские словосочетания, но раньше можно было удивлять присутствующих обращением к телефону «эй, ты» или «слушай команду».
Тем не менее разработчик обещает все поправить в следующих обновлениях. Из других функций можно отметить запуск распознавания по датчику приближения (два взмаха руки) и по встряске телефона. Как и MOTO X, поддерживает распознавание при выключенном экране, но, к сожалению, это очень сильно отражается на батарее, поэтому актуально для телефона на зарядке или автомобильных медиацентров на Android с постоянным питанием. Работает с Bluetooth-гарнитурой, имеет интеграцию с Таскером, может зачитывать текстовые сообщения.
Open Mic+ for Google Now
Commandr for Google Now
Еще одна программа от разработчика Open Mic+. Интегрируется с Google Now и позволяет использовать расширенный набор команд. В списке поддерживаемых есть следующие: включить/выключить беспроводную точку доступа, приостановить/возобновить музыку, следующая/предыдущая песня, непрочитанные СМС/gmail (озвучит их голосом), громкость , блокировка телефона, сделать снимок, сделать селфи. Также можно включить диктофон, управлять подсветкой, автоповоротом экрана. С рутом можно выключить/перезагрузить телефон, очистить уведомления, включить режим «В самолете». Для поддерживаемых функций можно менять команды на свои. Также имеет интеграцию с Таскером, позволяя включить для каждой задачи срабатывание по названию Task. Есть модуль для Xposed, позволяющий использовать Commandr с Android Wear.
Commandr for Google Now
Ассистент Дуся
Ну и наконец, детище российских разработчиков — русскоязычный голосовой ассистент Дуся, который объединяет в себе все преимущества описанных приложений и утилит. Как и Tasker, Дуся позволяет создавать свои голосовые функции (они называются «скрипты»), причем в намного более понятной и простой форме (есть справка на русском, видеоуроки) и с более мощными функциями работы именно с речевыми командами. Вдобавок здесь есть и свой онлайн-каталог готовых скриптов, созданных другими пользователями. На момент написания статьи их было около ста.
Так же как и Commandr, Дуся умеет интегрироваться с Google Now, а также имеет множество видов других бесконтактных активаций — встряхиванием, взмахом, гарнитурой, поднесением к уху и в том числе и своей фразой активации на русском. А если хочется использовать интерфейс, то и он есть, очень простой, быстрый и функциональный. Среди функций есть 25 наиболее часто востребованных, есть даже управление умными домами и домашними кинотеатрами.
Возможности ассистента Дуся
Выводы
Сегодня функции голосового поиска в смартфонах очень развиты, и, как ты смог убедиться, разработчики предлагают нам не просто набор команд для поиска информации, а полноценную систему управления смартфоном, которую при определенных усилиях можно интегрировать с домашним компом и даже умным домом. Так что, если тебе удобнее управлять всем этим с помощью голоса, у тебя есть для этого все необходимое.
Источник