Синтез речи алиса для андроид

Содержание

3 лучших синтезатора речи для Android по мнению World-X
1. Vocalizer
2. Google
3. RHVoice
Вместо послесловия
Заменяем Google Assistant на нейросеть Порфирьевич и троллим Алису
Порфирьевич API
Aimybox SDK
Распознавание и синтез
Голос Левитана
Заменяем Google Assistant на Порфирьевича
Разукрашиваем
Запускаем
Что дальше?
Синтез речи от Яндекс. Новые возможности Алисы. Яндекс Алиса читает новости
Экранный диктор для Андроид или смартфон для незрячего
Выбор русскоязычного синтезатора речи
Acapela TTS Voices
SVOX Classic TTS
eSpeak
Первоначальная настройка
Использование экранного диктора
Управление Android-устройством с помощью TalkBack

3 лучших синтезатора речи для Android по мнению World-X

Синтезатор речи или TTS является программным решением, позволяющим воспроизводить текстовую информацию голосом. Благодаря чему , с тало возможным не визуальн ое взаимодействие с о смартфоном для незрячих пользователей , а также прослушивание книг в электронном формате.

На основе личного опыта, м ы решили состави ть собственный рейтинг лучших синтезаторов речи для Android. И г лавным критерием отбора стало «внятное произношение» русскоязычного текста. А этим может похвастать далеко не всякое приложение!

1. Vocalizer

Пожалуй, один из наиболее качественных синтезаторов речи, который отличает чёткое произношение и высокая детализация речи. В приложении более 50 поддерживаемых языков, в том числе «русский».

Есть возможность выбора из трёх русскоязычных голосов. «Мужской Юрий» — подойдёт для прослушивания художественной литературы. «Женские Милена или Катя» — придутся по вкусу пользователям « Google TalkBack” , хотя читают «девушки» ни чуть не хуже.

Найти приложение можно в “Play Market” по запросу “Голос Vocalizer (русский)”. После его установки требуется выбрать голос по умолчанию. Перед покупкой одного из голосов можно воспользоваться 7-дневным пробным периодом, позволяющим ознакомиться с нюансами звучания синтезатора речи.

2. Google

И звестный по голосовому поиску, синтезатор речи от Google имеет пару несравненных достоинств. Во-первых, приложение совершенно бесплатное. А во-вторых по умолчанию уже предустановленно для большинства современных смартфонов.

Среди русскоязычных голосов есть несколько мужских и женских. Правда, они имеют лишь незначительные отличия по тембру. Хотя синтезатор речи демонстрирует чёткое произношение, ему не хватает в ыразительности, чтобы слушать книги.

Найти приложение можно в « Play Market » по запросу “ Синтезатор речи Google”. После установки зазвучит сетевой голос по умолчанию. Для загрузки полного пакета русскоязычных голосов требуется подключение Wi-Fi.

3. RHVoice

А вот синтезатор речи под названием « RHVoice » является разработкой отечественного программиста Ольги Яковлевой. С недавнего времени приложение стало доступно и для смартфонов под управлением Android.

Среди русскоязычных голосов есть знакомые «Александр и Елена», а также появилось ещё пара женских «Анна и Ирина». « RHVoice » отличает чёткость произношения и малый размер. Правда, в ущерб качеству. Отмечается тихая громкость и слабая детализация.

Найти приложение можно по запросу « RHVoice » в поиске « Google Play ». Все голоса доступны бесплатно, а перед установкой можно прослушать демо-записи. В настройках можно указать уровень качества.

Вместо послесловия

Это были 3 лучших синтезатора речи по мнению сайта “World-X”. Несмотря на их уникальность, каждый из них имеет свои недостатки. Поэтому при выборе рекомендуем полагаться на слух. Благо,любой из голосов можно предварительно прослушать в демо-записи или испытать в течение пробного периода.

Источник

Заменяем Google Assistant на нейросеть Порфирьевич и троллим Алису

Вы уже видели, что вытворяет нейросеть Порфирьевич? Она дописывает текст к любой вашей фразе. И действительно забавные штуки получаются, потому что обучена она на книгах Достоевского, Толстого, Пушкина, Булгакова, Гоголя и Пелевина.

«Озвучить все это дело голосом Левитана — получился бы отличный заменитель гугловского ассистента к новогоднему застолью. » — подумал я. И решил не откладывать это мероприятие на посленовогогода (а то ведь сами понимаете).

Под катом — весь процесс создания опенсорсного голосового ассистента Порфирьевич на исключительно опенсорсном фреймворке Aimybox, и его запуск вместо штатного Google ассистента. Ну и заодно Алису потроллить можно.

Если хочется сразу попробовать все это в деле, то можно установить последний релиз отсюда

Порфирьевич API

На хабре недавно вышла статья, в которой рассказывается про то, как Михаил Гранкин научил нейросеть GPT-2 дописывать «осмысленные» тексты к любой фразе. Получилось забавно. Вдобавок, доступ к нейросети открыт через обычный HTTP API.

Идем на сайт, через который можно делать запросы к Порфирьевичу, открываем инспектор и смотрим, куда летят запросы и какого формата.

Лимитов на этом API нет, но разработчик все же рекомендует скачать модель Порфирьевича и развернуть на своем сервере.

Aimybox SDK

API Порфирьевича у нас есть! Теперь нужно было запилить собственно голосовое приложение для смартфонов, которое бы распознавало и синтезировало речь.

Отличным решением для этого является открытый фреймворк Aimbox, про который уже писали на Хабре тут и тут. Он позволяет быстро создать голосовое приложение или встроить голосовые функции в уже работающий проект. Заодно уже есть красивый GUI, который можно кастомизировать.

Можно склонировть к себе сэмпловое приложение и на его базе создать проект.

Кстати, недавно появилась первая версия iOS SDK, так что все то же самое можно повторить и для iOS.

Aimybox умеет работать с любым диалоговым движком, например Aimylogic, Rasa или Dialogflow, и в том числе позволяет реализовать подключение к любому другому. В нашем случае нужно напрямую слать запросы на API Порфирьевича и парсить ответы. Для этого необходимо всего ничего — написать соответствующие классы Request, Response и реализацию самого DialogAPI, которая собственно шлет запросы и парсит ответы.

Распознавание и синтез

На любом Андроид-девайсе из коробки работает бесплатное распознавание и синтез речи от Google, так что за это можно было не волноваться. Вот только голос, конечно, хотелось поменять на что-то более подходящее литературному слогу Порфирьевича…

Голос Левитана

Раньше у Яндекс Speechkit-a (облачного решения для распознавания и синтеза речи) был замечательный голос «Левитан», как нельзя лучше подходящий к нашему проекту. Сейчас все переехало в Яндекс Облако, все стало платным (без всяких пробных 10к запросов), поэтому пришлось искать альтернативы.

Есть такой прекрасный сервис для тестирования навыков для Алисы — station.aimylogic.com. На нем можно выбрать голос, которым синтезируются ответы и потестировать свой навык прямо в браузере. Смотрим в его API и находим endpoint, на который идут запросы на синтез речи

Тут видно, что если подставить в этом URL в параметр speaker значение levitan, то можно получить желаемый результат. Это нам и нужно!

Собственно, в классе PorfirResponse как раз и происходит подстановка этого URL-а с нужными параметрами для того, чтобы заставить синтезатор речи просто проиграть сгенерированный mp3 вместо того, чтобы произносить текст ответа от Порфирьевича.

Заменяем Google Assistant на Порфирьевича

Запускать нашего голосового Порфирьевича можно просто открыв приложение и тапнув по кнопке микрофона. Но куда приятнее запускать его вместо штатного гугловского ассистента, потому что многие смартфоны имеют встроенную поддержку ассистента (например, на моем Oneplus 7 можно зажать кнопку включения, чтобы активировать ассистента с любого экрана).

Для этого нужно лишь прописать в AndroidManifest еще один интент-фильтр android.intent.action.ASSIST, проставить флаг android:launchMode=«singleTop» и в MainActivity реализовать метод onNewIntent, в котором запускать распознавание речи, когда приложение вызывается в режиме ассистента.

В настройках смартфона нужно выбрать Порфирьевича в качестве ассистента по умолчанию. Настройки -> Приложения -> Приложения по умолчанию

Разукрашиваем

В файлах styles.xml и strings.xml можно изменить цвета стандартного GUI Aimybox и заодно указать стартовую фразу, которая будет отображаться на экране при запуске нашего ассистента.

Запускаем

Собственно все! После запуска можно наблюдать вот такие перлы

Если положить рядом другой смартфон с Яндекс Алисой и запустить на ней болталку, то можно получить местами «вменяемый» диалог двух не вполне здоровых людей

Что дальше?

Вот такие идеи приходят пока в голову

На главном экране приложения отображать историю ответов Порфирьевича с возможностью шеринга.
Сделать экран с настройками — режим диалога, длина ответа, выбор голоса и тп

Если у вас есть идеи получше или нашли багу — то велком в Github, где и лежит теперь весь код проекта. Также можно поконтрибьютить (код пописать).

Источник

Синтез речи от Яндекс. Новые возможности Алисы. Яндекс Алиса читает новости

Не секрет, что у Яндекса уже несколько лет активно развивается сервис синтеза речи, который имеет хорошие голосовые движки на разных языках. Яндекс на данный момент предоставляет лучший в мире синтез русской речи. Возможно есть и аналоги, которые на том же уровне или выше, но мне такие не попадались!

На странице синтезатора предоставлено на выбор 8 голосов для русской речи. Но вот коммерческого голоса » яндекс Алисы «, которая используется в умных колонках Яндекс или в голосовом помощнике там нет.

Все голоса звучат неплохо, но Алиса все-таки читает лучше и хотелось бы использовать именно движок Алисы.

Но стоит отметить, что появился хороший движок под названием Филипп. Он тоже достойно звучит. А вот всеми любимый Самохвалов из общего доступа пропал. И теперь он только доступен в платной версии на сервисе — upsaleslab.

От недавнего времени все таки возможность озвучки текста через Алису появилась. Как она звучит да и в целом инструкцию по работе можно посмотреть в моем ролике на эту тему.

Для тех кто предпочитает текстовый формат, то вкратце расскажу и тут.

Как вы наверное знаете, если запустить Алису на компьютере или телефоне, то голосовое сопровождение происходит голосом Алисы, а вот заставить Алису читать статьи невозможно. Если попросить Алису прочитать последние новости, то запускается совершенно другой движок.

Так было, но в конце 2019 года разработчики прокачали свое детище и добавили большое количество навыков для Алисы по ряду разделов.

Отныне в разделе новостей появилось умение читать статьи. Правда голосом Алисы озвучка работает на ресурсе РБК и REGNUM.

Обновление очень полезное, но довольно скудное, ведь ограничивается двумя веб-ресурсами.

Однако прошло совсем немного времени и Алисе дали возможность озвучивать любые веб-страницы. Такой сдвиг случился, как я полагаю из-за прямого конкурента — голосового помощника Маруся от mail.ru , который намного раньше начал озвучивать новости с раздела MailNews .
А так же в компании Mail заявили, что появится возможность с помощью Маруси озвучивать любые текста.

Подвижек у Mail Group в эту сторону я не заметил, однако это стало толчком для Яндекса, который наконец-то дал возможность озвучивать любые статьи голосом Алисы.

Чтобы воспользоваться Алисой необходимо установить браузер Яндекс Бета в котором уже предустановленна расширенная версия голосового движка Алиса.

Чтобы заставить Алису читать, необходимо открыть нужную страницу и сказать: «Слушай, Алиса, прочитай эту страницу» .

Или же можно просто нажать на иконку наушников, которая расположилась возле поисковой строки.

После запуска команды чтения, Алиса озвучит содержимое страницы.

Если нужно озвучить определенный отрывок текста, то нужно его выделить, нажать ПКМ и выбрать пункт ОЗВУЧИТЬ.

Если необходимо озвучить свой текст, то нужно открыть блокнот написать текст, а затем сохранить документ в формате html.

Затем открыть веб-страницу в браузере Яндекс, выделить текст и запустить команду ОЗВУЧИТЬ.

Благодаря такому обновлению, есть возможность озвучивать любые статьи и не тратить время на чтение, можно заниматься делами и на фоне слушать новости. А вообще сфер применения синтеза речи очень много. Об этом я расскажу уже других своих заметках.

Источник

Экранный диктор для Андроид или смартфон для незрячего

Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, TTS (text to speech) имеет большое значение для пользователей с особыми потребностями.

Выбор русскоязычного синтезатора речи

Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.

Acapela TTS Voices

Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.

Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.

SVOX Classic TTS

На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.

На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.

eSpeak

Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.

Первоначальная настройка

Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:

Далее выбираем движок по умолчанию и выставляем желаемую скорость произношения. Запускаем приложение, проверяем чтение образца текста в боксе. С помощью ползунков выставляем дополнительные опции.

Использование экранного диктора

Для Android версии 3.2 и выше разработчиками Google выпущена утилита TalkBack , по функционалу напоминающая «Экранный диктор» для Windows. Начиная с Android Jelly Bean, приложение переустанавливается в систему и активируется из «Настройки» – «Специальные возможности». Для запуска следует передвинуть ползунок в положение «On».

Функции программы TalkBack:

Перечисление элементов на мониторе с одновременным их описанием;
Голосовые уведомления о происходящих событиях;
Уведомление о звонках и SMS-сообщениях;
Аудио и вибрационный отклик от устройства.

В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!

Управление Android-устройством с помощью TalkBack

Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».

После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться:

Управлению девайсом с помощью ощупывания и последующего выбора элемента экрана.
Основным приемам скроллинга списков.

После обучения управление Android-устройством на ощупь обычно не вызывает затруднений:

Для выбора и активации элемента под пальцем необходимо оторвать палец от экрана и коснуться еще раз;
Для выбора элемента без предварительного ощупывания необходимо быстро дотронуться его дважды;
Скроллинг делается двумя пальцами без отрыва их от экрана;
При скроллинге раздается звук разной тональности, сигнализирующий о текущем положении в списке.

Подытоживая можно отметить: при правильно выбранной начальной настройке системы работа с устройствами под ОС Android для слабовидящих или слепых пользователей не сильно отличается от работы в стандартном режиме.

Источник