Синтез речи для android

Экранный диктор для Андроид или смартфон для незрячего

Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, TTS (text to speech) имеет большое значение для пользователей с особыми потребностями.

Выбор русскоязычного синтезатора речи

Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.

Acapela TTS Voices

Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.

Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.

SVOX Classic TTS

На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.

На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.

eSpeak

Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.

Первоначальная настройка

Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:

Далее выбираем движок по умолчанию и выставляем желаемую скорость произношения. Запускаем приложение, проверяем чтение образца текста в боксе. С помощью ползунков выставляем дополнительные опции.

Использование экранного диктора

Для Android версии 3.2 и выше разработчиками Google выпущена утилита TalkBack , по функционалу напоминающая «Экранный диктор» для Windows. Начиная с Android Jelly Bean, приложение переустанавливается в систему и активируется из «Настройки» – «Специальные возможности». Для запуска следует передвинуть ползунок в положение «On».

Функции программы TalkBack:

  • Перечисление элементов на мониторе с одновременным их описанием;
  • Голосовые уведомления о происходящих событиях;
  • Уведомление о звонках и SMS-сообщениях;
  • Аудио и вибрационный отклик от устройства.

В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!

Управление Android-устройством с помощью TalkBack

Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».

После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться:

  1. Управлению девайсом с помощью ощупывания и последующего выбора элемента экрана.
  2. Основным приемам скроллинга списков.

После обучения управление Android-устройством на ощупь обычно не вызывает затруднений:

  • Для выбора и активации элемента под пальцем необходимо оторвать палец от экрана и коснуться еще раз;
  • Для выбора элемента без предварительного ощупывания необходимо быстро дотронуться его дважды;
  • Скроллинг делается двумя пальцами без отрыва их от экрана;
  • При скроллинге раздается звук разной тональности, сигнализирующий о текущем положении в списке.

Подытоживая можно отметить: при правильно выбранной начальной настройке системы работа с устройствами под ОС Android для слабовидящих или слепых пользователей не сильно отличается от работы в стандартном режиме.

Читайте также:  Run log android что это

Источник

3 лучших синтезатора речи для Android по мнению World-X

Синтезатор речи или TTS является программным решением, позволяющим воспроизводить текстовую информацию голосом. Благодаря чему , с тало возможным не визуальн ое взаимодействие с о смартфоном для незрячих пользователей , а также прослушивание книг в электронном формате.

На основе личного опыта, м ы решили состави ть собственный рейтинг лучших синтезаторов речи для Android. И г лавным критерием отбора стало «внятное произношение» русскоязычного текста. А этим может похвастать далеко не всякое приложение!

1. Vocalizer

Пожалуй, один из наиболее качественных синтезаторов речи, который отличает чёткое произношение и высокая детализация речи. В приложении более 50 поддерживаемых языков, в том числе «русский».

Есть возможность выбора из трёх русскоязычных голосов. «Мужской Юрий» — подойдёт для прослушивания художественной литературы. «Женские Милена или Катя» — придутся по вкусу пользователям « Google TalkBack” , хотя читают «девушки» ни чуть не хуже.

Найти приложение можно в “Play Market” по запросу “Голос Vocalizer (русский)”. После его установки требуется выбрать голос по умолчанию. Перед покупкой одного из голосов можно воспользоваться 7-дневным пробным периодом, позволяющим ознакомиться с нюансами звучания синтезатора речи.

2. Google

И звестный по голосовому поиску, синтезатор речи от Google имеет пару несравненных достоинств. Во-первых, приложение совершенно бесплатное. А во-вторых по умолчанию уже предустановленно для большинства современных смартфонов.

Среди русскоязычных голосов есть несколько мужских и женских. Правда, они имеют лишь незначительные отличия по тембру. Хотя синтезатор речи демонстрирует чёткое произношение, ему не хватает в ыразительности, чтобы слушать книги.

Найти приложение можно в « Play Market » по запросу “ Синтезатор речи Google”. После установки зазвучит сетевой голос по умолчанию. Для загрузки полного пакета русскоязычных голосов требуется подключение Wi-Fi.

3. RHVoice

А вот синтезатор речи под названием « RHVoice » является разработкой отечественного программиста Ольги Яковлевой. С недавнего времени приложение стало доступно и для смартфонов под управлением Android.

Среди русскоязычных голосов есть знакомые «Александр и Елена», а также появилось ещё пара женских «Анна и Ирина». « RHVoice » отличает чёткость произношения и малый размер. Правда, в ущерб качеству. Отмечается тихая громкость и слабая детализация.

Найти приложение можно по запросу « RHVoice » в поиске « Google Play ». Все голоса доступны бесплатно, а перед установкой можно прослушать демо-записи. В настройках можно указать уровень качества.

Вместо послесловия

Это были 3 лучших синтезатора речи по мнению сайта “World-X”. Несмотря на их уникальность, каждый из них имеет свои недостатки. Поэтому при выборе рекомендуем полагаться на слух. Благо,любой из голосов можно предварительно прослушать в демо-записи или испытать в течение пробного периода.

Источник

Обзор синтезаторов речи для Андроид

Приложения-синтезаторы речи – удобные и надежные помощники для Андроид пользователей. С их помощью можно «озвучить» приложения на самые популярные языки мира, настроить тембр голоса и другие важные параметры, а также учить языки, прослушивать звучание разных слов. Большинство TTS приложений для Android доступны бесплатно, однако за установку отдельных голосов и функций нужно доплатить. Мы подобрали для вас наиболее удобные синтезаторы речи, скачать которые можно на нашем сайте.

Синтез речи от Google

Жанр Инструменты
Рейтинг 4,1
Установки 1 000 000 000–5 000 000 000
Разработчик Google LLC
Русский язык есть
Оценок 1 107 289
Версия 3.14.9
Размер apk 14.7 MB


Наиболее популярная и доступная TTS-утилита, совместимая со многими Андроид-девайсами. С помощью программы вы можете озвучивать текст на экране, а также выполнять ряд важных функций:

  • Озвучивать книги приложения Google Play Книги.
  • Переводить и озвучивать слова из Google Переводчика.
  • Включать голосовые подсказки при помощи сервиса TalkBack.

Активировать приложение Синтез речи от Google можно прямо на своем девайсе. Для этого откройте пункт меню «Настройки», где зайдите в подраздел «Язык и методы ввода», а там – «Синтез речи». Выберите систему синтеза речи от Google, после чего приложение активируется автоматически.

Читайте также:  Не попадаю по клавишам андроид что делать

Программа поддерживает более 40 языков, среди которых английский, русский, французский, немецкий, японский, испанский, датский, хинди и много других. В последней версии утилиты добавлено 3 новые языка – румынский, эстонский и словацкий, а также улучшено качество голоса в целом.

Acapela TTS Voices

Жанр Связь
Рейтинг 3,5
Установки 100 000–500 000
Разработчик Acapela Group S.A.
Русский язык нет
Оценок 3 883
Версия 6.0.0.2
Размер apk 9.3 MB


Еще один качественный синтезатор речи на Андроид, который доступен на нашем портале. Программа является условно бесплатной, при этом перед тем, как купить приложение, вы можете прослушать демо-версии мужских и женских голосов в режиме онлайн. Утилита позволяет покупать и устанавливать программы с голосом высокого качества, такие как Google TalkBack, переводчики приложений для чтения книг и озвучивания новостей.

Для выбора и установки голоса в приложении войдите в меню, после чего нажмите на голос и удерживайте несколько секунд. Возле выбранного голоса появится значок желтой звезды, и он будет установлен по умолчанию. Теперь вы можете использовать эту программу с вашей любимой читалкой книг.

Приложение Acapela TTS Voices можно активировать следующими действиями.

  • Загрузите сервис на нашем сайте или портале Google Play.
  • После установки приложения кликните на иконку программы. Убедитесь в наличии Интернет-соединения.
  • Ознакомьтесь со списком голосов, которые загружены с сервера.
  • Нажмите на меню напротив каждого голоса, где можно прослушать собственный текст или сразу перейти к покупке.
  • После покупки и оплаты голос будет загружен, и вы сможете пользоваться им в любое время.

Приложение Acapela TTS Voices совместимо с ОС Android 2.2 и более поздними версиями.

Источник

Обзор мобильных Text-To-Speech движков

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  • коммерческие;
  • свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  • встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS


Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Acapela TTS


Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть

Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.

Читайте также:  Ускорение процессора андроид xiaomi
Loquendo Embedded TTS


Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть

Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.

Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.

Sakrament TTS


Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть

Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.

Свободные движки

Flite

Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.

eSpeak


Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.

eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).

Symbian


Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.

Android


Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть

Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.

Заключение

Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.

Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.

Источник

Оцените статью